目前系统中,主要是对同步的订单信息和短息信息的异常数据进行监控,以下将分两个方面对数据的监控规则进行描述:
一、 订单信息异常数据监控规则
主要分两个方面对数据进行监控,一是监控NETS数据库中同步出现异常的数据,二是监控数据已同步到LDS数据库临时表,但在进行数据处理时发生错误的异常数据,监控规则如下:
1、 监控NETS数据库表life_order_info表中字段lds_eai_flag状态,监控状态为1和3的数据,相关信息见下表:
监控数据库 | Nets生产数据库 |
监控表 | Life_order_info |
监控表字段 | lds_eai_flag |
监控表字段值 | 1 |
监控时间 | 每天早上8:00 |
监控SQL语句 | Select t.order_no, t.polno, t.eai_flag from Life_order_info t where t.lds_eai_flag = '1' and t.created_date >= sysdate - 60 and t.created_date <= sysdate |
产生原因 | 主要是因为EAI程序发布了数据,但是接收端没有收到数据或收到数据但没有返回同步状态,一般EAI服务出现故障才会产生这种情况 |
处理办法 | 将这些数据更新状态为0,可参照如下sql语句进行数据修改: update life_order_info t set t.lds_eai_flag = '0' where t.order_no = ? |
表1.1
监控数据库 | Nets生产数据库 |
监控表 | Life_order_info |
监控表字段 | lds_eai_flag |
监控表字段值 | 3 |
监控时间 | 每天早上8:00 |
监控SQL语句 | Select t.order_no, t.polno, t.eai_flag from Life_order_info t where t.lds_eai_flag = '3' and t.created_date >= sysdate - 60 and t.created_date <= sysdate |
产生原因 | 一般是因为程序问题或数据问题导致 |
处理办法 | NETS和LDS开发人员同时进行分析和处理 |
表1.2
2、 监控LDS数据库表lds_policy_info_temp表中字段syn_status状态,监控状态为2的数据,相关信息见下表:
监控数据库 | lds生产数据库 |
监控表 | lds_policy_info_temp |
监控表字段 | syn_status |
监控表字段值 | 2 |
监控时间 | 每天早上8:30 |
监控SQL语句 | select t.policy_no, t.syn_status from lds_policy_info_temp t where t.syn_status = '2' |
产生原因 | 一般是因为数据问题导致,如主外键关联,字段类型不匹配等 |
处理办法 | 可查看出错日志表lds_syn_policyinfo_error_log对出错的保单信息分析,如运营人员不能处理,可交于LDS开发人员进行分析和处理 |
表1.3
3、 监控LDS数据库表lds_user_to_tl_map_temp表中字段syn_status状态,监控状态为2的数据,相关信息见下表:
监控数据库 | lds生产数据库 |
监控表 | lds_user_to_tl_map_temp |
监控表字段 | syn_status |
监控表字段值 | 2 |
监控时间 | 每天早上8:30 |
监控SQL语句 | select t.user_id, t.team_id from lds_user_to_tl_map_temp t where t.syn_status = '2' |
产生原因 | 数据问题或数据库环境问题导致 |
处理办法 | 可查看出错日志表lds_syn_policyinfo_error_log对出错的信息分析,如运营人员不能处理,可交于LDS开发人员进行分析和处理 |
表1.4
注:目前EAI平台的scheduler在cluster环境下存在不执行的隐患,因此对于上述两个同步,如客户反映昨天的数据没有被同步到LDS数据库,则由运营人员联系EAI运营人员进行问题检查并讨论处理方案。
二、 短信信息异常数据监控规则
1、每天定时对同步和发送异常的短信信息记录进行监控,监控规则如下:
监控数据库 | lds生产数据库 |
监控表 | lds_sms_info |
监控表字段 | status |
监控表字段值 | 03 |
监控时间 | 每天凌晨进行监控,尽量选择在业务空闲期执行。 |
监控SQL语句 | select * from lds_sms_info t where t.status = '03' |
产生原因 | 短信数据问题或短信平台故障导致 |
处理办法 | LDS和PSCP开发人员进行分析和处理 |
表2.1
2、根据EAI组同事时提醒,目前EAI平台的scheduler在cluster环境下存在不执行的隐患,因此需对实时性要求较高的信息进行监控,以防止定时同步任务没有执行,监控规则如下:
监控数据库 | lds生产数据库 |
监控表 | lds_sms_info |
监控表字段 | created_date |
监控表字段值 | 根据此字段判断数据是否被EAI平台取走 |
监控时间 | 每天凌晨进行监控,尽量选择在业务空闲期执行,这里监控两天之内没有被EAI平台取走的数据。 |
监控SQL语句 | select * from ldsdata.lds_sms_info t where 2 < (sysdate - t.created_date) and t.eai_fetch_date is null; |
产生原因 | EAI平台故障导致 |
处理办法 | 运营人员联系EAI运营人员进行问题检查并讨论处理方案 |
表2.2