以下为《3月1日一标库查询故障排查情况汇报》的无排版文字预览,完整内容请下载
3月1日一标搜索服务宕机问题排查报告
故障经过:3月1日下午8:00,领导使用轻应用发现地址搜索服务无法使用。8:04分,接通知后,公司人员排查发现可能是一标搜索服务停止导致。8:25分人员到达现场,8:40服务重启成功,系统恢复。
原因排查:在接到故障通知,公司人员初步判断一标地址搜索服务故障,到达现场后重启一标库服务器15.75.0.249的一标搜索服务,问题恢复。接着,检查另一台一标库服务器:15.75.0.250,系统进程中无一标库服务。经询问离职人员刘波,原计划将250、251服务器挂接SLB,所以初步判定未挂接SLB导致。3月 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 、251两台服务器,均已出现服务停止现象,但因智能运维大屏的服务监控,只监测SLB(15.75.1.0)状态,而最后一台服务器249,于3月1日下午7:30分停服。
解决方案:因一标地址库使用量较大,之前项目组对一标地址搜索日志为定期清理,上次清理为1月27日,值班人员不定期检查清理。经过此次故障,项目组通过三个途径确保服务稳定:
1、编写定时任务,任务为每三天清理一次一标库系统日志。
2、安排人员每周检查服务状况。
3、在智能运维大屏现有对一标库服务的监控基础上,增加对一标库XX服务器的状态监控,并增加推送故障信息到民警警务微信功能。
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《3月1日一标库查询故障排查情况汇报》的无排版文字预览,完整内容请下载
3月1日一标库查询故障排查情况汇报由用户“svsg1980”分享发布,转载请注明出处