监测服务器死机后自动重启或启动冗余备用服务器

2025-05-22 11:53:39

发表于:百度经验 作者:唐华

前不久做了一个工程,是一个铁路系统方面的用户,高铁、铁路、交通干线附近都有周密的监控摄像头,这些摄像头24小时不停收集现场视频,汇集到附近无人基站里的大型监控服务器里,然后通过4G通道发送到中央控制中心,这个过程对保证铁路交通安全至关重要,无人基站里的监控服务器的作用非常重要,不能出现长时间死机等故障,造成监控视频资料的大量缺失,就是重大事故了。

所以,一般在基站里都会安排至少两台监控服务器,一台日常工作,另一台作为备用机,随时待命,一旦A服务器发生死机了,那么立刻就要启动B服务器来接替工作。

但是有难题一直无法解决,就是,当A服务器发生死机的时候,谁去启动B服务器?是无人基站啊,铁路那么长,不可能所有的基站附近都配上值班员啊。所以,就有可能发生视频传输长时间中断的重大事故。

为了解决这个难题,全球断网监测报警器的领军企业——北京千际时代科技有限公司的工程师们,研发了一台专用设备,就是“千际牌铁路系统双服务器冗余启动智能监测报警器”,我参与了这个设备在监控基站的部署,觉得确实非常先进,解决了这么久的一个大难题。

监测服务器死机后自动重启或启动冗余备用服务器

这个千际牌铁路系统双服务器冗余启动智能监测报警器(以下简称该产品)主要功能是:

1、7×24小时不间断监测A服务器是否发生死机、关机故障;

2、当发现A服务器发生死机、关机故障时,自动开启B服务器接替A服务器工作,当然也可以直接重启A服务器自己;

3、当发现A服务器发生死机、关机故障时,发送短信给值班员,通知报警;

4、报警器会自动保存每次报警记录,包括精确时间记录。

我了解到这台设备的工作原理是:

1、该产品主要由“实时监测主机”、“单片机控制模块”、“GSM发射台”,三部分构成;

2、“实时监测主机”按照用户事先设定的间隔时间,定时对A服务器发出Ping探测指令,每轮探测连续ping三次做验证,只要其中一次Ping通过,则不报警。如果三次Ping均无响应,则判定A服务器已死机、关机、无响应;

3、当确定A服务器无响应无法正常工作后,“实时监测主机”给“单片机控制模块”下达指令,操作启动B服务器接替A服务器工作;

4、当确定A服务器无响应无法正常工作后,“实时监测主机”给“单片机控制模块”下达指令,控制“GSM发射台”给值班员发送短信,拨打电话报警,可同时设定6个值班员接听电话号码和3个短信接收号码;

5、值班员接到报警电话和报警短信后,可以远程通过电话按键或者回复短信撤防,停止GSM发射台继续报警,如无人理睬,则会继续报警直到有人操作撤防。

该产品的组件规格参数:

1、“实时监测主机”1台,外观为标准19英寸1U机架式设计,尺寸约为长×宽×高:630×430×44.45MM,前面板黑色,机体为银灰色;

2、GSM发射台DC12V小电源,1个(为GSM发射台供电);

3、GSM延长天线,1个(用于连接GSM发射台),底部带磁性;

4、GSM发射台白色小遥控器,1个;

5、交叉直连网线1根;

6、“实时监测主机”电源线1条。

这台设备的硬件部署过程简单的让人惊讶,只有两步:

1、用交叉直连网线连接“实时监测主机”和A服务器网口;

2、接通“实时监测主机”和“GSM发射台”电源。

然后再通过短信设置一下接收短信和电话报警的电话号码,一般可以设置多达9个电话号码,会一直通知到有人响应为止,非常负责。

我实际测试了一下,感觉确实非常方便实用,分享给大家,希望帮到需要的朋友。

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢