关于线上误操作

最近工作上有点不顺,连续搞了两个误操作,虽没造成严重的故障,但造成了不好的影响。干了二年多运维,这还是头一次double kill,可能和最近状态确实不太好有关,不过主要原因还是在自己,在疲惫、烦闷、注意力不集中的时候,往往很多隐藏在自身的坏东西就暴露出来了,坏的习惯,坏的性格,坏的思想,这些恶根不除,在你空虚的时候就容易捣乱,将问题暴发出来。跟生病一样,为什么同一环境别人就不会感冒,就不会生病,说白了还是自身出了问题,病邪才会攻进来,苍蝇不叮无缝的蛋。最近确实是要好好反省,修整一下,好好学习、积累,才会有所提升。

这次故障的一些总结:

1).对于不熟悉的服务,修改线上配置时需找相关熟悉同事确认后再执行,应有沟通和谨慎的意识。 

2).发布代码及修改配置时,需比对上次发布代码版本,并请相关同事协助确认后操作,发布后需持续关注流量状态与日志输出,并与相关开发人员沟通确认服务情况,若开发同学再次确认没有回应时,应电话沟通确认。

3).做好相关服务的监控报警,第一时间发现问题。

4).在重要参数的配置处做好注释,防止误操作,不要给后人留坑。


anzhihe安志合个人博客,版权所有丨 如未注明,均为原创 丨转载请注明转自:https://chegva.com/2844.html | ☆★★每天进步一点点,加油!★★☆

您可能还感兴趣的文章!

发表评论

电子邮件地址不会被公开。 必填项已用*标注