一周来忙个不停,基本都是围绕一个问题:
如果请求执行变慢,web server的进程数迅速飙高,然后就拒绝服务,并且报警,又由于个IDC之间有一些暧昧的关系,于是,一个地方的问题就会迅速导致所有的IDC告急,让人毛骨悚然。
请求执行慢主要有几个方面的问题:
1. 后端存储响应慢
2. 网络出现问题
3. 后端存储死掉
请求执行慢的问题曾经也多次遇到,但是都没有导致过拒绝服务,更没有出现过多个IDC连锁反应的,现在出现这些问题,应该和新环境的web server对进程数的限制太低有很大关系。
当然,系统的设计也存在一些问题。
我想,应该清醒和理智地看待这些天的问题:
1. 新环境存在的问题
2. 系统本身存在的问题
这些天,我遇到了这么多问题,我也深刻地意识到了访问外部资源需要多么的慎重。
另外,这些天的事情使我对监控的理解也有所改变,不是说错了什么,只是原来的理解不够全面和深刻,我需要进步。
我不可能什么都去学习,更不可能什么都能学好,要注意把握一个度的问题,以一个正确的心态来做好自己的事情;既能把工作做好,自己也能有所提高。