Zuul转发请求时出现单个服务请求卡死并大量CLOSE_WAIT的原因
背景
最近工作中遇到了一个问题,比较奇怪,生产环境上各个服务的请求均正常,但是有一个服务A,只要启动后,经过一段时间,再去通过浏览器访问这个服务的页面,就会一直转圈圈,此时这个服务的actuator接口是正常的,需要重启zuul就能恢复正常,但F5一会这个A服务的页面,就又会卡死,神奇的是,同样的服务A和Zuul网关版本,在不同的环境上,有时会出现,有时不出现,甚至后来问题的现象从单个服务A的不可用,变成了整个系统的无响应,让人非常困扰。
第一次定位
针对服务A启动后一段时间卡死的现象进行定位分析,网关重启后即恢复正常,在网关日志、服务A日志均无看到明显的和请求阻塞相关的异常,包括超时异常等。因此在卡顿出现的情况下,导出了一份jstack,发现了线程的阻塞。
阻塞的线程个数刚好等于hystrix对每个服务开启的线程池个数50,也就是所有通过zuul转发向服务A的请求,均被锁住,因此请求无法正常返回,一直等待。
此时在机器上进行netstat观测,发现了50个服务A端口上的CLOSE_WAIT,而
标签:服务,请求,线程,CLOSE,卡死,Zuul 来源: https://blog.csdn.net/weixin_42305433/article/details/113833444
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。