502 bad gateway 顾名思义 网关错误 后端服务器tomcat没有起来,应用服务的问题(前提是接入层7层正常的情况下)。

应用服务问题一种是应用本身问题;另一种是因为依赖服务问题比如依赖服务RT高,依赖的服务有大的读取(mysql慢查,http等),以至于调用方超过超时read时间;服务集群压力大时,也会出现502超时(502理解为不可响应或响应不过来,其实还是不可响应)。

504 gateway time-out 顾名思义 网关超时 一般计算机中的超时就是配置错了,此处一般指nginx做反向代理服务器时,所连接的服务器tomcat无响应导致的。

网络角度,502已经与后端建立了连接,但超时;504与后端连接未建立,超时。

502检查思路:

1、必现502,应用“挂了”

(1)后端机器上检查:

$ ps -ef |grep java #检查进程是否在

$ sudo netstat -lntp |grep PORT #检查端口有没有起来

$ curl -I 127.0.0.1:PORT/health #应用健康检查测试下,Your health check path

(2)上面都正常,看下接入层access.log有没有进来。 

$ tail -300f access.log |grep xxxx | #grep下你的关键字

$ curl -I 10.10.10.10:80/java_hc #上面都正常情况下,去接入层检查下

2、偶现502

(1)CPU使用率高,QPS增加

考虑有大流量,后端压力导致短暂不可用,考虑临时扩容。

(2)检查应用本身nginx read超时时间配置

proxy_read_timeout 2s; #vim /opt/nginx/nginx.conf

如果某些正常请求耗时在2s左右,那么会有少量大于2s的请求是502的。可以试着把上面耗时时间调大,看问题是否缓解。优化本身链路请求耗时是根本上的解决办法。

(3)检查接入层nginx read的配置

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐