Error

Traceback (most recent call last):
  File "/usr/lib/python3.5/threading.py", line 914, in _bootstrap_inner
    self.run()
  File "/usr/lib/python3.5/threading.py", line 862, in run
    self._target(*self._args, **self._kwargs)
  File "/home/zt/CI/MasterController/MainControllerServer.py", line 115, in main_control
    wait_ack(crawler_client_sock)
  File "/home/zt/CI/MasterController/TcpUtil.py", line 23, in wait_ack
    recv_data = recv_end(sock)
  File "/home/zt/CI/MasterController/TcpUtil.py", line 38, in recv_end
    data = sock.recv(4096).decode('utf-8')
ConnectionResetError: [Errno 104] Connection reset by peer

解决思路

网络编程通信出现了连接被对方reset了的情况,为了debug分别查看了server和client端对应的端口状态。一端显示ESTABLISHED,而另一端由于进程挂掉已经没了连接,这就很奇怪了。怎么可能一端建立连接,一端连接不见了。

仔细分析之后发现,我的服务器处于实验室的内部网络,存在防火墙,外部客户端是与防火墙的代理建立的连接,所以出现了一端建立连接另一端断开了。

所以并不是通信的另一端进行了reset,而是防火墙进行了reset,找到原因之后通过百度,查到防火墙会对长时间不进行通信的tcp连接进行关闭,所以需要对长连接进行一些处理。

解决方法

采取心跳机制,设置socket每隔一段时间就探测对方是否存在,从而保持连接存在。但是默认的socket心跳机制是2个小时无通信再探测,可能比防火墙设置的超时时间要长,所以需要修改心跳机制的参数。

我的运行环境是ubuntu + python 3.5
修改套接字选项,设置好心跳机制后就解决了这个问题。

    client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    client.setsockopt(socket.SOL_SOCKET, socket.SO_KEEPALIVE, 1)
    client.setsockopt(socket.SOL_TCP, socket.TCP_KEEPIDLE, 600)  # 覆盖tcp_keepalive_time 表示多久时间未通信后进行探测
    client.setsockopt(socket.SOL_TCP, socket.TCP_KEEPCNT, 10)  # 覆盖tcp_keepalive_probes 探测次数
    client.setsockopt(socket.SOL_TCP, socket.TCP_KEEPINTVL, 30)  # 覆盖tcp_keepalive_intvl 每次探测的超时时间
    client.connect((host, port))

如果长时间未通信则启用心跳机制,如果进行多次探测之后,每一次都超时了则表示对方已关闭连接(也有可能是网络问题),此时关闭连接。

TCP keepalive 详解 - 简书
linux下TCP keepalive 属性设置_sunxiaopengsun的专栏-CSDN博客

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐