网络导致性能问题分析案例原创
金蝶云社区-墨迹
墨迹
3人赞赏了该文章 93次浏览 未经作者许可,禁止转载编辑于2024年04月17日 10:34:39


    压力测试过程中,突然发现整体响应时间下降明显,特别是大量网络交互的功能表现更加明显。如批量选择基础资料,选择1行可能是1毫秒,但选择100行可能需要几十秒。

    查看应用服务器得CPU资源使用情况:

    可以看到,有4CPU内核使用时间非常高,将近100%

此时应用程序CPU使用率为23%左右,系统中断7%System2%

为了确认是否w3wp.exe消耗了CPU内核时间,设置处理器相关性,将节点002CPU取消掉

5分钟后,再次查看CPU使用率,发现没有变化,说明并非w3wp.exe消耗内核时间,通过抓取dump发现,没有线程阻塞,没有非常大的循环或者复杂处理的代码逻辑,说明导致问题的原因不是w3wp.exe

由于测试过程中表现为多次网络请求的功能变化明显,那么是否因为网络不稳定引发的问题呢?尝试使用ping 服务器ip -l 1024 -n 100,发现延迟非常高

使用tracert检查路由情况,延迟也非常高

检查同一网段另外一台服务器路由情况,小于1毫秒

同时使用wireshark抓包进行分析,发现同一个端口存在大量重复应答

    至此,可以明确,导致问题的原因在于网络问题其不光导致了网络的延迟,并且导致CPU的内核资源很高,从而导致整体的性能变慢。

    解决方式:1:需要网络工程师排查处理,看是否交换机,网线,网卡等引发的问题;

                     2:检查是否有防火墙,如果有尝试关闭防火墙,禁用某些实时防护,或者将运行的程序增加到例外中

图标赞 3
3人点赞
还没有人点赞,快来当第一个点赞的人吧!
图标打赏
0人打赏
还没有人打赏,快来当第一个打赏的人吧!

您的鼓励与嘉奖将成为创作者们前进的动力,如果觉得本文还不错,可以给予作者创作打赏哦!

请选择打赏金币数 *

10金币20金币30金币40金币50金币60金币
可用金币: 0