什么是 TCP Nagle 算法？为什么会造成 40ms 延迟？

Question

Levenx · Accepted Answer

Nagle 算法的核心规则只有一条：连接上有未被确认的小包时，不再发新的小包，等 ACK 回来再把缓冲区里的数据攒一起发。目的是减少小包数量——Telnet 按一个键就产生一个 41 字节的包，其中 40 字节是 TCP+IP 头部，有效载荷只有 1 字节，带宽利用率不到 3%。1984 年 John Nagle 在 RFC 896 里提出这个方案，解决的就是交互式应用疯狂发小包导致的广域网拥塞。算法默认开启（RFC 1122 推荐），通过 TCP_NODELAY 选项关闭。追问Nagle 和延迟 ACK 怎么会互相卡死？Nagle 在发送端等 ACK，延迟 ACK 在接收端等更多数据再确认，两者同时启用就形成僵持：发送方写了一个小包，等 ACK；接收方收到后不马上回 ACK，等 40ms（Linux 默认）或 200ms（Windows 默认）看还有没有后续数据。典型场景是 write-write-read 模式：第一次写直接发出，第二次写被 Nagle 挡住，接收端延迟 ACK 等 40ms，发送端就卡在这 40ms 上。腾讯云有实际案例，营销平台 10% 的请求耗时稳定卡在 38

什么是 TCP Nagle 算法？为什么会造成 40ms 延迟？

追问

Nagle 和延迟 ACK 怎么会互相卡死？

什么时候必须关掉 Nagle？

Nagle 和 TCP_CORK 有什么区别？

怎么确认线上问题是 Nagle 引起的？

写段代码