Consul 生产环境部署和运维有哪些关键要点？

Question

Levenx · Accepted Answer

Consul 生产部署的核心难点在于保证集群高可用的同时兼顾安全与性能。以下是实战中必须关注的要点。集群架构：3-5 个 Server 节点是底线Server 节点数量必须是奇数（3 或 5），因为 Consul 使用 Raft 协议，需要多数派达成共识才能提交写入。3 节点容忍 1 台宕机，5 节点容忍 2 台。Server 节点应跨可用区部署，避免单机房故障导致整体不可用。Client 节点与业务同机部署，负责本地健康检查和请求转发，单个数据中心建议不超过 5000 个 Client。安全配置：TLS + ACL + Gossip 加密缺一不可生产环境必须启用三项安全机制：RPC 通信走 TLS 双向认证，Gossip 协议使用 encryptkey 加密，ACL 默认策略设为 deny 并按最小权限分配 Token。Bootstrap Token 权限极大，务必妥善保管，类似数据库 root 密码。启用 ACL 后注意开启 enabletoken_persistence，避免节点重启后 Token 丢失导致集群通信中断。性能调优：关注磁盘 IO 和 Raft 参数Consul 写

Consul 生产环境部署和运维有哪些关键要点？

集群架构：3-5 个 Server 节点是底线

安全配置：TLS + ACL + Gossip 加密缺一不可

性能调优：关注磁盘 IO 和 Raft 参数

常见故障：Leader 丢失和服务注册不同步

追问：滚动更新时如何避免 no leader 错误？