Consul 多数据中心部署如何配置？哪些坑最容易踩？

Question

Levenx · Accepted Answer

Consul 的多数据中心不是把一个 Raft 集群横跨几个机房，而是每个数据中心有自己的 Consul server 集群，再通过 WAN Gossip 和远程 RPC 互相发现。这样做的好处是本地故障不会直接拖垮其他数据中心，服务查询也优先走本地。代价是 KV、ACL、服务目录并不是天然全局一致，跨数据中心访问要明确指定目标 DC。很多误解都来自这里：Consul 支持联邦，不等于自动同步所有配置和业务流量。常见生产结构是每个数据中心 3 或 5 个 server，业务机器运行 client agent。server 参与 Raft，client 负责本机服务注册、健康检查和转发查询。跨数据中心只让 server 加入 WAN 池，普通 client 不需要加入。dc1 的 server 配置可以这样写：datacenter = "dc1"node_name = "consul-dc1-s1"server = truebootstrap_expect = 3data_dir = "/opt/consul"bind_addr = "10.0.0.11"client_addr = "0

Consul 多数据中心部署如何配置？哪些坑最容易踩？

追问

为什么不建议把一个 Consul Raft 集群跨机房部署？

多数据中心下服务发现是自动故障转移吗？

KV 和配置会在数据中心之间自动同步吗？

WAN Gossip 配置最容易错在哪里？