如何配置HA集群高可用服务-linux运维-PHP中文网

如何配置HA集群高可用服务

P粉602998670

发布： 2025-08-14 13:27:02

原创

309人浏览过

配置ha集群的核心目标是确保服务在单点故障时仍能持续运行，其关键步骤包括：1. 明确ha集群的组成要素，包括多节点、共享存储、集群管理软件、资源管理器、心跳机制和虚拟ip；2. 根据服务类型选择合适方案，如keepalived+vip适用于web服务，pacemaker+corosync适用于复杂场景；3. 实现数据同步与共享存储，采用数据库复制、drbd、共享存储或应用层同步机制，并配置仲裁或stonith防止脑裂；4. 配置健康检查与故障转移，设置监控操作、超时重试策略，启用日志并测试故障切换；5. 注意网络稳定性、时间同步、防火墙配置及充分测试验证，最终根据业务需求选择轻量或企业级方案以确保高可用性成功部署。

如何配置HA集群高可用服务

配置HA（High Availability，高可用）集群的核心目标是确保关键服务在单点故障时仍能持续运行。常见的HA集群用于数据库、Web服务、存储系统等场景。以下是配置HA集群的基本思路和关键步骤，适用于大多数Linux环境下的服务高可用需求。

一、明确HA集群的组成要素

一个典型的HA集群通常包含以下组件：

多台服务器节点：至少两个节点（主/备或双活）
共享或同步的数据存储：如共享磁盘、DRBD、数据库主从复制等
集群管理软件：如Pacemaker、Corosync、Keepalived、HAProxy等
资源管理器：用于控制服务的启停、故障转移
心跳机制：节点间通信检测存活状态（通过Corosync或Keepalived实现）
虚拟IP（VIP）：对外提供服务的浮动IP，可在节点间漂移

二、选择合适的HA方案

根据服务类型和需求选择合适的技术组合：

1. Keepalived + VIP（适用于Web、负载均衡）

简单轻量，常用于Nginx、HAProxy前端高可用

AppMall应用商店
AI应用商店，提供即时交付、按需付费的人工智能应用服务

56

查看详情
使用VRRP协议实现主备切换

配置示例（主节点）：

vrrp_instance VI_1 {
    state MASTER
    interface eth0
    virtual_router_id 51
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1234
    }
    virtual_ipaddress {
        192.168.1.100/24
    }
    track_script {
        chk_http
    }
}

virtual_server 192.168.1.100 80 {
    delay_loop 6
    lb_algo rr
    lb_kind NAT
    protocol TCP
    real_server 192.168.1.10 80 {
        weight 1
        TCP_CHECK {
            connect_port 80
            connect_timeout 3
        }
    }
}

登录后复制

2. Pacemaker + Corosync（适用于复杂服务，如数据库、文件系统）

功能强大，支持资源依赖、约束、监控

安装：

# Ubuntu/Debian
sudo apt install pacemaker corosync pcs
# CentOS/RHEL
sudo yum install pacemaker corosync pcs

登录后复制

配置Corosync通信密钥并启动：

sudo pcs cluster auth node1 node2 -u hacluster -p password
sudo pcs cluster setup --name mycluster node1 node2
sudo pcs cluster start --all
sudo pcs cluster enable --all

登录后复制

添加资源（例如Apache服务）：

sudo pcs resource create webserver ocf:heartbeat:apache configfile=/etc/apache2/apache2.conf op monitor interval=30s
sudo pcs resource create virtual-ip ocf:heartbeat:IPaddr2 ip=192.168.1.100 cidr_netmask=24 op monitor interval=30s
sudo pcs constraint colocation add virtual-ip with webserver
sudo pcs constraint order webserver then virtual-ip

登录后复制

三、数据同步与共享存储

高可用不仅要求服务切换，还要保证数据一致：

数据库主从复制（MySQL、PostgreSQL）：主库故障时提升从库
DRBD（Distributed Replicated Block Device）：块设备级别同步，类似网络RAID1
共享存储（NFS、iSCSI、SAN）：多个节点挂载同一存储，需配合集群文件系统（如GFS2、OCFS2）
应用层同步：如Redis Sentinel、MongoDB副本集

注意：若使用共享存储，必须避免脑裂（Split-Brain），建议配置仲裁机制或STONITH（Shoot The Other Node In The Head）

四、健康检查与故障转移

配置资源监控（monitor操作），定期检查服务状态
设置合理的超时时间和重试次数
启用日志记录（
```
/var/log/pacemaker.log
```
登录后复制
、
```
/var/log/corosync/corosync.log
```
登录后复制
）便于排错
测试故障转移：手动关闭主节点，观察VIP和服务是否自动迁移到备用节点