主机名 | 网卡 | 磁盘 |
---|---|---|
master | eth0 桥接模式 eth0(192.168.1.10) 自定义模式(VMnet2)(192.168.2.10)VIP 192.168.1.200/210 | 系统盘+20G外接磁盘 |
slave | eth0 桥接模式(192.168.1.20) eth2 自定义模式(VMnet2)(192.168.2.20)VIP 192.168.1.200/210 | 系统盘+20G外接磁盘 |
server3 | eth0 桥接模式 (192.168.1.30) | 系统盘 |
master
slave
server3
链接:https://pan.baidu.com/s/1W2-jeaK_tc-abvSZzmRaiw
提取码:4evz
drbd 是工作在文件系统之下,是基于块的迁移
drbd的迁移
文件系统------buffer-cache--------网卡传递到另一端------裸设备-----drbd写入磁盘
drbd 数据分为两部分,数据存储部分和元数据部分。
协议A:本地写成功后就返回给客户端。
协议B:半同步的协议,本地写成功,发送到对端后立即返回,
协议C:发送到对端,并成功写入并进行缓存。
1 单主模式,及主备模式,为典型的高可用性几圈方案
2 复主模式,需要采用共享cluster文件系统,如GFS和OCFS2
当一端在运行时另一端是不可见的
两端配置基本相同
/dev/sdb1 为数据区域
/dev/sdb2 为元数据区域
元数据区域不能格式化
A 解决依赖
yum -y install gcc kernel-devel kernel-headers flex
B 编译并安装
./configure --prefix=/usr/local/drbd.8.4.4 --with-km --with-heartbeat --sysconfdir=/etc/
make KDIR=/usr/src/kernels/2.6.32-431.el6.x86_64/
此处必须是自己uname -r 得到的内核,不一定是上面的内核
make install
检验
slave 端加载
slave 端相同
相关解释
global {
usage-count no;}
common{
syncer {
rate 100M; #同步占用的带宽
verify-alg crc32c; # 验证使用的算法} }
#Primary for drbd1
resource data{
protocol C; # drbd使用的协议
disk {
on-io-error detach; #出现IO错误的处理方式
}
on master {
device /dev/drbd0; #drbd的设备
disk /dev/sdb1; #对应的数据分区
address 192.168.1.10:7788; #地址是监听自己心跳的IP地址
meta-disk /dev/sdb2[0]; #元数据位置
}
on slave {
device /dev/drbd0;
disk /dev/sdb1;
address 192.168.1.20:7788;
meta-disk /dev/sdb2[0];
}}
其中data是上述资源的名称。
查看启动参数
相关参数解释:
注意:只有主备两边的DRBD都启动起来才会生效
cs:链接状态
ro:角色信息,此时的状态为Secondary/Secondary,表示两台主机的状态都是备机状态
ds:磁盘状态,Inconsistent/Inconsistent显示的状态内容“不一致”,这是因为DRBD无法判断哪一方为主机,应以哪一方的磁盘数据作为标准
dw:磁盘写操作
dr: 磁盘读操作
ns: 网络发送
nr: 网络接受
如果主动端的NS和slave端的NR相同表示发送与接受同步 。
查看同步情况
挂载同步测试
从端测试
恢复
通过heartbeat 可以进行故障转移并提供相关的服务
在故障转移期间也需要切换时间,常见的时间是5-20秒左右。但是能够确保业务一致性
heartbeat的高可用是服务器级别的,不是服务级别的。,服务的down机不会导致服务的切换。
1 服务器down机
2 heartbeat 服务本身down机
3 心跳链接线down机
Heartbeat 高可用软件在工作过程中,一般来说,有三种消息类型,具体为:
1 心跳消息
越150字节,可能为单播,广播或组播,控制心跳频率及出现故障要等待多久进行故障转换2 集群转换消息
Ip-request 和 ip-request-resp
当主服务器恢复在线状态后,通过ip-request消息请求备机释放主服务器失败时被服务器取得的资源,然后备份服务器关闭释放主服务器失败时取得的资源及服务。被服务器释放主服务器失败时取得的资源服务后,就会通过ip-request-resp消息通知主服务器他不再拥有该服务器的资源及服务,主服务器收到来自被节点的ip-request-resp消息通知后,启动失败时释放的资源及服务,并开始提供正常的访问服务。
3 重传请求
rexmit-request 控制重传心跳请求。
以上心跳控制消息都使用功能的是UDP协议发送到/etc/ha.d/ha.cf 文件制定的任意接口,或指定的多播地址。
Heartbeat 是通过IP地址接管和ARP广播进行故障转移
ARP 广播在主服务器故障时,备用节点接管资后,会立即强制更新所有客户端本地的ARP(及清除客户端本地缓存的失败服务器的VIP和MAC地址的解析记录),确保客户端和新的主服务器之间的对话
配置密钥并配置其权限为600,必须为600
配置文件解析
Debugfile 调试日志存放位置Logfile 日志存放位置
Logfacility local 在syslog 服务中配置通过locally 设备接受日志
Keepalive2 指定心跳间隔时间为2秒
Deadtime 30 指定若备用节点在30秒内没有接受达到主节点的心跳信号,则立即接管主节点的服务资源
Warntime 10 指定心跳延迟为10秒。当10秒内备份节点不能接受到主节点的心跳信号时,会向日志中写入一个警告日志,但此时不会切换服务
Initdead 120 指定在heartbeat 首次运行后,需要等待120秒才启动主服务器的资源,该选项用于解决这种情况产生的时间间隔,取值至少为deadtime的两倍,单机启动时会遇到VIP绑定很慢,为正常现象
Bcast eth2 指明心跳使用以太网广播方式在eth2接口上进行广播,如使用两个实际网络来传递心跳则 bcast eth0 eth2
Mcast eht2 225.0.0.1 694 1 0 设置广播通信使用的端口,694为默认使用的端口,一个是 TTL
Auto_failback on 用来定义当主节点恢复后,是否将服务自动切回
Node master 主节点主机名,
Node slave 备用节点主机名
Crm no 是否开启cluster resource manager (集群资源管理器)
复制到被动端
重启服务器
grant replication slave on . to admin@'%' identified by 'root123';
change master to master_host='192.168.1.200',master_user='root',master_password='root123',master_log_file='mysql-bin.000001',master_log_pos=319;
此 192.168.1.200为heartbeat 的VIP,专用于数据链接
测试
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。