在生产环境新增secondary:10.9.197.6:27017 ,数据量140G,却同步了一天还未追上数据,通过如下方式查看同步情况:
查看主从复制状态命令,以下两种方式结果是一致的:
use admin
db.runCommand( { replSetGetStatus : 1 } )
指定的值不会影响命令的输出。此命令提供的数据源自于包含在由副本集的其他成员发送到当前实例的心跳中的数据。由于心跳的频率,这些数据可能是几秒钟过期。详情请参考官档:https://docs.mongodb.com/manual/reference/command/replSetGetStatus/
rs.status()
查看复制状态,发现状态是"stateStr"
: "RECOVERING"。信息为"infoMessage" : "could not find
member to sync from",使用 rs.syncFrom("10.9.161.130:27017")也无法让其继续正常同步。具体信息如下:
如果不能停库的情况下,显然方法一是不合适的,应该选择方法二:调大oplog大小
方法1:不停服务情况下
参考官档:https://docs.mongodb.com/v3.2/tutorial/change-oplog-size/
1) db.shutdownServer()
2)
用其他端口以单机模式重新启动该实例,不使用--replSet参数
方法一:根据生产环境参数文件设置启动mongo,即将非默认情况参数进行指定
如下参数根据生产参数文件来设置,情况不一:
/data/servers/app/mongodb-3.2.8/bin/mongod --port 37017
--dbpath /data/servers/data/mg27017/data/ --directoryperdb --wiredTigerDirectoryForIndexes --nojournal
&
该方法较为麻烦,建议选择下面的方法二:
方法二:将参数文件进行修改:注释replSet部分,修改port为37017,然后以改完后的控制文件来启动mongo
/data/servers/app/mongodb-3.2.8/bin/mongod -f
/data/servers/data/mg27017/mongod.conf
下面截图显示的是只要更改的部分,端口号改为任意的没被占用的即可,此处改为37017
netstat -anp | grep $port查看端口号是否已启动
在单机模式(非replSet方式)下备份该37017端口已存在的oplog,oplog对应的集合为local数据库下的oplog.rs。下面为具体命令:
/data/servers/app/mongodb-3.2.8/bin/mongodump
--db local --collection 'oplog.rs' --port 37017 --host=127.0.0.1 -uroot
-p111111111 --authenticationDatabase=admin -o
/data/servers/data/mg27017/dump
【命令说明】
-o(--out)是制定输出目录。该目录需要执行备份的用户拥有相应权限,不用提前创建
--authenticationDatabase是用户名和密码对应的认证数据库,如果环境不需要密码认证,则-u、-p、--authenticationDatabase不需要指定
保存oplog中的最后一个条目
登陆local数据库
use local
定义对象:db
db = db.getSiblingDB('local')
使用temp集合来保存最后一个条目,这个集合保证里面没有数据:db.temp.drop(),在删除前确认下该数据是否可以删除,如果不可以删除,使用另一个集合也是一样的。此处temp没有数据
使用db.collection.save() 方法:找到自然顺序的逆向排序后的最后一个条目,并将其保存到一个临时的集合里面
db.temp.save(
db.oplog.rs.find( { }, { ts: 1,
h: 1 } ).sort( {$natural : -1} ).limit(1).next() )
插入后结果为
删除local下的oplog.rs集合,结果返回为true
db = db.getSiblingDB('local')
创建oplog.rs固定集合,设置大小为4G,该大小根据实际情况来定
db.runCommand( { create: "oplog.rs", capped:
true, size: (4* 1024 *1024*1024) } )
将之前保存的oplog的最后一个条目插入到新的oplog里
db.oplog.rs.save(
db.temp.findOne() )
跟temp结果比对是一致的
关闭单机实例,要用admin才能关闭
use admin
db.shutdownServer()
将之前更改的操作还原,启动mongo
/data/servers/app/mongodb-3.2.8/bin/mongod
-f /data/servers/data/mg27017/mongod.conf
查看主从复制状态,确保状态正常
db.runCommand(
{ replSetGetStatus : 1 } )或者rs.status()
对要更改oplog大小的所有secondary成员重复此过程。
对于主库,需要先将主库切成从库,再重复上述oplog调整过程
rs.stepDown()
config=rs.conf()
config.members[2].priority = 6
rs.reconfig(config)
此处数字2为rs.conf()里要变成主库的secondary所在的次序,从0开始算,与id无关。priority数字最大即变成主库。旧的主库调整完后,记得要将priority变为1。
方法2:停服务情况下
该方法操作最为简便,但是需要停服务。具体步骤为
use
admin
db.shutdownServer()
rm -rf /data/servers/data/mg27017/local/*
如果不确定谁是主库,就mv下数据目录
rm -rf /data/servers/data/mg27017/data/*
oplogSizeMB: 4096
/data/servers/app/mongodb-3.2.8/bin/mongod
-f /data/servers/data/mg27017/mongod.conf
该方法会导致主库如果异常,没有从库可切换,不建议使用该方式
设置多大的oplog合适呢,可以根据现在数据大小,io和大致的oplog window时间预估一个合适的大小
rs.printReplicationInfo()
log length start to end: 当oplog写满时可以理解为时间窗口
oplog last event time: 最后一个操作发生的时间
修改oplog大小
1 Restart a
Secondary in Standalone Mode on a Different Port
2 Create a Backup of the Oplog (Optional)
3 Recreate the Oplog with a New Size and a
Seed Entry
4 Remove the Existing Oplog Collection
db.oplog.rs.drop()
5 Create a New Oplog
6
Insert the Last Entry of the Old Oplog into the New Oplog
7 Restart the Member
8 Repeat Process for all Members that may
become Primary
9 Change the Size of the Oplog on the
Primary
1 关闭mongod实例(所有节点)
2 删除local数据库下的所有文件(PRIMARY节点)
3 删除mongo数据目录(secondary)
4 修改所有节点配置文件(oplogsize)
5 重启所有节点mongod
【小节】
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。