NoSQL,指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称。
NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。
今天我们可以通过第三方平台(如:Google,Facebook等)可以很容易的访问和抓取数据。用户的个人信息,社交网络,地理位置,用户生成的数据和用户操作日志已经成倍的增加。我们如果要对这些用户数据进行挖掘,那SQL数据库已经不适合这些应用了, NoSQL数据库的发展也却能很好的处理这些大的数据。
NoSQL的优点
高可扩展性 可以横向扩展也可以纵向扩展
分布式计算
低成本高性能
架构的灵活性,半结构化数据
没有复杂的关系
MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。
MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库.支持类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。所以这个非常方便,我们可以用sql操作MongoDB,从关系型数据库迁移过来,开发人员学习成本会大大减少。如果再对底层的sql API做一层封装,开发基本可以感觉不到mongodb和关系型数据库的区别。同样MongoDB也是号称自己能够快速搭建一个高可用可扩展的的分布式集群
MongoDB可以在windows上安装使用,同样支持linux平台。我这里选的是linux平台安装。
1. 首先下载并解压安装包
curl -O https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-3.0.6.tgz # 下载 tar -zxvf mongodb-linux-x86_64-3.0.6.tgz # 解压 mv mongodb-linux-x86_64-3.0.6/ /usr/local/mongodb # 将解压包拷贝到指定目录
把MongoDB的可执行文件路径加到PATH变量中(~/.bash_profile)
PATH=$PATH:$HOME/bin:/usr/local/mongodb/bin
2. 创建所mongodb启动需要的路径和文件
mkdir /data/db #创建存放mongodb的数据文件夹 mkdir /usr/local/mongodb/logs/ #创建存放mongodb日志的文件夹 touch /usr/local/mongodb/logs/mongodb.log #创建存放mongodb的日志文件
3. 启动mongodb服务。命令窗口直接执行就行
[root@DB ~]# mongod 2017-11-14T13:14:19.809+0800 I JOURNAL [initandlisten] journal dir=/data/db/journal 2017-11-14T13:14:19.809+0800 I JOURNAL [initandlisten] recover : no journal files present, no recovery needed 2017-11-14T13:14:19.815+0800 I JOURNAL [durability] Durability thread started 2017-11-14T13:14:19.815+0800 I JOURNAL [journal writer] Journal writer thread started 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] MongoDB starting : pid=4287 port=27017 dbpath=/data/db 64-bit host=DB 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** WARNING: You are running this process as the root user, which is not recommended. 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/enabled is 'always'. 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never' 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/defrag is 'always'. 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never' 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** WARNING: soft rlimits too low. rlimits set to 16384 processes, 65536 files. Number of processes should be at least 32768 : 0.5 times number of files. 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] db version v3.0.6 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] git version: 1ef45a23a4c5e3480ac919b28afcba3c615488f2 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] build info: Linux build6.ny.cbi.10gen.cc 2.6.32-431.3.1.el6.x86_64 #1 SMP Fri Jan 3 21:39:27 UTC 2014 x86_64 BOOST_LIB_VERSION=1_49 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] allocator: tcmalloc 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] options: {} 2017-11-14T13:14:19.849+0800 I NETWORK [initandlisten] waiting for connections on port 27017
可以看到mongodb服务进程以及启动,开启了27017端口等待连接了
另开一个命令窗口,使用mongo命令可以与mongodb进行交互。由于它是一个JavaScript Shell,可以输入简单的算术运算测试一下:
[root@DB mongodb]# mongo MongoDB shell version: 3.0.6 connecting to: test Server has startup warnings: 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** WARNING: You are running this process as the root user, which is not recommended. 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/enabled is 'always'. 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never' 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/defrag is 'always'. 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never' 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] ** WARNING: soft rlimits too low. rlimits set to 16384 processes, 65536 files. Number of processes should be at least 32768 : 0.5 times number of files. 2017-11-14T13:14:19.834+0800 I CONTROL [initandlisten] > 3+2 5
也可以插入一些简单数据,查询验证:
> db.a.insert({a:1}) WriteResult({ "nInserted" : 1 }) > db.a.find() { "_id" : ObjectId("5a0a7fa7766decd974b3ad3f"), "a" : 1 } >
mongod的主要参数有:
--quiet# 安静输出 --port arg# 指定服务端口号,默认端口27017 --bind_ip arg# 绑定服务IP,若绑定127.0.0.1,则只能本机访问,不指定默认本地所有IP --logpath arg# 指定MongoDB日志文件,注意是指定文件不是目录 --logappend# 使用追加的方式写日志 --pidfilepath arg# PID File 的完整路径,如果没有设置,则没有PID文件 --keyFile arg# 集群的私钥的完整路径,只对于Replica Set 架构有效 --unixSocketPrefix arg# UNIX域套接字替代目录,(默认为 /tmp) --fork# 以守护进程的方式运行MongoDB,创建服务器进程 --auth# 启用验证 --cpu# 定期显示CPU的CPU利用率和iowait --dbpath arg# 指定数据库路径 --diaglog arg# diaglog选项 0=off 1=W 2=R 3=both 7=W+some reads --directoryperdb# 设置每个数据库将被保存在一个单独的目录 --journal# 启用日志选项,MongoDB的数据操作将会写入到journal文件夹的文件里 --journalOptions arg# 启用日志诊断选项 --ipv6# 启用IPv6选项 --jsonp# 允许JSONP形式通过HTTP访问(有安全影响) --maxConns arg# 最大同时连接数 默认2000 --noauth# 不启用验证 --nohttpinterface# 关闭http接口,默认关闭27018端口访问 --noprealloc# 禁用数据文件预分配(往往影响性能) --noscripting# 禁用脚本引擎 --notablescan# 不允许表扫描 --nounixsocket# 禁用Unix套接字监听 --nssize arg (=16)# 设置信数据库.ns文件大小(MB) --objcheck# 在收到客户数据,检查的有效性, --profile arg# 档案参数 0=off 1=slow, 2=all --quota# 限制每个数据库的文件数,设置默认为8 --quotaFiles arg# number of files allower per db, requires --quota --rest# 开启简单的rest API --repair# 修复所有数据库run repair on all dbs --repairpath arg# 修复库生成的文件的目录,默认为目录名称dbpath --slowms arg (=100)# value of slow for profile and console log --smallfiles# 使用较小的默认文件 --syncdelay arg (=60)# 数据写入磁盘的时间秒数(0=never,不推荐) --sysinfo# 打印一些诊断系统信息 --upgrade# 如果需要升级数据库 * Replicaton 参数 -------------------------------------------------------------------------------- --fastsync# 从一个dbpath里启用从库复制服务,该dbpath的数据库是主库的快照,可用于快速启用同步 --autoresync# 如果从库与主库同步数据差得多,自动重新同步, --oplogSize arg# 设置oplog的大小(MB) * 主/从参数 -------------------------------------------------------------------------------- --master# 主库模式 --slave# 从库模式 --source arg# 从库 端口号 --only arg# 指定单一的数据库复制 --slavedelay arg# 设置从库同步主库的延迟时间 * Replica set(副本集)选项: -------------------------------------------------------------------------------- --replSet arg# 设置副本集名称 * Sharding(分片)选项 -------------------------------------------------------------------------------- --configsvr# 声明这是一个集群的config服务,默认端口27019,默认目录/data/configdb --shardsvr# 声明这是一个集群的分片,默认端口27018 --noMoveParanoia# 关闭偏执为moveChunk数据保存 可以把上述参数都写进mongodb.conf配置文件里: [root@DB mongodb]# cat mongodb.conf dbpath=/data/db logpath=/usr/local/mongodb/logs/mongodb.log logappend=true port=27017 fork=true auth=false nohttpinterface=false bind_ip=192.168.221.160 journal=true quiet=true
启动的时候使用-f参数引用这个位置即可
[root@DB mongodb]# mongod -f /usr/local/mongodb/mongodb.conf about to fork child process, waiting until server is ready for connections. forked process: 4319 child process started successfully, parent exiting [root@DB mongodb]# ps -ef |grep mongo root 4319 1 1 13:36 ? 00:00:00 mongod -f /usr/local/mongodb/mongodb.conf [root@DB mongodb]# mongo 192.168.221.160 MongoDB shell version: 3.0.6 connecting to: 192.168.221.160/test Server has startup warnings: 2017-11-14T13:36:25.213+0800 I CONTROL [initandlisten] ** WARNING: You are running this process as the root user, which is not recommended. 2017-11-14T13:36:25.213+0800 I CONTROL [initandlisten] 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/enabled is 'always'. 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never' 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] ** WARNING: /sys/kernel/mm/transparent_hugepage/defrag is 'always'. 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] ** We suggest setting it to 'never' 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] ** WARNING: soft rlimits too low. rlimits set to 16384 processes, 65536 files. Number of processes should be at least 32768 : 0.5 times number of files. 2017-11-14T13:36:25.214+0800 I CONTROL [initandlisten] > db.a.find() { "_id" : ObjectId("5a0a7fa7766decd974b3ad3f"), "a" : 1 } >
我们都知道,这种单实例的配置只适合学习开发时使用,生产肯定不会这么使用,不然单节点挂掉整条数据流全丢了
接下来一篇我们继续学习mongodb主从的配置···
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。