这篇文章主要讲解了“hadoop异构存储怎么实现”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“hadoop异构存储怎么实现”吧!
1. 什么是hadoop的异构存储
Hadoop在2.6.0版本中引入了一个新特性——异构存储。异构存储关键在于异构2个字,异构存储可以根据各个存储介质读写特性的不同发挥各自的优势,比如最普通的Disk磁盘;而对于热数据而言,可以采用SSD的方式进行存储,这样就能保证高效的读性能,在速率上甚至能做到十倍于或百倍于普通磁盘读写的速度。
2. 目前hadoop支持的存储类型如下:
* RAM_DISK存储在内存
* SSD
存储在固态硬盘
* DISK(default)
存储在普通磁盘(默认)
* ARCHIVE
按照RAM_DISK->SSD->DISK->ARCHIVE的顺序,存取速度由快到慢,单bit存储成本由高到低。
2.1 命令的使用
0. hdfs storagepolicies -listPolicies(查看支持的存储策略)
1.hadoop fs -mkdir /data/ssddata(创建目录)
2.hdfs storagepolicies -setStoragePolicy -path /data/ssddata –policy One_SSD
(将目录设置为一份存在ssd上面,其他的副本存在普通的磁盘上面,以后存储在该文件夹下面的文件的块副本都会存一份在ssd上面)
3.hdfs storagepolicies -getStoragePolicy -path /data/ssddata(查看该目录的存储策略,结果如下图)
4.取消设置的存储策略,创建文件的时候默认为unspecified,那么该命令可以将其修改为默认值
hdfs storagepolicies -unsetStoragePolicy -path /data/normal/ip2.txt
hdfs mover [-p <files/dirs> | -f <local file name>],
3. 索引
在数据检索中,给数据添加索引是一个重要环节,传统中关系型数据库大多通过建索引来达到快速检索的效果,OLTP数据库大多是B或者B+树索引。想必大家都知道lucene,它的索引是倒排索引(该概念不再这里叙述),不同的分词使它的全文检索功能很强大。诸如大家熟知的Elasticsearch也是在以lucene做索引引擎。但遗憾的是ES并不支持异构存储,且ES在面临单个分片数据量超大时也会存在瓶颈问题。
感谢各位的阅读,以上就是“hadoop异构存储怎么实现”的内容了,经过本文的学习后,相信大家对hadoop异构存储怎么实现这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。