这篇文章将为大家详细讲解有关Hadoop生态系统组件有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
Hadoop生态系统的组件包括:
HDFS:分布式文件系统
YARN:资源管理和调度
MapReduce:并行计算框架
HBase:可扩展的分布式NoSQL数据库
Hive:适合做ETL的大数据仓库,支持SQL查询语言,基于MapReduce
Impala:新型查询系统,提供交互式的SQL查询
ZooKeeper:分布式应用程序协调服务
Spark:分布式内存计算引擎,支持ETL、机器学习、Streaming和图计算
Flume:分布式日志收集、聚合系统
Pig:大规模数据分析平台
PrestoDB:大数据的分布式 SQL 查询引擎
Phoenix:是Hbase的 SQL 驱动
Drill :加快Hadoop数据查询的工具
Hue 是运营和开发Hadoop应用的图形化用户界面,功能及其强大
以服务体系划分:
计算云:虚拟主机/弹性计算/负载均衡QLB
存储云:GlusterFS/Swift/FastDFS/生产存储/云盘
服务云-数据库:MySQL/Couchbase/Redis/MongoDB
服务云-分布式中间件:RPC/MQ/ZooKeeper
服务云-Hadoop:HDFS/MR/Hive/HBase
服务云-实时计算:Spark/Storm/实时日志收集分析
关于“Hadoop生态系统组件有哪些”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。