温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

使用Apache Doris有什么好处

发布时间:2022-01-04 15:56:47 来源:亿速云 阅读:783 作者:柒染 栏目:大数据

本篇文章为大家展示了使用Apache Doris有什么好处,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。


 
Doris是Apache的孵化项目,作为MPP架构的关系型分析数据库,其性能表现卓越。  此外Doris高度兼容MySQL协议,支持在线表结构变更且不依赖任何外部存储;  扩展能力强,单集群可水平扩展至200台以上;  多副本数据、元数据高可用,同时支持 Kafka流式导入,未来希望吸引更多外部贡献者加入做出有效改进。

Doris作为Apache的孵化项目,有很多体量比较大的企业在使用,例如搜狐 、一点资讯、美团、小米、京东等。  Doris产品在百度的最初研发大概在十年之前,当前内部偏数据仓库的业务基本都运行在其上,作为MPP架构的关系型分析数据库,起初在设计时主要追求便捷与问题解决,支持PB级别。  由于传统数据仓库主要是商业智能的方向,并没有对高并发、高可用做很多优化,而是集中在多维分析与报表查询等功能,而Doris可以确保7×24小时服务,通过滚动升级不中断线上服务,Doris在2017年在Github上开源 ,并于2018年进入Apache孵化器。
 
具体说到Doris的特色,性能卓越是不可忽视的一方面。  了解一种数据库的卓越性能,我们需要看其场景,离开场景泛泛谈数据库性能,是不科学的。  Doris每个单后端可以做到在高并发情况下做到每秒钟8000+次的查询性能,100台节点的集群基本可以达到几万到十几万QPS的性能,这个性能基本可以满足类似百度统计这种,支撑全网几十万网站与APP的查询要求。  此外,Doris高度兼容MySQL协议,支持在线表结构变更;  只设FE、BE两个进程,方便部署,其中FE 负责元数据存储、查询解析和规划,BE 负责数据存储、执行查询算子。
         使用Apache Doris有什么好处         
基于此,我们都知道类似Kylin这类系统在线变更极其不便,仅仅是增加删除列可能都需要重新做表,影响在线服务,并且依赖很多Hadoop组件,使得部署使用非常复杂。  但Doris高度集成并没有过多依赖外部存储,快速安装并可做到主节点高可用,就算是切换也可做到无感知并操作简单。  此外,Doris扩展性强,架构优雅,其单集群可水平扩展至200台以上,支持Kafka流式导入集群,通过ODBC、JDBC链接前端可视化工具或开发应用等,表现出高可用、多副本等优势特性,Doris作为大企业开源的软件,是在实践中千锤百炼累计出来的,对解决实际问题的效果很好。

使用Apache Doris有什么好处
在京东,他们主要采用Doris来解决京东广告平台的报表查询,需要满足每日千万级查询、每日百亿级增量、毫秒级查询延迟以及每日百亿报表查询/多维分析/日志分析等数据指标。  Doris在618大促期间表现突出。  此外在美团数据仓库迁移的过程中,原本是基于Apache Kylin的数据建模,由于 Kylin的Cube预构建会造成较多的数据重复,保持数据时效性还需要每天需要对大量历史数据进行重计算;  但现在主要基于Doris进行数据建模,按天同步维度表和事实表,ad-hoc query查询即可。
         使用Apache Doris有什么好处         
         使用Apache Doris有什么好处            

Doris下一步的主要研发规划,包括存储和计算分离。  我们发现目前有很多的历史数据存在于存储节点之上,未来希望可以存储在云上的对象存储中,将Doris改进为云原生数据库。  毕竟在云上部署弹性的计算资源,一旦计算与存储分离,成本也会相应得到降低;  引入新的存储格式,提升存储效率,包括索引、新的实时更新存储引擎等,以便提升效率;  此外还会在查询优化方面下功夫,例如研发新的查询优化框架,支持CBO。

上述内容就是使用Apache Doris有什么好处,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注亿速云行业资讯频道。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI