#

etl

  • DataPipeline丨新型企业数据融合平台的探索与实践

    一、关于数据融合和企业数据融合平台 数据融合是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。 企业数据融合平台,通常的表现形态为运行着大量数据同步和转换任

    作者:DataPipeline
    2020-06-25 03:02:17
  • AWS Redshift ETL的几个性能最佳实践

    Amazon Redshift 是一个支持SQL查询的、快速、可扩展的列式存储数据库,它支持PB级的数量查询,是适用于企业级的数据仓库。同时Redshift支持大规模并发查询、支持结果集缓存,响应查询

    作者:Eteng
    2020-06-02 03:42:03
  • 体系结构方案 -ETL 中间件

    ETL 常常做成 ELT 甚至 LET! 这样做带来的恶果是:1)数据库臃肿、负担重,数据管理混乱;2)性能低下,时间成本高( 数据库写入很慢),影响 ETL 窗口时间。解决方案: 引入库外计算引擎

    作者:raqsoft
    2020-05-18 15:57:28
  • ETL调度系统及常见工具对比:Azkaban、Oozie、数

    最近遇到了很多正在研究ETL及其工具的同学向我们抱怨:同样都在用 Kettle ,起点明明没差异,但为什么别人ETL做的那么快那么好,自己却不断掉坑? 其实,类似于像 Kettle 这样开源的工具,

    作者:数澜
    2020-03-02 04:42:45