#

流式计算

  • 如何基于日志,同步实现数据的一致性和实时抽取?

    一、背景 事情是从公司前段时间的需求说起,大家知道宜信是一家金融科技公司,我们的很多数据与标准互联网企业不同,大致来说就是: 玩数据的人都知道数据是非常有价值的,然后这些数据是保存在各个系统的数据库

    作者:宜信技术
    2020-08-12 17:18:19
  • Spark Streaming 实现数据实时统计案例

    Spark 是一个基于内存式的分布式计算框架。具有高性能,高效可扩展,容错等优点。今天讲解一下spark的流计算,其实它也不完全是实时的流计算,算是一种准实时的流计算。上图讲解运行环境:需要linux

    作者:ChinaUnicom110
    2020-07-25 07:25:06
  • 流式计算的三种框架:Storm、Spark和Flink

    我们知道,大数据的计算模式主要分为批量计算(batch computing)、流式计算(stream computing)、交互计算(interactive computing)、图计算(graph

    作者:先荐
    2020-07-24 13:37:39
  • Apache Flink官方文档中文版-数据流上有状态的计算

    应用生态图 特点 所有流式计算场景 事件驱动的应用程序 流和批量分析 数据管道和ETL 保证正确性 完全一次的语义 事件处理 复杂的后期数据处理 分层PAI 流和批量数据上的SQL Data

    作者:Lynn_Yuan
    2020-07-06 22:48:23
  • Apache Beam官方文档

    1.   概述为了使用Beam,首先必须使用Beam SDKs其中一个SDK里面的类创建一个驱动程序。驱动程序定义了管道,包括所有的输入,转换以及输出。它还为您的管道设置了执行选项

    作者:Lynn_Yuan
    2020-07-02 04:51:50