#

大数据

  • StartDT_AI_Lab | 开启“数据+算法”定义的新世界

    继「数据中台技术汇」栏目推出以来,获得了不少技术极客的喜爱。作为AI驱动的数据中台创导者,深度关注核心算法技术的自研创新、融合探索,故推出全新AI算法栏目「StartDT_AI_Lab」,主要介绍算法

    作者:StartDT
    2020-09-02 14:42:34
  • Spark Streaming笔记整理(二):案例、SSC、数据源与自定义Receiver

    [TOC] 实时WordCount案例 主要是监听网络端口中的数据,并实时进行wc的计算。 Java版 测试代码如下: package cn.xpleaf.bigdata.spark.java.st

    作者:xpleaf
    2020-08-31 13:02:48
  • Hbase数据存储原理与读写详解

    1、HBase的数据存储原理 一个HRegionServer会负责管理很多个region 一个*region包含很多个store 一个列族就划分成一个store** 如果一个表中只有1个列族,那

    作者:victor19901114
    2020-08-30 22:20:54
  • EonStor GSe Pro 1000详解攻略(五)内功深厚:提升性能的数据服务

    最大800GB的SSD缓存池 缓存是一个透明保存数据的组件,以便将来可以更高效的处理数据请求,是存储的核心组成部分之一,特别适合读密集型的应用。由于控制器的内存容量有限,SSD缓存能够利用高速的SSD

    作者:吾与
    2020-08-30 07:14:04
  • 支付宝和蚂蚁花呗的技术架构及实践

    每年“双11”都是一场电商盛会,消费者狂欢日。今年双11的意义尤为重大,它已经发展成为全世界电商和消费者都参与进来的盛宴。而对技术人员来说,双十一无疑已经成为一场大考,考量的角度是整体架构、基础中间件

    作者:chajiuke王超
    2020-08-30 01:12:03
  • 撕掉普通程序员的标签,这才是真正的大数据工程师

    问你个问题:你是不是曾无数次下定决心要做大数据工作,但因为不知如何开始而放弃?是不是曾经去面试过大数据工作,但因为没有经验缕缕碰壁?你在公司里表现很好,布置的任务总是能又好又快的完成,但两年来你的工资

    作者:15878367337
    2020-08-28 16:12:44
  • hadoop大数据研发平台

    一.开发平台:•Hadoop是Apache软件基金会旗下的一个开源分布式计算平台•以分布式文件系统(Hadoop Distributed File Syste, HDFS)和MapReduce为核心的

    作者:北京云港
    2020-08-28 11:29:02
  • EonStor GSi:媒资管理的完美存储

    媒体娱乐(M&E)行业的大多数存储用户(例如,电影制片厂、视频制作公司)都在使用媒体资产管理(MAM)应用程序。MAM应用程序主要的用途,是让媒体素材从采集到分发的全过程,全部由用户完全管理,形成保存

    作者:吾与
    2020-08-24 19:42:47
  • hive表开启lastAccessTime参数

    1.hive-site.xml 的 Hive 服务高级配置代码段(安全阀)中添加2个参数: hive.security.authorization.sqlstd.confwhitelist=hive.

    作者:choulanlan
    2020-08-22 18:49:06
  • MongoDB副本集的常用操作及原理

    下面的操作主要分为两个部分: 修改节点状态 主要包括: 将Primary节点降级为Secondary节点冻结Secondary节点强制Secondary节点进入维护模式2. 修改副本集的配置 添加

    作者:gzhilong
    2020-08-22 14:10:38