温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

大数据主要学习什么?

发布时间:2020-03-10 19:52:34 来源:网络 阅读:152 作者:a大数据 栏目:大数据

学习大数据需要的基础

1、java SE、EE(SSM)

90%的大数据框架都是Java写的

2、MySQL

SQL on Hadoop

3、Linux

大数据的框架安装在Linux操作系统上
大数据主要学习什么?

  • 需要学什么

.在入门学习大数据的过程当中有遇见学习,行业,缺乏系统学习路线,系统学习规划,欢迎你加入我的大数据学习交流裙:251956502 ,裙文件有我这几年整理的大数据学习手册,开发工具,PDF文档书籍,你可以自行下载。

大数据离线分析

一般处理T+1数据(T:可能是1天、一周、一个月、一年)

a、Hadoop :一般不选用最新版本,踩坑难解决

(common、HDES、MapReduce、YARN)

环境搭建、处理数据的思想

b、Hive:大数据的数据仓库

通过写SQL对数据进行操作,类似于MySQL数据库的sql

c、HBase:基于HDFS的NOSQL数据库

面向列存储

d、协作框架:

sqoop(桥梁:HDFS《==》RDBMS)

flume:搜集日志文件中的信息

e、调度框架

anzkaban

了解:crotab(Linux自带)

zeus(Alibaba)

Oozie(cloudera)

f、前沿框架扩展:

kylin、impala、ElasticSearch(ES)

大数据实时分析

以spark框架为主

Scala:OOP(面向对象程序设计)+FP(函数是程序设计)

sparkCore:类比MapReduce

sparkSQL:类比hive

sparkStreaming:实时数据处理

kafka:消息队列

前沿框架扩展:flink

阿里巴巴:blink

大数据机器学习

spark MLlib:机器学习库

pyspark编程:Python和spark的结合

推荐系统

python数据分析

python机器学习


向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI