来源:南通科迅教育
时间:2019/11/28 11:14:06
南通科讯学院专业大数据培训 科迅教育专注职业技能培训,致力于培养面向设计及开发领域的人才,以学员就业为目的,优质就业为宗旨,是一家集:软件开发(JavaEE、Web前端、.NET、PHP、大数据、Python等)、UI交互设计、平面设计、电商美工、美工运营、室内设计、软装设计、建筑设计、景观设计、数控编程、模具设计等课程为一体的培训机构
大数据技术需要学什么
1、大数据离线分析
一般处理T+1数据(T:可能是1天、一周、一个月、一年)
a、Hadoop:一般不选用新版本,踩坑难解决
(common、HDES、MapReduce、YARN)
环境搭建、处理数据的思想
b、Hive:大数据的数据仓库
经过写SQL对数据进行操作,类似于MySQL数据库的sql
c、HBase:基于HDFS的NOSQL数据库
面向列存储
d、协作框架:
sqoop(桥梁:HDFS《==》RDBMS)
flume:搜集日志文件中的信息
e、调度框架
anzkaban
了解:crotab(Linux自带)
zeus(Alibaba)
Oozie(cloudera)
f、前沿框架扩展:
kylin、impala、ElasticSearch(ES)
2、大数据实时分析
以spark框架为主
Scala:OOP(面向对象程序设计)+FP(函数是程序设计)
sparkCore:类比MapReduce
sparkSQL:类比hive
sparkStreaming:实时数据处理
kafka:消息队列
前沿框架扩展:flink
阿里巴巴:blink
3、大数据机器学习
sparkMLlib:机器学习库
pyspark编程:Python和spark的结合
版权所有:搜学搜课(www.soxsok.com)