大数据需要学什么课程大数据专业课程介绍( 二 )


第三阶段:海量数据存储分布式存储
1HadoopHDFS分布式存储:HDFS是Hadoop的分布式文件存储系统,是一个高度容错性的系统,适合部署在廉价的机器上,HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用,介绍其的入门基础知识,深入剖析 。
2HBase分布式存储:HBase-HadoopDatabase是一个高可靠性,高性能,面向列,可伸缩的分布式存储系统,利用HBase技术可在廉价PC上搭建起大规模结构化存储集群,介绍其入门的基础知识,以及设计原则,需实际操作才能熟练 。
第四阶段:海量数据分析分布式计算
1HadoopMapReduce分布式计算:是一种编程模型,用于打过莫数据集的并行运算 。
2Hiva数据挖掘:对其进行概要性简介,数据定义,创建,修改,删除等操作 。
3Spare分布式计算:Spare是类MapReduce的通用并行框架 。


大数据专业课程介绍
★ 收看《领航新时代》个人学习心得观后感5篇