广州松田职业学院 首页 课程

全部课程> Hadoop大数据技术与应用

Hadoop大数据技术与应用

来源:广州松田职业学院

  • 2023-05-26  -  2026-05-26 64课时(建议每周学习0小时)
  • 自主模式

已有174人报名学习

  • 课程概览
  • 授课讲师
  • 课程大纲
  • 课程概览
  • 授课讲师
  • 课程大纲

随着时代的发展,大数据已经成为一个耳熟能详的词汇。与此同时,针对大数据处理的新技术也在不断的开发和运用中,逐渐成为数据处理挖掘行业广泛使用的主流技术之一。Hadoop作为处理大数据的分布式存储和计算框架,得到了国内外大小型企业广泛的应用。

课程概览
通过本课程的学习,使学生学会搭建Hadoop完全分布式集群,掌握HDFS的基础操作以及掌握MapReduce程序的编写。为将来从事大数据挖掘研究工作以及后续课程的学习奠定基础。
授课讲师
课程大纲
  • 第1章大数据基础
  •     第1节认识大数据
  •     第2节Hadoop简介和发展历程
  •     第3节Hadoop特性与生态环境
  • 第2章Hadoop环境配置
  •     第1节安装虚拟机
  •     第2节配置固定IP
  •     第3节配置ssh无密码登录
  •     第4节克隆虚拟机并修改配置
  •     第5节配置时间同步服务
  •     第6节安装Java
  •     第7节Hadoop集群架构
  •     第8节Hadoop集群安装与配置
  • 第3章HDFS操作
  •     第1节HDFS简介及架构
  •     第2节HDFS管理命令
  •     第3节HDFS目录基本操作
  •     第4节HDFS文件基本操作
  • 第4章MapReduce编程基础
  •     第1节 MapReduce思想与设计构思
  •     第2节MapReduce框架结构
  •     第3节MapReduce单词计数原理
  •     第4节 MapReduce单词计数源码分析
  •     第5节搭建MapReduce开发环境
  •     第6节 MapReduce单词计数编程实现
  •     第7节MapReduce实现XX与YY连接
  •     第8节MapReduce实现单词统计次数排序
  • 第5章HDFS JAVA API
  •     第1节列表目录或文件
  •     第2节创建目录
  •     第3节上传本地文件到HDFS
  •     第4节下载HDFS文件到本地文件系统
  •     第5节删除文件或目录
  •     第6节读取文件内容
  •     第7节 写数据到文件
  • 第6章MapReduce编程进阶
  •     第1节定义Partition实现用户统计结果按月存储
  •     第2节键值对类型简介
  •     第3节自定义键类型
  •     第4节 Combiner简介及应用
  •     第5节输入输出格式简介及应用
  •     第6节Configuration实现参数传递
  •     第7节 Configuration设置集群连接参数
  •     第8节ToolRunner辅助类
节数上课时间星期一 星期二星期三星期四 星期五星期六星期天
第1节08:00 - 08:40
第2节09:00 - 09:40
第3节10:00 - 10:40
第4节11:00 - 11:40
第5节14:00 - 14:40
第6节15:00 - 15:40
第7节16:00 - 16:40
第8节17:00 - 17:40
天数上课日期上课时间内容