首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 Hadoop大数据开发(大数据专业普通高等教育新工科人才培养规划教材)
内容
内容推荐
刘春阳、张学龙、刘丽军主编的《Hadoop大数据开发》通过原理加案例方式系统讲解了Hadoop大数据开发,精心安排了原理分析、环境搭建、案例开发等环节,使读者对解决大数据问题有清晰的思路。
全书共7章:前6章系统讲解大数据Hadoop架构,包括大数据处理平台Hadoop、分布式文件系统HDFS,并行计算模型MapReduce、资源调度框架Yam;第7章是MapReduce应用实例,通过案例帮助读者进一步理解Hadoop平台。全书突出三个特点:道理简单明了、思路清晰透彻、案例新颖实用。
本书可作为普通高校大数据相关专业的教材,可供想深入了解Hadoop架构编程的读者参考,还可作为相关培训班的培训教材。
目录
前言
第1章 大数据概论
1.1 大数据概述
1.1.1 大数据产生的时代背景
1.1.2 大数据的特征
1.1.3 大数据应用案例
1.1.4 大数据的机遇与挑战
1.2 大数据处理技术
1.3 大数据与云计算
1.4 本章小结
第2章 大数据处理平台Hadoop
2.1 Hadoop生态系统
2.2 Hadoop架构
2.2.1 HDFS
2.2.2 MapReduce
2.2.3 Yam
2.3 Hadoop版本变迁
2.3.1 Hadoop发展史
2.3.2 如何选择Hadoop开发版本
2.4 本章小结
第3章 Hadoop平台搭建
3.1 基础环境配置
3.2 Hadoop配置文件修改
3.3 Hadoop平台运行及验证
3.4 本章小结
第4章 分布式文件系统HDFS
4.1 HDFS架构
4.1.1 HDFS的基本框架
4.1.2 HDFS的特点
4.2 HDFS的工作机制
4.2.1 HDFS读写过程分析
4.2.2 NameNode的工作机制
4.2.3 元数据的CheckPoint
4.2.4 DataNode的工作机制
4.3 HDFS shell命令
4.3.1 帮助相关命令
4.3.2 查看相关命令
4.3.3 文件及目录相关命令
4.3.4 统计相关命令
4.3.5 快照命令
4.4 本章小结
第5章 HDFS Java API编程
5.1 远程开发环境搭建
5.2 HDFS.Java APl接口
5.3 IJDFS Java APl编程
5.3.1 获取文件系统
5.3.2 列出所有DataNode的名字信息
5.3.3 创建文件目录
5.3.4 删除文件或文件目录
5.3.5 查看文件是否存在
5.3.6 文件上传至HDFS
5.3.7 从HDFS下载文件
5.3.8 文件重命名
5.3.9 遍历目录和文件
5.3.10 根据filter获取目录下的文件
5.3.11 取得数据块所在的位置
5.4 程序打包
5.5 本章小结
第6章 并行计算MapReduce
6.1 MapReduce编程模型
6.1.1 并行编程模型概述
6.1.2 并行计算编程模型
6.1.3 MapReduce编程模型
6.2 MapReduce工作原理
6.3 Yarn
6.3.1 Yam基本框架与组件
6.3.2 Yam工作流程
6.3.3 新旧Hadoop MapReduce框架对比
6.4 MapReduce Shuffle性能调优
6.5 本章小结
第7章 MapReduce JavaAPI编程
7.1 MapReduce JavaAPI接口讲解
7.1.1 InputFormat接口
7.1.2 Mapper类
7.1.3 Partitioner类
7.1.4 Combiner类
7.1.5 Reducer类
7.1.6 OutputFormat接口
7.1.7 GenericOptionsParser类
7.1.8 DistributedCache类
7.2 MapReduce Java API应用实例
7.2.1 统计单词出现频率
7.2.2 统计出现的单词
7.2.3 统计平均成绩
7.2.4 排序
7.2.5 求年最高温度
7.2.6 关系运算——投影运算
7.2.7 关系运算——并运算
7.2.8 关系运算——交运算
7.2.9 关系运算——差运算
7.2.10 关系运算——连接运算
7.3 MapReduce Java API高级编程
7.3.1 多输入路径方式
7.3.2 使用Partitioner实现输出到多个文件
7.3.3 自定义OutputFormat文件输出
7.3.4 文本文件转化成XML文件
7.3.5 通过MultipleOutputs完成多文件输出
7.3.6 将MapReduce产生的结果集导入到MySQL中
7.3.7 自定义比较器
7.3.8 MapReduce分析明星微博数据
7.3.9 MapReduce最佳成绩统计
7.3.10 MapReduce链接作业
7.3.11 利用Job嵌套求解二度人脉
7.4 本章小结
附录 CentOS7安装
标签
缩略图
书名 Hadoop大数据开发(大数据专业普通高等教育新工科人才培养规划教材)
副书名
原作名
作者 刘春阳//张学龙//刘丽军
译者
编者 刘春阳//张学龙//刘丽军
绘者
出版社 中国水利水电出版社
商品编码(ISBN) 9787517069034
开本 16开
页数 176
版次 1
装订 平装
字数 280
出版时间 2018-09-01
首版时间 2018-09-01
印刷时间 2018-09-01
正文语种
读者对象 本科及以上
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 336
CIP核字 2018216857
中图分类号 TP274
丛书名
印张 11.5
印次 1
出版地 北京
260
185
9
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号
版权提供者
定价
印数 4000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/13 22:49:00