首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 Hadoop技术详解
内容
编辑推荐

如果你需要维护庞大而复杂的Hadoop集群,本书正是必备之选。如今,Hadoop正逐渐成为数据中心进行真正的大型数据处理的实际标准,业界对一本能详细介绍Hadoop操作技术的手册的需求也随之迅速上升。《Hadoop技术详解》的作者萨默系Cloudera公司的首席解决方案架构师,他将从规划、安装、配置系统到提供持续维护等方面展示在生产环境中运行Hadoop的详细情况。

本书是一本实用操作指南,因此并未介绍所有的技术细节,而是突出在关键部署中能起作用的各种操作。

内容推荐

Hadoop正在成为数据中心进行大型数据处理的实际标准,但市场中却一直缺少关于它的详细操作说明书。《Hadoop技术详解》作者萨默为Cloudera公司的首席架构师,全书将从计划、安装、配置Hadoop系统开始讲起,一直深入到系统调试、维护等方面的知识,向读者展示了Hadoop生产运行环境的详细情况。同时,《Hadoop技术详解》并不只是简述所有的操作工序,而是突出示范了关键部署中的关键操作。

《Hadoop技术详解》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。

目录

第1章 简介 

第2章 HDFS 

 2.1 目标和动机 

 2.2 设计 

 2.3 守护进程 

 2.4 读写数据 

2.4.1 数据读取流程 

2.4.2 数据写操作流程 

 2.5 管理文件系统元数据 

 2.6 NameNode的高可用性 

 2.7 NameNode联盟 

 2.8 访问与集成 

2.8.1 命令行工具 

2.8.2 用户空间文件系统(FUSE) 

2.8.3 表示状态传输(REST)的支持 

第3章 MapReduce 

 3.1 MapReduce的若干阶段 

 3.2 Hadoop MapReduce简介 

3.2.1 后台程序 

3.2.2 出错处理 

 3.3 YARN 

第4章 规划一个Hadoop集群 

 4.1 挑选Hadoop的发行版本 

4.1.1 Apache Hadoop 

4.1.2 Cloudera的Apache Hadoop发行版本 

4.1.3 版本和功能 

4.1.4 我应该使用哪个版本 

 4.2 硬件选型 

4.2.1 主节点硬件的选择 

4.2.2 工作节点的硬件选择 

4.2.3 集群的大小 

4.2.4 刀片服务器、存储区域网络(SAN)和虚拟化 

 4.3 操作系统的选择和准备 

4.3.1 部署规划 

4.3.2 软件 

4.3.3 主机名、DNS和标识 

4.3.4 用户、组和特权 

 4.4 内核调整 

4.4.1 vm.swappiness 

4.4.2 vm.overcommit_memory 

 4.5 磁盘配置 

4.5.1 选择文件系统 

4.5.2 挂载选项 

 4.6 网络设计 

4.6.1 Hadoop中的网络使用:回顾 

4.6.2 1 Gb与10 Gb网络 

4.6.3 典型的网络拓扑 

第5章 安装和配置 

 5.1 安装Hadoop 

5.1.1 Apache Hadoop 

5.1.2 CDH 

 5.2 配置概述 

 5.3 环境变量和Shell脚本 

 5.4 日志配置 

 5.5 HDFS 

5.5.1 识别和定位 

5.5.2 优化与调整 

5.5.3 格式化NameNode 

5.5.4 创建/tmp目录 

 5.6 NameNode的高可靠性 

5.6.1 隔离(Fencing)选项 

5.6.2 基本配置 

5.6.3 自动失效备援配置 

5.6.4 格式化和引导NameNode启动 

 5.7 NameNode联盟(Federation) 

 5.8 MapReduce 

5.8.1 识别和定位 

5.8.2 优化和调整 

 5.9 机架拓扑 

 5.10 安全 

第6章 用户标识、身份验证和授权 

 6.1 用户标识 

 6.2 Kerberos和Hadoop 

6.2.1 Kerberos 

6.2.2 Hadoop上的Kerberos支持 

 6.3 授权 

6.3.1 HDFS 

6.3.2 MapReduce 

6.3.3 其他工具和系统 

 6.4 集成试试 

第7章 资源管理 

 7.1 何谓资源管理 

 7.2 HDFS配额 

 7.3 MapReduce 调度器 

7.3.1 先进先出(FIFO)调度器 

7.3.2 公平调度器 

7.3.3 计算能力调度器(Capacity Scheduler) 

7.3.4 未来发展 

第8章 集群维护 

 8.1 Hadoop流程管理 

8.1.1 用初始化脚本管理进程 

8.1.2 手动管理进程 

 8.2 HDFS维护任务 

8.2.1 添加一个DataNode 

8.2.2 卸载DataNode 

8.2.3 用fsck来检查文件系统的一致性 

8.2.4 HDFS块数据均衡 

8.2.5 处理坏磁盘 

 8.3 MapReduce维护任务 

8.3.1 添加tasktracker 

8.3.2 卸载tasktracker 

8.3.3 终结MapReduce 作业 

8.3.4 终结MapReduce任务 

8.3.5 处理列入黑名单的tasktracker 

第9章 故障分析与排查 

 9.1 鉴别诊断(Differential Diagnosis) 

 9.2 故障和问题 

9.2.1 人类(自己) 

9.2.2 配置错误 

9.2.3 硬件故障 

9.2.4 资源枯竭 

9.2.5 主机标识和命名 

9.2.6 网络分区 

 9.3 “计算机插好了么?” 

 9.4 治疗和护理 

 9.5 实战案例 

9.5.1 神秘的瓶颈 

9.5.2 127.0.0.1这个地址不存在 

第10章 监控 

 10.1 概览 

 10.2 Hadoop度量(Metrics) 

10.2.1 Apache Hadoop 0.20.0和CDH3 (metrics1) 

10.2.2 Apache Hadoop 0.20.203及之后的版本、CDH4(metrics2) 

10.2.3 SNMP 

 10.3 健康监控 

10.3.1 主机级别的检查 

10.3.2 所有Hadoop进程 

10.3.3 HDFS检查 

10.3.4 MapReduce检查 

第11章 备份与恢复 

 11.1 数据备份 

11.1.1 分布式拷贝(distcp) 

11.1.2 并行提取数据 

 11.2 NameNode元数据 

附录 弃用的配置属性 

标签
缩略图
书名 Hadoop技术详解
副书名
原作名
作者 (美)萨默
译者 刘敏//麦耀锋//李冀蕾
编者
绘者
出版社 人民邮电出版社
商品编码(ISBN) 9787115333322
开本 16开
页数 248
版次 1
装订 平装
字数 334
出版时间 2013-12-01
首版时间 2013-12-01
印刷时间 2013-12-01
正文语种
读者对象 研究人员,普通成人
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 0.394
CIP核字 2013236386
中图分类号 TP274
丛书名
印张 16.5
印次 1
出版地 北京
234
179
12
整理
媒质 图书
用纸 普通纸
是否注音
影印版本 原版
出版商国别 CN
是否套装 单册
著作权合同登记号 图字:01-2013-3675号
版权提供者 O'Reilly Media,Inc.
定价
印数 4000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/14 20:41:36