首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 大数据采集与预处理技术
内容
内容推荐
《大数据采集与预处理技术》以大数据关键技术为主线,重点介绍了大数据采集技术和数据预处理技术。《大数据采集与预处理技术》共7章。章为大数据概述,重点阐述了大数据的概念、大数据关键技术以及大数据采集和数据预处理的重要性,并对《大数据采集与预处理技术》内容进行了概述;第2章在阐述传统数据采集相关技术基础上,从数据发展出发,剖析了大数据采集的特点和相关技术;第3章介绍了常用的大数据采集架构;第4章介绍了针对系统数据来源复杂、数据量大的企业数据的大数据迁移技术;第5章介绍了互联网数据抓取与处理技术;第6章介绍了数据预处理技术,包括数据清洗、数据集成、数据变换和数据归约等技术;第7章首先阐述了Hadoop相关理论基础,然后以淘宝网数据为例,介绍了大数据从数据采集、数据预处理、数据分析以及数据可视化的综合应用实例。《大数据采集与预处理技术》可作为高等院校大数据相关专业的教学用书,也可以作为从事大数据相关工作的工程技术人员的参考用书。
目录
章 大数据概述
1.1 大数据的概念
1.2 大数据关键技术
1.3 大数据采集与数据预处理技术
1.3.1 大数据采集技术
1.3.2 数据预处理技术
1.4 小结
习题
第2章 数据采集基础
2.1 传统数据采集技术
2.1.1 数据采集概述
2.1.2 数据采集系统架构
2.1.3 数据采集关键技术
2.2 大数据采集基础
2.2.1 数据的发展
2.2.2 大数据来源
2.2.3 大数据采集技术
2.3 小结
习题
第3章 大数据采集架构
3.1 概述
3.2 chukwa数据采集
3.3 Flume数据采集
3.4 scribe数据采集
3.5 Kafka数据采集
3.6 小结
习题
第4章 大数据迁移技术
4.1 数据迁移概念
4.2 数据迁移相关技术
4.2.1 基于主机的迁移方式
4.2.2 基于存储的迁移方式
4.2.3 备份恢复的方式
4.2.4 基于主机逻辑卷的数据迁
4.2.5 基于数据库的迁移技术
4.2.6 服务器虚拟化的迁移
4.2.7 其他数据迁移技术
4.3 数据迁移工具
4.3.1 Apache Sqoop
4.3.2 ETL
4.4 Kettle数据迁移实例
4.5 小结
习题
第5章 互联网数据抓取与处理技术
5.1 网络爬虫概述
5.1.1 网络爬虫的概念
5.1.2 网络爬虫的抓取策略
5.1.3 网页更新策略
5.2 常用网络爬虫方法
5.2.1 批量型爬虫
……
标签
缩略图
书名 大数据采集与预处理技术
副书名
原作名
作者 刘丽敏,廖志芳,周筠 编
译者
编者
绘者
出版社 中南大学出版社
商品编码(ISBN) 9787548734116
开本
页数 176
版次 1
装订 平装
字数 301000
出版时间 2018-12-01
首版时间 2018-12-01
印刷时间
正文语种
读者对象
适用范围
发行范围
发行模式 实体书
首发网站
连载网址
图书大类 教育考试-考试-计算机类
图书小类
重量
CIP核字
中图分类号 TP274
丛书名
印张
印次
出版地
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/19 13:24:24