首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 网络数据爬取与分析实务(电子商务应用型专业系列教材)
内容
内容推荐
李周平编著的《网络数据爬取与分析实务》按照网络数据爬取、数据清洗与处理、数据存储、数据分析的逻辑脉络,介绍了数据科学的相关知识。全书主要内容涉及理论、实战、工具三个层面。其中,理论层面主要介绍了网络爬虫,数据处理与存储,机器学习的相关概念、原理与算法;实战层面主要通过影评、二手房、招聘网站等实战项目,阐述了数据爬取、处理与存储的代码实现,并通过相关数据集的实例,介绍了机器学习算法的实现与效果评估;工具层面主要讲解了如何通过Python的Urllib、Request、BeaulifulSoup、Pandas、Scikit一learn等第三方工具包实现数据的爬取、处理与分析,以及通过SQLite这一轻量级数据库工具实现数据的存储。
本书可作为高校开设数据科学相关课程的教学用书,也可供数据科学相关方向初学者的学习参考。
作者简介
李周平,上海财经大学博士,网络与软件工程师,现任上海商学院信息与计算机学院教师。长期从事网络爬虫、数据挖掘、机器学习、自然语言处理、Python程序开发等方面的教学和培训工作,具有十余年的Python项目开发经验,获得多项软件专利。
目录
第1章 数据科学概述
1.1 什么是数据科学
1.1.1 数据科学的概念
1.1.2 数据科学的处理流程
1.2 数据分析师、数据工程师与数据科学家
1.2.1 数据分析师
1.2.2 数据工程师
1.2.3 数据科学家
第2章 Python语法基础
2.1 Python的程序结构
2.1.1 Python文件类型
2.1.2 包、模块、函数结构
2.2 Python编码规范
2.2.1 通过缩进规范编码的层次关系
2.2.2 代码注释
2.2.3 语句的分隔
2.2.4 变量赋值及作用范围
2.3 Python编程环境的搭建
2.3.1 Python的版本
2.3.2 Python集成开发工具
2.3.3 JupyterNotebook的使用
2.4 Python的数据结构
2.4.1 列表(List)
2.4.2 字典(Dictionarv)
2.4.3 元组(Tuple)
2.5 Python控制语句
2.5.1 条件选择语句
2.5.2 循环语句
2.5.3 异常处理语句
习题
第3章 使用Urllib库编写爬虫
3.1 网络爬虫概述
3.1.1 什么是网络爬虫
3.1.2 为什么要学习网络爬虫技术
3.1.3 聚焦爬虫的基本原理
3.2 使用Urllib.request模块编写爬虫
3.2.1 Urllib库简介
3.2.2 编写第一个爬虫程序
3.2.3 urlopen()函数超时设置
3.3 修改User-Agent属性模拟浏览器访问
3.3.1 认识HTTP协议的User-Agent属性
3.3.2 修改User-Agent属性的方法
3.4 HTTP协议详解
3.4.1 HTTP请求与应答过程
3.4.2 HTTP请求格式
3.5 模拟HTTP—GET方法的爬虫
3.6 模拟HTTP-POST方法的爬虫
3.6.1 Urllib.request.Request类
3.6.2 POST请求过程
3.6.3 爬虫模拟POST登录请求
习题
第4章 使用正则表达式提取数据
4.1 正则表达式原理
4.2 正则表达式语法
4.2.1 正则表达式的构成
4.2.2 贪婪与懒惰模式
4.3 re模块常用的函数
4.3.1 常用的匹配函数
第5章 使用BeautifulSoup库提取数据
第6章 爬虫项目实战
第7章 Pandas数据处理基础
第8章 Pandas数据处理常用方法
第9章 数据处理实战
第10章 SQLite数据库操作
第11章 机器学习概述
第12章 从线性回归到分类
第13章 分类模型及应用
第14章 分类模型的评估
标签
缩略图
书名 网络数据爬取与分析实务(电子商务应用型专业系列教材)
副书名
原作名
作者 李周平
译者
编者 李周平
绘者
出版社 上海交通大学出版社
商品编码(ISBN) 9787313200327
开本 16开
页数 244
版次 1
装订 平装
字数 301
出版时间 2018-09-01
首版时间 2018-09-01
印刷时间 2018-09-01
正文语种
读者对象 普通大众
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 422
CIP核字 2018196162
中图分类号 TP311.561
丛书名
印张 16.25
印次 1
出版地 上海
240
170
10
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/17 14:55:36