首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 机器学习基础--基于Python和scikit-learn的机器学习应用
内容
内容推荐
随着机器学习算法的普及,开发和优化这些算法的新工具也得到了发展。本书首先介绍了scikit-learn包,学习如何使用scikit-learn语法;学习监督模型和无监督模型之间的差异,以及为每个数据集选择适当算法的重要性;学习将无监督聚类算法应用到真实的数据集中,发现其中的规律,并在探索中解决无监督机器学习问题。其次,本书重点研究监督学习算法,学习如何使用scikit-learn包实现不同的监督算法以及如何开发神经网络架构;还将了解如何采用合乎逻辑的结果分析,并通过调节超参数来改善算法的性能。
本书理论讲解与练习实例相结合,并通过大量的活动指导读者进行真实数据集的模拟训练。学完本书将知道如何描述监督模型和无监督模型之间的差异,以及如何将一些流行的算法应用于现实生活中的数据集中,将获得诸多技能并有信心编写机器学习算法。
本书面向机器学习领域的新手和希望学习如何使用scikit-learn库开发机器学习算法的开发人员。读者需要具备Python编程方面的一些知识和经验,但不需要任何关于scikit-learn或机器学习算法的先验知识。
作者简介
海特·萨拉赫(Hyatt Saleh),一名企业管理者、人工智能领域的设计者和践行者。大学毕业后,她发现了数据分析在认知和解决现实生活中问题的重要性。从那时起,她就开始自学,她不但作为自由职业者为世界上许多机器学习领域的公司工作,而且还成立了一家旨在优化日常生活流程的人工智能公司。
目录
第1章 scikit-learn简介
1.1 scikit-learn
1.1.1 scikit-learn的优点
1.1.2 scikit-learn的缺点
1.2 数据表示
1.2.1 数据表
1.2.2 特征矩阵和目标矩阵
1.2.3 练习1:加载实例数据集并创建特征矩阵和目标矩阵
1.2.4 活动1:选择目标特征并创建一个目标矩阵
1.3 数据预处理
1.3.1 混乱的数据
1.3.2 练习2:处理混乱的数据
1.3.3 处理分类特征
1.3.4 练习3:在文本数据上应用特征工程
1.3.5 重新缩放数据
1.3.6 练习4:归一化和标准化数据
1.3.7 活动2:预处理整个数据集
1.4 scikit-learn API
1.5 监督学习和无监督学习
1.5.1 监督学习
1.5.2 无监督学习
1.6 小结
第2章 无监督学习:Real-Life应用
2.1 聚类
2.1.1 聚类类型
2.1.2 聚类的应用
2.2 探索数据集:批发客户数据集
2.3 数据可视化
2.3.1 使用Pandas加载数据集
2.3.2 可视化工具
2.3.3 练习5:从noisy circles数据集中绘制一个特征的直方图
2.3.4 活动3:使用数据可视化来帮助预处理过程
2.4 k-means算法
2.4.1 理解算法
2.4.2 练习6:在数据集上导入和训练k-means算法
2.4.3 活动4:将k-means算法应用于数据集
2.5 mean-shift算法
2.5.1 理解算法
2.5.2 练习7:在数据集上导入和训练mean-shift算法
2.5.3 活动5:将mean-shift算法应用于数据集
2.6 DBSCAN算法
2.6.1 理解算法
2.6.2 练习8:在数据集上导入和训练DBSCAN算法
2.6.3 活动6:将DBSCAN算法应用于数据集
2.7 聚类性能的评估
2.7.1 scikit-learn的可用指标
2.7.2 练习9:评估Silhouette Coefficient分数和Calinski-Harabasz指数
2.7.3 活动7:测量和比较算法的性能
2.8 小结
第3章 监督学习:关键步骤
3.1 模型验证和测试
3.1.1 数据拆分
3.1.2 拆分比
3.1.3 练习10:对实例数据集进行数据拆分
3.1.4 交叉验证
3.1.5 练习11:使用交叉验证将训练集拆分为训练集和验证集
3.1.6 活动8:对手写数字数据集的数据拆分
3.2 评估指标
3.2.1 分类任务的评估指标
3.2.2 练习12:在分类任务上计算不同的评估指标
3.2.3 评估指标的选择
3.2.4 回归任务的评估指标
3.2.5 练习13:计算回归任务的评估指标
3.2.6 活动9:评估在手写数据集上训练的模型的性能
3.3 错误分析
3.3.1 偏差、方差、数据不匹配
3.3.2 练习14:计算不同数据集的错误率
3.3.3 活动10:对经过训练的手写数字识别模型执行错误分析
3.4 小结
第4章 监督学习算法:预测年收入
4.1 探索数据集
4.2 朴素贝叶斯算法
4.2.1 朴素贝叶斯算法的工作原理
4.2.2 练习15:朴素贝叶斯算法应用
4.2.3 活动11:为人口收入普查数据集训练朴素贝叶斯模型
4.3 决策树算法
4.3.1 决策树算法的工作原理
4.3.2 练习16:决策树算法应用
4.3.3 活动12:为人口收入普查数据集训练决策树模型
4.4 支持向量机算法
4.4.1 支持向量机算法的工作原理
4.4.2 练习17:支持向量机算法应用
4.4.3 活动13:为人口收入普查数据集训练支持向量机模型
4.5 错误分析
4.6 小结
第5章 人工神经网络:预测年收入
5.1 人工神经网络
5.1.1 它们是如何工作的
5.1.2 理解超参数
5.1.3 应用程序
5.1.4 局限性
5.2 应用人工神经网络
5.2.1 scikit-learn的多层感知器
5.2.2 练习18:多层感知器分类器的应用
5.2.3 活动14:为人口收入普查数据集训练多层感知器
5.3 性能分析
5.3.1 错误分析
5.3.2 超参数微调
5.3.3 模型比较
5.3.4 活动15:比较不同模型以选择最适合人口收入普查数据问题的方法
5.4 小结
第6章 建立自己的程序
6.1 项目的定义
6.1.1 制定计划:关键阶段
6.1.2 了解数据集
6.1.3 活动16:执行银行营销数据集的准备和创建阶段
6.2 存储并加载一个经过训练的模型
6.2.1 存储模型
6.2.2 练习19:存储经过训练的模型
6.2.3 加载模型
6.2.4 练习20:加载存储的模型
6.2.5 活动17:存储并加载银行营销数据集的最终模型
6.3 与经过训练的模型交互
6.3.1 练习21:创建一个类和一个通道来与经过训练的模型交互
6.3.2 活动18:允许与银行营销数据集模型交互
6.4 小结
附录
第1章:scikit-learn简介
活动1:选择目标特征并创建一个目标矩阵
活动2:预处理整个数据集
第2章:无监督学习:Real-Life应用
活动3:使用数据可视化来辅助预处理过程
活动4:将k-means算法应用于数据集
活动5:将
标签
缩略图
书名 机器学习基础--基于Python和scikit-learn的机器学习应用
副书名
原作名
作者 (美)海特·萨拉赫
译者 译者:邹伟
编者
绘者
出版社 中国水利水电出版社
商品编码(ISBN) 9787517085065
开本 16开
页数 183
版次 1
装订 平装
字数 228
出版时间 2020-11-01
首版时间 2020-11-01
印刷时间 2020-11-01
正文语种
读者对象
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 360
CIP核字 2020057699
中图分类号 TP181
丛书名
印张 12.25
印次 1
出版地 北京
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数 5000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/5 14:42:56