《数据挖掘算法实践与案例详解》丁兆云沈大勇徐伟周鋆机械工业出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

随着大数据和人工智能技术的发展，各行各业积累的数据越来越丰富，如何从这些数据中挖掘出有价值的信息，助力科学、合理的决策变得日益重要。数据挖掘技术可以从大量异构、随机数据中提取有用的信息和知识，已经广泛应用于工作和生活的各个领域。本书基于作者长期从事数据挖掘科研、工程和教学工作的经验编写而成，通过案例牵引，帮助读者掌握常用的数据挖掘算法、模型和技术，并解决常见的数据挖掘实际问题。
本书特点：
以实践为目标，系统介绍数据挖掘的流程，并给出代码实现。内容涵盖数据清洗、数据转换、数据降维、回归分析、聚类、神经网络分类等常用的数据挖掘技术和方法，使读者能够利用Python编程来解决基本的数据挖掘问题。
本书提供了丰富的案例，规模由小到大，帮助读者循序渐进地掌握各类数据挖掘模型和算法。掌握这些案例后，读者可以举一反三，进一步解决更复杂、更大规模的问题。
作者在中国大学MOOC上开设了“数据挖掘”MOOC课程（https://www.icourse163.org/course/NUDT-1461782176），并在头歌平台上开设了“数据挖掘”实验课程（https://www.educoder.net/paths/4153），读者可通过在线视频课程的学习、作业训练与编程实践加深对数据挖掘知识点的理解，提高运用能力。

目　　录 前言 第1章　绪论　　1 1.1　数据挖掘技术的由来　　1 1.2　数据挖掘的分类　　2 1.2.1　关联规则挖掘　　2 1.2.2　监督式机器学习　　3 1.2.3　非监督式机器学习　　4 1.3　Python的安装步骤　　5 1.3.1　Python环境的配置　　5 1.3.2　PyCharm的安装　　7 1.4　常见的数据集　　10 1.4.1　鸢尾花数据集　　10 1.4.2　员工离职预测数据集　　11 1.4.3　泰坦尼克号灾难预测数据集　　12 1.4.4　PM2.5空气质量预测数据集　　13 1.5　本章小结　　13 第2章　分类　　14 2.1　分类的概念　　14 2.2　分类中的训练集与测试集　　14 2.3　分类的过程及验证方法　　15 2.3.1　准确率　　15 2.3.2　k折交叉验证　　16 2.4　贝叶斯分类的编程实践　　17 2.4.1　鸢尾花数据集的贝叶斯分类　　17 2.4.2　基于贝叶斯分类的员工离职 预测　　17 2.5　本章小结　　19 第3章　数据的特征选择　　20 3.1　直方图　　20 3.1.1　直方图可视化　　20 3.1.2　直方图特征选择　　23 3.2　直方图与柱状图的差异　　24 3.3　特征选择实践　　26 3.4　本章小结　　29 第4章　数据预处理之数据清洗　　30 4.1　案例概述　　30 4.2　缺失值处理　　31 4.2.1　缺失值处理概述　　31 4.2.2　缺失值处理实例　　32 4.3　噪声数据处理　　32 4.3.1　正态分布噪声数据检测　　32 4.3.2　用箱线图检测噪声数据　　34 4.4　数据预处理案例实践　　35 4.4.1　问题　　35 4.4.2　解决方法　　35 4.4.3　实践结论　　37 4.5　本章小结　　38 第5章　数据预处理之转换　　39 5.1　数据的数值化处理　　39 5.1.1　顺序编码　　39 5.1.2　二进制编码　　40 5.2　数据规范化　　42 5.2.1　最小–优选规范化　　42 5.2.2　z分数规范化　　43 5.2.3　小数定标规范化　　43 5.3　本章小结　　43 第6章　数据预处理之数据降维　　44 6.1　散点图可视化分析　　44 6.2　主成分分析　　46 6.3　本章小结　　49 第7章　不平衡数据分类　　50 7.1　不平衡数据分类问题的特征　　50 7.1.1　数据稀缺问题　　50 7.1.2　噪声问题　　51 7.1.3　决策面偏移问题　　51 7.1.4　评价标准问题　　51 7.2　重采样方法　　51 7.2.1　上采样　　52 7.2.2　对上采样方法的改进　　53 7.2.3　下采样　　58 7.2.4　对下采样方法的改进　　60 7.2.5　不平衡问题的其他处理方式　　65 7.3　不平衡数据分类实践　　65 7.4　本章小结　　66 第8章　回归分析　　67 8.1　线性回归　　67 8.1.1　一元线性回归　　67 8.1.2　多元线性回归　　69 8.2　回归分析检测　　71 8.2.1　正态分布可能性检测　　71 8.2.2　线性分布可能性检测　　72 8.2.3　log转换后的分布　　73 8.3　回归预测案例实践　　74 8.3.1　案例背景　　74 8.3.2　代码实现　　74 8.4　本章小结　　82 第9章　聚类分析　　83 9.1　k均值聚类　　83 9.1.1　算法的步骤　　83 9.1.2　代码实现　　83 9.2　层次聚类　　84 9.2.1　算法的步骤　　84 9.2.2　代码实现　　85 9.3　密度聚类　　85 9.3.1　算法的步骤　　85 9.3.2　代码实现　　86 9.4　本章小结　　88 第10章　关联分析　　90 10.1　Apriori算法　　90 10.2　关联分析案例实践　　92 10.2.1　案例背景　　92 10.2.2　案例的数据集　　93 10.2.3　代码实现　　93 10.2.4　运行结果　　93 10.3　提升Apriori算法性能的方法　　95 10.4　本章小结　　95 第11章　KNN分类　　96 11.1　KNN算法的步骤　　96 11.2　KNeighborsClassifier函数　　97 11.3　KNN的代码实现　　98 11.4　结果分析　　98 11.5　KNN案例实践　　99 11.5.1　案例分析　　99 11.5.2　案例实现　　100 11.5.3　运行结果　　103 11.6　本章小结　　104 第12章　支持向量机　　105 12.1　支持向量机的可视化分析　　105 12.2　SVM的代码实现　　108 12.2.1　鸢尾花数据分类　　108 12.2.2　新闻文本数据分类　　110 12.3　本章小结　　111 第13章　神经网络分类　　112 13.1　多层人工神经网络　　112 13.2　多层人工神经网络的代码实现　　113 13.3　神经网络分类案例实践　　114 13.3.1　案例背景　　114 13.3.2　数据说明　　114 13.3.3　代码实现　　115 13.4　本章小结　　120 第14章　集成学习　　121 14.1　Bagging方法　　121 14.2　随机森林　　123 14.3　Adaboost　　125 14.4　GBDT　　127 14.4.1　GradientBoostingClassifier 函数　　130 14.4.2　GradientBoostingRegressor 函数　　130 14.5　XGBoost　　131 14.5.1　XGBClassifier函数　　131 14.5.2　XGBRegressor函数　　131 14.6　房价预测案例实践　　132 14.7　点击欺骗预测案例实践　　136 14.7.1　案例背景　　136 14.7.2　数据分析　　136 14.7.3　模型优化　　141 14.8　本章小结　　142 第15章　综合案例实践　　143 15.1　员工离职预测综合案例　　143 15.1.1　数据总览　　143 15.1.2　数据预处理　　144 15.1.3　模型构建与比较　　147 15.2　二手车交易价格预测综合 案例　　148 15.2.1　数据集简介　　148 15.2.2　数据总览　　149 15.2.3　数据预处理　　150 15.2.4　查看变量分布　　151 15.2.5　查看变量间的关系　　154 15.2.6　查看变量间的分布关系　　157 15.2.7　分析汽车注册月份与价格的 关系　　157 15.2.8　特征工程　　158 15.2.9　模型构建与训练　　160 15.3　信息抽取综合案例　　161 15.3.1　案例背景　　161 15.3.2　数据集简介　　165 15.3.3　模型的构建与训练　　165 15.3.4　模型评价　　168 15.4　学术网络节点分类　　169 15.4.1　数据集简介　　169 15.4.2　数据总览　　170 15.4.3　模型构建　　171 15.4.4　配置参数　　172 15.4.5　训练数据　　173 15.4.6　模型评价　　174

图书	数据挖掘算法实践与案例详解
内容	编辑推荐随着大数据和人工智能技术的发展，各行各业积累的数据越来越丰富，如何从这些数据中挖掘出有价值的信息，助力科学、合理的决策变得日益重要。数据挖掘技术可以从大量异构、随机数据中提取有用的信息和知识，已经广泛应用于工作和生活的各个领域。本书基于作者长期从事数据挖掘科研、工程和教学工作的经验编写而成，通过案例牵引，帮助读者掌握常用的数据挖掘算法、模型和技术，并解决常见的数据挖掘实际问题。本书特点：以实践为目标，系统介绍数据挖掘的流程，并给出代码实现。内容涵盖数据清洗、数据转换、数据降维、回归分析、聚类、神经网络分类等常用的数据挖掘技术和方法，使读者能够利用Python编程来解决基本的数据挖掘问题。本书提供了丰富的案例，规模由小到大，帮助读者循序渐进地掌握各类数据挖掘模型和算法。掌握这些案例后，读者可以举一反三，进一步解决更复杂、更大规模的问题。作者在中国大学MOOC上开设了“数据挖掘”MOOC课程（https://www.icourse163.org/course/NUDT-1461782176），并在头歌平台上开设了“数据挖掘”实验课程（https://www.educoder.net/paths/4153），读者可通过在线视频课程的学习、作业训练与编程实践加深对数据挖掘知识点的理解，提高运用能力。内容推荐数据挖掘算法为大数据与人工智能的核心，掌握数据挖掘各算法的编程实现，有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现，同时，本书以多个经典的数据挖掘赛题为案例，详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现，有助于提升读者面对实际数据问题时灵活运用各类算法能力。目录目　　录<br />前言<br />第1章　绪论　　1<br />1.1　数据挖掘技术的由来　　1<br />1.2　数据挖掘的分类　　2<br />1.2.1　关联规则挖掘　　2<br />1.2.2　监督式机器学习　　3<br />1.2.3　非监督式机器学习　　4<br />1.3　Python的安装步骤　　5<br />1.3.1　Python环境的配置　　5<br />1.3.2　PyCharm的安装　　7<br />1.4　常见的数据集　　10<br />1.4.1　鸢尾花数据集　　10<br />1.4.2　员工离职预测数据集　　11<br />1.4.3　泰坦尼克号灾难预测数据集　　12<br />1.4.4　PM2.5空气质量预测数据集　　13<br />1.5　本章小结　　13<br />第2章　分类　　14<br />2.1　分类的概念　　14<br />2.2　分类中的训练集与测试集　　14<br />2.3　分类的过程及验证方法　　15<br />2.3.1　准确率　　15<br />2.3.2　k折交叉验证　　16<br />2.4　贝叶斯分类的编程实践　　17<br />2.4.1　鸢尾花数据集的贝叶斯分类　　17<br />2.4.2　基于贝叶斯分类的员工离职<br />预测　　17<br />2.5　本章小结　　19<br />第3章　数据的特征选择　　20<br />3.1　直方图　　20<br />3.1.1　直方图可视化　　20<br />3.1.2　直方图特征选择　　23<br />3.2　直方图与柱状图的差异　　24<br />3.3　特征选择实践　　26<br />3.4　本章小结　　29<br />第4章　数据预处理之数据清洗　　30<br />4.1　案例概述　　30<br />4.2　缺失值处理　　31<br />4.2.1　缺失值处理概述　　31<br />4.2.2　缺失值处理实例　　32<br />4.3　噪声数据处理　　32<br />4.3.1　正态分布噪声数据检测　　32<br />4.3.2　用箱线图检测噪声数据　　34<br />4.4　数据预处理案例实践　　35<br />4.4.1　问题　　35<br />4.4.2　解决方法　　35<br />4.4.3　实践结论　　37<br />4.5　本章小结　　38<br />第5章　数据预处理之转换　　39<br />5.1　数据的数值化处理　　39<br />5.1.1　顺序编码　　39<br />5.1.2　二进制编码　　40<br />5.2　数据规范化　　42<br />5.2.1　最小–优选规范化　　42<br />5.2.2　z分数规范化　　43<br />5.2.3　小数定标规范化　　43<br />5.3　本章小结　　43<br />第6章　数据预处理之数据降维　　44<br />6.1　散点图可视化分析　　44<br />6.2　主成分分析　　46<br />6.3　本章小结　　49<br />第7章　不平衡数据分类　　50<br />7.1　不平衡数据分类问题的特征　　50<br />7.1.1　数据稀缺问题　　50<br />7.1.2　噪声问题　　51<br />7.1.3　决策面偏移问题　　51<br />7.1.4　评价标准问题　　51<br />7.2　重采样方法　　51<br />7.2.1　上采样　　52<br />7.2.2　对上采样方法的改进　　53<br />7.2.3　下采样　　58<br />7.2.4　对下采样方法的改进　　60<br />7.2.5　不平衡问题的其他处理方式　　65<br />7.3　不平衡数据分类实践　　65<br />7.4　本章小结　　66<br />第8章　回归分析　　67<br />8.1　线性回归　　67<br />8.1.1　一元线性回归　　67<br />8.1.2　多元线性回归　　69<br />8.2　回归分析检测　　71<br />8.2.1　正态分布可能性检测　　71<br />8.2.2　线性分布可能性检测　　72<br />8.2.3　log转换后的分布　　73<br />8.3　回归预测案例实践　　74<br />8.3.1　案例背景　　74<br />8.3.2　代码实现　　74<br />8.4　本章小结　　82<br />第9章　聚类分析　　83<br />9.1　k均值聚类　　83<br />9.1.1　算法的步骤　　83<br />9.1.2　代码实现　　83<br />9.2　层次聚类　　84<br />9.2.1　算法的步骤　　84<br />9.2.2　代码实现　　85<br />9.3　密度聚类　　85<br />9.3.1　算法的步骤　　85<br />9.3.2　代码实现　　86<br />9.4　本章小结　　88<br />第10章　关联分析　　90<br />10.1　Apriori算法　　90<br />10.2　关联分析案例实践　　92<br />10.2.1　案例背景　　92<br />10.2.2　案例的数据集　　93<br />10.2.3　代码实现　　93<br />10.2.4　运行结果　　93<br />10.3　提升Apriori算法性能的方法　　95<br />10.4　本章小结　　95<br />第11章　KNN分类　　96<br />11.1　KNN算法的步骤　　96<br />11.2　KNeighborsClassifier函数　　97<br />11.3　KNN的代码实现　　98<br />11.4　结果分析　　98<br />11.5　KNN案例实践　　99<br />11.5.1　案例分析　　99<br />11.5.2　案例实现　　100<br />11.5.3　运行结果　　103<br />11.6　本章小结　　104<br />第12章　支持向量机　　105<br />12.1　支持向量机的可视化分析　　105<br />12.2　SVM的代码实现　　108<br />12.2.1　鸢尾花数据分类　　108<br />12.2.2　新闻文本数据分类　　110<br />12.3　本章小结　　111<br />第13章　神经网络分类　　112<br />13.1　多层人工神经网络　　112<br />13.2　多层人工神经网络的代码实现　　113<br />13.3　神经网络分类案例实践　　114<br />13.3.1　案例背景　　114<br />13.3.2　数据说明　　114<br />13.3.3　代码实现　　115<br />13.4　本章小结　　120<br />第14章　集成学习　　121<br />14.1　Bagging方法　　121<br />14.2　随机森林　　123<br />14.3　Adaboost　　125<br />14.4　GBDT　　127<br />14.4.1　GradientBoostingClassifier<br />函数　　130<br />14.4.2　GradientBoostingRegressor<br />函数　　130<br />14.5　XGBoost　　131<br />14.5.1　XGBClassifier函数　　131<br />14.5.2　XGBRegressor函数　　131<br />14.6　房价预测案例实践　　132<br />14.7　点击欺骗预测案例实践　　136<br />14.7.1　案例背景　　136<br />14.7.2　数据分析　　136<br />14.7.3　模型优化　　141<br />14.8　本章小结　　142<br />第15章　综合案例实践　　143<br />15.1　员工离职预测综合案例　　143<br />15.1.1　数据总览　　143<br />15.1.2　数据预处理　　144<br />15.1.3　模型构建与比较　　147<br />15.2　二手车交易价格预测综合<br />案例　　148<br />15.2.1　数据集简介　　148<br />15.2.2　数据总览　　149<br />15.2.3　数据预处理　　150<br />15.2.4　查看变量分布　　151<br />15.2.5　查看变量间的关系　　154<br />15.2.6　查看变量间的分布关系　　157<br />15.2.7　分析汽车注册月份与价格的<br />关系　　157<br />15.2.8　特征工程　　158<br />15.2.9　模型构建与训练　　160<br />15.3　信息抽取综合案例　　161<br />15.3.1　案例背景　　161<br />15.3.2　数据集简介　　165<br />15.3.3　模型的构建与训练　　165<br />15.3.4　模型评价　　168<br />15.4　学术网络节点分类　　169<br />15.4.1　数据集简介　　169<br />15.4.2　数据总览　　170<br />15.4.3　模型构建　　171<br />15.4.4　配置参数　　172<br />15.4.5　训练数据　　173<br />15.4.6　模型评价　　174
标签
缩略图
书名	数据挖掘算法实践与案例详解
副书名
原作名
作者	丁兆云沈大勇徐伟周鋆
译者
编者
绘者
出版社	机械工业出版社
商品编码（ISBN）	9787111760696
开本	16开
页数	176
版次	1
装订
字数	290
出版时间	2025-01-01
首版时间
印刷时间	2025-01-01
正文语种
读者对象
适用范围
发行范围
发行模式	实体书
首发网站
连载网址
图书大类	教育考试-考试-计算机类
图书小类
重量
CIP核字
中图分类号	TP274
丛书名
印张
印次	1
出版地
长
宽
高
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	维多利亚女王：帝国女统治者的秘密传记高中化学/新版课程标准解析与教学指导我的白莲人设不能掉/檐上春著 AJ课标数学7下(北师版)/初中上分卷迪士尼经典快乐一起读·5分钟冒险故事故事中国图画书系列：孔子（平装绘本）丝绸之路艺术：从印度到敦煌·敦煌石窟卷无障碍法律生活101问 2025初级会计考试思维导图?初级会计实物+经济法基础丝绸之路艺术：从印度到敦煌·甘肃石窟卷暂AJ课标语文8下/非常海淀单元测试AB卷无中生有/卡通故事三十六计漫画中华:节日节气楹联名品齐白石楹联智趣寒假作业3年级数学人教版智趣寒假作业5年级英语科普版五官科护理(附光盘供护理专业用全国中等医药卫生职业教育十二五规划教材) 固体电子学导论（第3版）电子商务实务电子系统设计与实习精彩双语作文(初中卷) 纳米酶材料及其应用情景手工大全(时尚商业街幼儿园小学低年级适用)/大型场景式立体手工书无人机操控员电力巡检手册超声导波检测技术及应用天国：拯救（Kingdom Come: Deliverance）绘图风格地图人物图标MOD 天国：拯救（Kingdom Come: Deliverance）骑马自动第三人称MOD 天国：拯救（Kingdom Come: Deliverance）简单模式MOD 天国：拯救（Kingdom Come: Deliverance）玩家超重可以骑马MOD 天国：拯救（Kingdom Come: Deliverance）无限保存MOD 天国：拯救（Kingdom Come: Deliverance）v1.9.2十二项修改器MrAntiFun版天国：拯救（Kingdom Come: Deliverance）v1.2-v1.9.2十六项修改器风灵月影版[v20190719] 天国：拯救（Kingdom Come: Deliverance）v1.9.0十项修改器MrAntiFun版天国：拯救（Kingdom Come: Deliverance）v1.2-v1.9十六项修改器风灵月影版[v20190529] 天国：拯救（Kingdom Come: Deliverance）v1.8.1B十一项修改器MrAntiFun版洛基游戏麻雀连连看梦塔防魔法哈奇木石世纪缺氧泰亚史诗天之禁小李飞刀盘龙武十郎功勋红旗渠的儿女们再生缘之孟丽君传还君明珠红蜘蛛3：水中花之粉红帝国狂花凋落科幻大师 4400 第四季楚留香传奇