首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 商战数据挖掘
内容
内容推荐
数据挖掘是现代企业从数据中提取有用信息、获取竞争优势的重要方法。针对数据科学的这一商业应用,本书进行了深入解读,不仅详细介绍了数据挖掘的环节、常用分析技术和基本模型,还提供了数据科学解决方案的提案示例和评估指南。同时,为了便于读者理解,本书不仅分析了大量商业示例,在业务情景下阐释数据挖掘的基本概念和原理,还使用大量图表辅助解释数学细节。因此,读者无需专业数学背景即可阅读本书。
目录
赞誉xiii


前言xv


章绪论:数据分析式思维1


1.1数据机遇无处不在1


1.2案例:飓风Frances2


1.3案例:预测用户流失3


1.4数据科学、数据工程和数据驱动型决策4


1.5数据处理和“大数据”6


1.6从大数据1.0到大数据2.06


1.7数据与数据科学能力:一种战略性资产7


1.8数据分析式思维9


1.9关于本书10


1.10重新审视数据挖掘和数据科学11


1.11数据科学:一门新兴的实验性学科12


1.12小结12


第2章商业问题及其数据科学解决方案14


2.1从商业问题到数据挖掘任务14


2.2有监督方法与无监督方法17


2.3数据挖掘及其结果18


2.4数据挖掘流程19


2.4.1业务理解环节20


2.4.2数据理解环节21


2.4.3数据准备环节22


2.4.4建模环节22


2.4.5评估环节23


2.4.6部署环节24


2.5管理数据科学团队的含义25


2.6其他分析技巧与技术26


2.6.1统计26


2.6.2数据库查询27


2.6.3数据仓库28


2.6.4回归分析28


2.6.5机器学习与数据挖掘28


2.6.6运用以上技术解决商业问题29


2.7小结30


第3章预测建模导论:从相关性到有监督的划分31


3.1建模、归纳与预测32


3.2有监督的划分35


3.2.1选取富信息属性36


3.2.2示例:基于信息增益进行属性选择42


3.2.3使用树形结构模型进行有监督的划分46


3.3划分的可视化52


3.4把树视作规则组53


3.5概率估计54


3.6示例:用树型归纳解决用户流失问题56


3.7小结59


第4章用模型拟合数据61


4.1根据数学函数分类62


4.1.1线性判别函数64


4.1.2目标函数的最优化66


4.1.3示例:基于数据挖掘线性判别式67


4.1.4用线性判别函数对实例进行评分和排序68


4.1.5支持向量机简介69


4.2通过数学函数进行回归71


4.3类概率估计和逻辑“回归”73


4.4示例:对比逻辑回归和树型归纳77


4.5非线性方程、支持向量机和神经网络81


4.6小结83


第5章避免过拟合84


5.1泛化能力84


5.2过拟合85


5.3过拟合检验86


5.3.1保留数据和拟合图86


5.3.2树型归纳的过拟合问题88


5.3.3数值函数的过拟合问题89


5.4示例:线性函数的过拟合90


5.5*示例:过拟合为何有害95


5.6从保留评估到交叉验证96


5.7用户流失数据集回顾99


5.8学习曲线100


5.9避免过拟合与控制复杂度101


5.9.1树型归纳中的过拟合规避102


5.9.2避免过拟合的一般方法102


5.9.3*参数优化中的过拟合规避104


5.10小结106


第6章相似性、近邻和簇107


6.1相似性和距离108


6.2最近邻推理109


6.2.1示例:威士忌分析110


6.2.2用最近邻来进行预测建模111


6.2.3近邻的数量及其影响113


6.2.4几何解释、过拟合和复杂度控制115


6.2.5最近邻方法的问题118


6.3与相似性和最近邻相关的一些重要技术细节119


6.3.1混合属性119


6.3.2*其他距离函数120


6.3.3*组合函数:计算近邻的评分122


6.4聚类124


6.4.1示例:威士忌分析回顾124


6.4.2层次聚类125


6.4.3最近邻回顾:根据形心的聚类128


6.4.4示例:对商业新闻报道进行聚类132


6.4.5理解聚类结果135


6.4.6*用有监督学习产生簇描述136


6.5退一步:解决业务问题与数据探索139


6.6小结140


第7章决策分析思维(一):如何评估一个模型142


7.1对分类器的评估143


7.1.1简单准确率的问题143


7.1.2混淆矩阵144


7.1.3样本类别不均衡的问题144


7.1.4成本收益不均衡的问题147


7.2分类问题的推广147


7.3一个重要的分析框架:期望值148


7.3.1用期望值规范分类器的使用148


7.3.2用期望值规范分类器的评估149


7.4评估、基线性能以及对数据投资的意义155


7.5小结157


第8章模型性能的可视化159


8.1排序,而不是分类159


8.2利润曲线161


8.3ROC图像和曲线163


8.4ROC曲线下面积168


8.5累积响应曲线和提升曲线168


8.6示例:用户流失模型的性能分析171


8.7小结177


第9章证据和概率179


9.1示例:向线上目标用户投放广告179


9.2根据概率合并证据181


9.2.1联合概率与独立性181


9.2.2贝叶斯法则182


9.3将贝叶斯法则应用到数据科学中183


9.3.1条件独立和朴素贝叶斯184


9.3.2朴素贝叶斯的优劣势186


9.4证据“提升度”的模型187


9.5示例:Facebook“点赞”的证据提升度188


9.6小结190


0章文本的表示和挖掘191


10.1为什么文本很重要192


10.2为什么文本很难处理192


10.3表示法193


10.3.1词袋模型193


10.3.2词频193


10.3.3度量稀疏度:逆文档频率195


10.3.4TFIDF196


10.4示例:爵士音乐家197


10.5*IDF和熵的关系200


10.6词袋模型之外的方法202


10.6.1n-grams序列202


10.6.2命名实体提取202


10.6.3主题模型203


10.7示例:通过挖掘新闻报道预测股价变动204


10.7.1任务204


10.7.2数据205


10.7.3数据处理207


10.7.4结果208


10.8小结211


1章决策分析思维(二):面向分析工程212


11.1为慈善机构寻找最佳捐赠人213


11.1.1期望值框架:分解商业问题,重组解决方案213


11.1.2简短的题外话:选择性偏差214


11.2更复杂的用户流失示例回顾215


11.2.1期望值框架:构建更复杂的商业问题215


11.2.2评估激励的影响216


11.2.3从期望值分解到数据科学解决方案217


11.3小结219


2章其他数据科学任务与技术220


12.1共现和关联:寻找匹配项221


12.1.1度量意外:提升度和杠杆率221


12.1.2示例:啤酒和彩票222


12.1.3Facebook点赞的关联223


12.2用户画像:寻找典型行为225


12.3链路预测和社交推荐229


12.4数据约简、潜在信息和电影推荐230


12.5偏差、方差和集成方法233


12.6数据驱动的因果解释和一个病毒式营销示例235


12.7小结236


3章数据科学和经营战略237


13.1数据分析式思维,终极版237


13.2用数据科学取得竞争优势238


13.3用数据科学保持竞争优势239


13.3.1令人敬畏的历史优势240


13.3.2独一无二的知识产权240


13.3.3独一无二的无形抵押资产240


13.3.4优秀的数据科学家241


13.3.5优秀的数据科学管理242


13.4吸引和培养数据科学家及其团队243


13.5检验数据科学案例分析244


13.6做好准备,接受来源各异的创意245


13.7做好准备,评估数据科学项目提案245


13.7.1数据挖掘提案示例246


13.7.2BigRed提案中的缺陷246


13.8企业的数据科学成熟度247


4章总结250


14.1数据科学的基本概念250


14.1.1将基本概念应用于新问题:挖掘移动设备数据252


14.1.2改变对商业问题解决方案的思考方式253


14.2数据做不到的:圈中人回顾254


14.3隐私、道德和挖掘个人数据256


14.4数据科学是否还有更多内容257


14.5最后一例:从众包到云包257


14.6最后的话258


附录A提案评估指南259


附录B另一个提案示例262


参考文献265


术语表273


关于作者278
标签
缩略图
书名 商战数据挖掘
副书名
原作名
作者 (美) 福斯特·普罗沃斯特, 汤姆·福西特
译者
编者
绘者
出版社 人民邮电出版社
商品编码(ISBN) 9787115522337
开本 16开
页数 278
版次 1
装订 平装
字数 443000
出版时间 2019-12
首版时间 2019-12-01
印刷时间 2019-12-01
正文语种
读者对象
适用范围
发行范围
发行模式 实体书
首发网站
连载网址
图书大类 教育考试-考试-计算机类
图书小类
重量
CIP核字
中图分类号 TP274
丛书名
印张
印次 1
出版地
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价 89.00
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/8 15:55:53