图书 | R语言数据分析与挖掘实战手册 |
内容 | 作者简介 程静,毕业于重庆大学,目前就职于西部估值优选的互联网公司猪八戒网,担任不错数据分析工程师,负责行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测,擅长大数据分析及数据挖掘的各种算法熟练使用R语言及Python语言。 目录 章R语言简介11R语言软件的安装与运行1111R语言软件的安装、启动与关闭1112R语言程辑包的安装和使用412R语言的数据结构6121R语言对象和类型6122向量7123数组和矩阵12124列表17125数据框20第2章数据的读取与保存21数据的读取24211读取内置数据集和文本文件24212读取Excel数据和CSV格式的数据30213读取R语言格式数据和网页数据33214读取其他格式的数据3422数据保存36221写出数据36222使用函数cat()37223保存为R语言格式文件38224保存为其他类型文件39第3章数据预处理31缺失值处理40311缺失值判断40312缺失模型判断44313常用处理方法4832数据整理53321数据合并53322选取子集56323数据转换59第4章数据的探索性分析41基本绘图函数6642探索单个变量74421单组数据的图形描述74422单组数据的描述性分析7943探索多个变量81431两组数据的图形描述81432多组数据的图形描述85433多组数据的描述性统计8844其他图像探索90第5章回归分析51一元线性回归94511模型简介94512函数介绍96513综合案例:iris数据集的一元回归建模9752多元线性回归99521模型简介99522综合案例:iris数据集的多元回归建模10053变量的选择105531逐步回归方法简介及函数介绍105532综合案例:swiss数据集的逐步回归建模106533岭回归的方法简介及函数介绍109534综合案例:longley数据集的岭回归探索110535lasso回归方法简介及函数介绍114536综合案例:longley数据集的lasso回归建模11554Logistic回归117541模型简介117542函数介绍119543综合案例:iris数据集的逻辑回归建模120第6章方差分析61单因素方差分析124611模型介绍124612函数介绍126613综合案例:不同治疗方法下胆固醇降低效果的差异性分析12762双因素方差分析130621模型介绍130622综合案例:不同剂量下老鼠妊娠重量的差异性分析13263协方差分析136631模型简介136632函数介绍136633综合案例:hotdog数据集的协方差分析137第7章主成分分析和因子分析71降维的基本方法:主成分分析139711理论基础:原始变量的线性组合139712模型介绍141713函数介绍143714综合案例:longley数据集的变量降维及回归144715综合案例:longley数据集的变量降维及回归(主成分回归)14872推广发展:因子分析150721理论基础:多个变量综合为少数因子150722模型介绍151723函数介绍153724综合案例:能力和智商测试的因子分析探索154第8章判别分析81距离判别法160811理论基础:离谁近,就属于谁160812函数介绍162813综合案例:基于距离判别的iris数据集分类16482Bayes判别法168821理论基础:先验概率与错判损失168822函数介绍170823综合案例:基于iris数据集的Bayes判别分析17183Fisher判别法171831理论基础:投影171832函数介绍173833综合案例:基于Fisher判别的iris数据集分类174第9章常规聚类分析91深入了解聚类分析178911差异与分类178912主流的聚类算法17992动态聚类180921聚类的基本过程180922函数介绍183923综合案例:基于随机生成序列的动态聚类18493层次聚类194931聚类的基本过程194932函数介绍197933综合案例:基于UScitiesD数据集的层次聚类19994密度聚类202941聚类的基本过程202942函数介绍202943综合案例:基于随机生成序列的密度聚类20395EM聚类204951聚类的基本过程205952函数介绍205953综合案例:基于iris数据集的EM聚类2060章关联规则101简单关联规则2101011基本概念与表示形式2101012评价简单关联规则的有效性和实用性211102序列关联规则2121021差异与基本概念2121022生成序列关联规则213103Apriori算法2141031算法介绍:挖掘频繁项集2141032函数介绍2151033综合案例:基于Titanic数据集的关联规则挖掘216104Eclat算法2241041算法介绍:自底向上的搜索2241042函数介绍2241043综合案例:基于美国人口调查数据的关联规则挖掘225105SPADE算法2301051算法介绍:基于序列格的搜索和连接2311052函数介绍2321053综合案例:基于zaki数据集的序列关联规则挖掘2331章神经网络111深入了解人工神经网络2391111生物神经元2401112人工神经元模型2411113人工神经网络种类2441114建立模型的一般步骤247112B-P反向传播网络2481121B-P反向传播网络模型2481122算法介绍2491123函数介绍250113综合案例:基于Boston数据的波士顿郊区房价预测建模252 内容推荐 本书系统地介绍了利用R 语言进行数据分析和挖掘的相关技术,采用由浅入深的框架体系:开篇伊始介绍R 语言的基础操作,进而介绍回归分析、方差分析等数据分析的方法,以更好地探索数据内部结构,获取数据所包含的信息;更重要的是为后续的数据挖掘提供理论依据;很后介绍典型数据挖掘工具和方法,采用理论基础到算法介绍到案例实战的布局,让读者深刻感知数据挖掘的精髓,在了解算法的同时更好地学以致用。 |
标签 | |
缩略图 | ![]() |
书名 | R语言数据分析与挖掘实战手册 |
副书名 | |
原作名 | |
作者 | 程静 |
译者 | |
编者 | |
绘者 | |
出版社 | 中国铁道出版社有限公司 |
商品编码(ISBN) | 9787113257453 |
开本 | 16开 |
页数 | 264 |
版次 | 1 |
装订 | 平装 |
字数 | 347千字 |
出版时间 | 2019-06-01 |
首版时间 | 2019-06-01 |
印刷时间 | 2019-06-01 |
正文语种 | |
读者对象 | |
适用范围 | |
发行范围 | |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 人文社科-社会科学-语言文字 |
图书小类 | |
重量 | |
CIP核字 | |
中图分类号 | TP312-62 |
丛书名 | |
印张 | |
印次 | 1 |
出版地 | 北京 |
长 | |
宽 | |
高 | 26cm |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。