首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 R语言数据高效处理指南
内容
作者简介
黄天元,复旦大学博士在读,R语言忠实爱好者。热爱数据科学与开源工具,致力于利用数据科学迅速积累行业经验和科学知识,涉猎内容包括信息计量、机器学习、数据可视化、统计建模、知识图谱等。已发表SCl论文两篇,开设有知乎专栏“R语言数据挖掘”。
目录
第1部分 基础知识
第1章 数据处理总论
1.1 数据处理的定义
1.2 数据处理的意义
1.3 数据处理基本工具
第2章 R语言编程基础
2.1 下载安装
2.2 包的使用
2.3 数据类型
2.4 数据结构
2.5 程序控制
2.6 函数式编程
第3章 数据处理基本范式
第2部分 快速入门
第4章 base-r:基本数据处理
4.1 数据集及其基本探索
4.2 基本范式实现
4.2.1 创建(read.csv/data.frame)
4.2.2 删除(rm)
4.2.3 检索(DF[i,j])
4.2.4 插入(rbind/cbind)
4.2.5 排序(order)
4.2.6 过滤(DF[condition,])
4.2.7 汇总(apply)
4.2.8 分组(aggregate)
4.2.9 连接(merge)
第5章 tidyverse 生态系统:简洁高效数据处理
5.1 tidyverse 生态系统简介
5.2 基本范式实现
5.2.1 包的加载(p_load)
5.2.2 创建(read_csv/tibble)
5.2.3 删除(rm)
5.2.4 检索(select/slice)
5.2.5 插入(add/bind)
5.2.6 排序(arrange)
5.2.7 过滤(filter)
5.2.8 汇总(summarise)
5.2.9 分组(group_by)
5.2.10 连接(join)
5.3 高级处理工具
5.3.1 长宽数据变换(gather/spread)
5.3.2 集合运算(intersect/union/setdiff)
5.3.3 窗口函数(rank/lead/lag/cum)
5.3.4 连接数据库:对SQL 的支持(dbplyr)
5.3.5 巧妙写函数:变量的引用
第3部分 高级进阶
第6章 data.table:高速数据处理
6.1 data.table 简介
6.2 基本范式实现
6.3 高级特性探索
第7章 sparklyr: 分布式数据处理
7.1 连接R 与Spark:sparklyr 包简介
7.2 基本操作指南
7.3 存储机制简介
7.4 分布式计算
第4部分 实战应用
第8章 航班飞行数据演练
8.1 nycflights13 数据集探索
8.2 flights14 数据集探索
第9章 测试
第10章 实用数据处理技巧
10.1 数据存取
10.1.1 令人头疼的编码格式(encoding)
10.1.2 读写性能竞速赛(fst/feather & data.table/readr)
10.1.3 数据存取转换的瑞士军刀(rio)
10.2 并行计算(doParallel)
10.3 混合编程
第11章 实战案例:网络爬虫与文本挖掘
11.1 网络爬取(rvest)
11.2 文本挖掘(tidytext)
第12章 实战案例:数据塑型与可视化(ggplot2)
12.1 数据准备
12.2 柱状图(geom_bar)
12.3 折线图(geom_line)
12.4 饼图(ggpie)
12.5 一行代码实现一页多图(gridExtra)
第13章 实战案例:机器学习
13.1 机器学习概述
13.2 为什么要做机器学习
13.3 如何入门机器学习
13.4 数据处理与机器学习
13.5 案例分析:信贷风险预测模型构建
致谢
内容推荐
R语言在近10年来已经发生了日新月异的变化,不仅在内容上更加丰富多彩,而且在计算效率上也有了大幅的提升。它被更加广泛地用于数据可视化、统计建模、机器学习等领域,而且还能实现网络爬虫、网络应用开发等功能,成为数据科学领域的全能型工具。R语言在学术界的地位已经不容置疑,在大数据时代中它是保证研究可重复性的重要工具。随着功能的日益完善,R语言已经进军工业界,并在金融、保险、医疗、生物和信息计量等不同的应用场景中大放异彩,潜力不可估量。
尽管R语言能够实现丰富多样的实际功能和框架,但是其本质是面向数据的,因此数据处理是R语言核心中的核心。如果能够掌握高效的数据操作技术,就能够在各类数据分析任务中如鱼得水。本书定位即为“R语言数据处理101”,希望R语言的使用者能够在较早的阶段就习得最基本而有效的数据处理基本技术。
本书读者群体包括在校的大学生、数据分析从业人员和致力于更加高效地处理数据的所有的R语言使用者。尽管对数据科学、计算机编程、统计学有一定基础会帮助理解本书的内容,但这不是必需的,来自包括初学者在内的各个层次的读者群体都能从本书中有所收获。读者在本书中不仅能够学到数据处理中的实用技术,还能培养在数据分析中的探索性思维。可以作为零基础学习数据分析的教程、进阶数据分析实用技巧的参考书、常备查询的案头工具书,以及具有一定趣味性的数据分析入门启蒙书。
标签
缩略图
书名 R语言数据高效处理指南
副书名
原作名
作者 黄天元
译者
编者
绘者
出版社 北京大学出版社
商品编码(ISBN) 9787301306086
开本 16开
页数 204
版次 1
装订 平装
字数 309
出版时间 2019-09-01
首版时间 2019-09-01
印刷时间 2019-09-01
正文语种
读者对象 普通大众
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 392
CIP核字 2019168616
中图分类号 TP312.8R-62
丛书名
印张 13.25
印次 1
出版地 北京
260
185
12
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号
版权提供者
定价
印数 4000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/20 1:32:58