软件 | OpenRefine(数据清洗工具) v2.6 for Linux 官方免费版(附使用教程) |
内容 |
OpenRefine v2.6 for Linux版是一款非常简单易用的专业数据优化和清洗工具,所谓的数据清洗就是检查数据库中无用和错误的地方然后进行修正,支持残缺数据、错误数据以及重复数据的搜索和清洗,旨在提高数据库的结构化和规范化,小编还为大家带来了OpenRefine的安装和使用教程供大家参考,需要此款工具的朋友们欢迎前来下载使用。 安装方法 1、OpenRefine在Windows的安装 下载ZIP包 解压到某个目录; 要运行OpenRefine,双击openrefine.exe文件。 2、OpenRefine在Mac的安装 下载DMG文件 打开磁盘镜像,拖动OpenRefine的图标到Applications目录; 双击图标以启动OpenRefine。 下载gzipped包 解压到当前用户的home目录; 在终端命令行环境,键入./refine以启动OpenRefine。 使用说明 首先我们得载入数据文件 打开Open Refine, 点击屏幕左侧的“新建项目” (Create Project) 先点击“这台电脑” (This Computer),然后点击“选择文件”(Choose Files)。 在你的数据文件中选择UniversityData.csv。你就会看到数据。 该文件中有些中文文字(列的名字)。如果中文显示不对,你也许需要告诉Open Refine使用正确的字符集。要做到这一点,点击“字符编码” (Character encoding) 旁边的空白空间,从中选择UTF-8。 然后点击右边的“新建项目” (Create Project) 键。 你可以看到country (“国家”)这一列中, 国家名字不统一。例如,美国即叫 United States,也叫USA。我们要通过创立一个文字归类, 让Open Refine 给我们看 country 一列中所有的值。摁下 country 旁边的小下箭头,选择 归类 Facet -> 文本归类 Text Facet。 片刻后,该归类中所有国家的值就会在屏幕左侧显示出来。 你可以看到美国有多个不同叫法, 还有一些错误的名字,比如有一行美国叫United States ), 还有一个捏造的国家叫Utopia(乌托邦)!每个不同的国家名叫一个归类, Open Refine 给你显示了每一个归类里有多少行数据。 点击任何归类名字,你会只看到那个归类里的行。在我们这个例子里,你只会看到那些国家列里数据和你点击的名字相符的行。 你只要点击任何一个归类名,就能对其进行编辑。现在我们来把美国所有不同的叫法都变成United States。 你鼠标指向 US 这一归类时,一个的“编辑”edit 选项就会出现。点击该 编辑 edit。 请打入United States, 然后点击 应用 Apply。 现在所有是 US 的2609行都变成了United States。 对每一个别的叫法都同样进行编辑,直到美国所有的叫法都变成United States。 你做完后,你的归类应该如下: |
标签 | OpenRefine,数据清洗 |
缩略图 | ![]() |
软件名称 | OpenRefine(数据清洗工具) v2.6 for Linux 官方免费版(附使用教程) |
软件图标 | |
软件大小 | 36.2MB |
发布时间 | |
软件平台 | |
软件语言 | 简体中文 |
软件授权 | 免费软件 |
操作系统 | Windows平台 |
系统类型 | |
用户评分 | 3 |
软件版本 | |
官方网站 | |
官方网址 | |
软件截图 | |
软件总类 | 电脑游戏 |
软件大类 | 软件下载-系统工具-系统其它-OpenRefine2.6下载 |
软件小类 | 系统其它 |
开发者 | |
主办单位名称 | |
ICP备案名 | |
备案号 | |
使用年龄 | |
下载链接 | ![]() |
攻略教程 | |
详细介绍 | |
操控设备 | |
隐私政策 | |
查看权限 | |
敏感权限获取说明 | |
软件类型 | 国产软件 |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于使用电脑或刷手机。 |
随便看 |
|
传承兰台文化,共同保存历史记忆!兰台网收藏软件、游戏、图片、图书、电影、电视剧等互联网档案,是免费和可借阅文本、电影、音乐等档案的数字图书馆。