首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 文本数据挖掘与Python应用/大数据与人工智能技术丛书
内容
内容推荐
本书共分为7章,内容包括文本挖掘概念、文本挖掘预处理技术、文本表示模型、文本分类、文本聚类、文本关联分析及其简单的应用,利用Python语言进行文本数据分析,将文本挖掘的理论与实践相结合。本书用通俗的语言和实例解释了抽象的概念,将抽象概念融合到具体的案例中,便于读者理解和掌握。在编写过程中,力求做到语言精练、概念清晰、取材合理、深入浅出、突出应用。
本书可作为高等院校相关课程的教材及从事相关研究的入门读本,也可作为从事相关技术研发人员的参考书籍。
作者简介
刘金岭,教授,硕士生导师。至2007年以来进行文本数据挖掘的研究,在专业核心期刊发表相关论文30多篇,EI检索4篇,SCCSI检索3篇。在2010-2013年与江苏移动公司合作进行垃圾短信处理研究,2009-2011完成市级科研课题“基于语义的垃圾短信分类器设计与实现(HAG09061)”。
目录
第1章 绪论
1.1 文本挖掘的研究背景及意义
1.2 文本挖掘的国内外研究现状
1.3 文本挖掘概述
1.3.1 文本挖掘的概念
1.3.2 文本挖掘的任务
1.3.3 文本挖掘与数据挖掘的联系与区别
1.4 文本挖掘的过程
1.5 文本挖掘的主要研究领域
1.5.1 文本特征选择
1.5.2 文本结构分析
1.5.3 文本摘要
1.5.4 文本分类
1.5.5 文本聚类
1.5.6 文本关联分析
1.5.7 分布分析与趋势预测
1.6 文本挖掘在制药行业的应用案例
习题
第2章 文本切分及特征词选择
2.1 文本数据采集
2.1.1 软件接口对接方式
2.1.2 开放数据库方式
2.1.3 基于底层数据交换的数据直接采集方式
2.1.4 网络爬虫采集网页数据
2.2 语料库与词典简介
2.2.1 语料库
2.2.2 词典
2.3 文本切分
2.3.1 句子切分
2.3.2 词汇切分
2.4 文本特征词选择
2.4.1 文本特征词选择概述
2.4.2 常用的文本特征词选择方法
2.5 Python jieba分词模块及其用法
2.5.1 jieba方法
2.5.2 基于规则的中文分词
2.5.3 关键词提取
习题
第3章 文本表示模型
3.1 文本预处理
3.1.1 原始数据处理
3.1.2 文本预处理简述
3.2 向量空间模型
3.2.1 向量空间模型的概念
3.2.2 文本向量的相似度
3.2.3 向量模型的Python实现
3.3 概率模型
3.3.1 概率模型概述
3.3.2 概率建模方法
3.3.3 文本信息检索中的概率模型
3.3.4 概率模型的Python实现
3.4 概率主题模型
3.4.1 概率主题模型概述
3.4.2 PLSA概率主题模型
3.4.3 LDA概率主题模型
3.4.4 LDA概率主题模型的Python实现
习题
第4章 文本分类
4.1 文本分类概述
4.1.1 研究的意义
4.1.2 国内外研究现状与发展趋势
4.1.3 文本分类的定义
4.1.4 文本分类流程
4.1.5 文本分类预处理
4.2 常用文本分类器
4.2.1 KNN分类器
4.2.2 SVM分类器
4.2.3 Rocchio分类器
4.2.4 朴素贝叶斯分类器
4.2.5 决策树分类器
4.3 分类模型的性能评估
4.3.1 分类评价方法
4.3.2 分类性能评价指标
习题
第5章 文本聚类
5.1 文本聚类概述
5.1.1 研究的意义
5.1.2 国内外研究现状与发展趋势
5.1.3 文本聚类的定义
5.1.4 文本聚类流程
5.1.5 对聚类算法的性能要求
5.2 文本聚类原理与方法
5.2.1 基于划分的方法
5.2.2 基于层次的方法
5.2.3 基于密度的方法
5.2.4 基于网格的方法
5.2.5 基于模型的方法
5.3 文本聚类评估
5.3.1 估计聚类趋势
5.3.2 确定簇数
5.3.3 测定聚类质量
习题
第6章 文本关联分析
6.1 关联规则挖掘概述
6.2 文本关联规则
6.2.1 关联规则的基本概念
6.2.2 关联规则分类
6.3 关联规则挖掘算法
6.3.1 Apriori算法
6.3.2 FPGrowth算法
习题
第7章 利用Python处理文本数据简单应用
7.1 情感分析
7.1.1 情感分析原理
7.1.2 算法设计
7.1.3 算法实现
7.2 自动生成关键词和摘要
7.2.1 TextRank算法
7.2.2 生成关键词和摘要
7.3 使用SnowNLP进行商品评价
7.3.1 SnowNLP库简介
7.3.2 SnowNLP商品评价
7.4 生成“词云”
7.4.1 “词云”的概念
7.4.2 Python“词云”图的生成
习题
参考文献
标签
缩略图
书名 文本数据挖掘与Python应用/大数据与人工智能技术丛书
副书名
原作名
作者
译者
编者 刘金岭//钱升华
绘者
出版社 清华大学出版社
商品编码(ISBN) 9787302557869
开本 16开
页数 183
版次 1
装订 平装
字数 279
出版时间 2021-03-01
首版时间 2021-03-01
印刷时间 2021-03-01
正文语种
读者对象 普通大众
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 365
CIP核字 2020105314
中图分类号 TP274
丛书名
印张 12.25
印次 1
出版地 北京
260
185
10
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号
版权提供者
定价
印数 1500
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/8 20:14:55