图书介绍

Web文本挖掘技术理论与应用pdf电子书版本下载

何慧，陈博，张莹编著著
出版社：北京：电子工业出版社
ISBN：9787121298271
出版时间：2017
标注页数：101页
文件大小：13MB
文件页数：111页
主题词：数据采集－研究

PDF下载

PDF云下载[VIP在线云解压服务,PC-移动端高速直接下载PDF格式文件,方便快捷!]
种子下载[BT下载速度快] 温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：5387b409fabfd62ba21cbfde40f2d570

下载说明

Web文本挖掘技术理论与应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第1章概论 1

1.1 研究的背景和意义 1

1.2 文本挖掘相关技术概述及研究现状 2

1.2.1 文本分类概述及研究现状 3

1.2.2 文本聚类概述及研究现状 5

1.2.3 信息抽取概述及研究现状 6

1.2.4 文本检索概述及研究现状 7

1.3 文本挖掘领域亟待解决的问题 8

1.4 本书的研究内容与结构安排 11

参考文献 13

第2章基于统计语言模型的短文本计算 18

2.1 引言 18

2.2 文本信息处理基础知识 19

2.2.1 文本的表示 19

2.2.2 特征选择 21

2.3 基于N-gram的特征提取和RPCL的短文本聚类算法 22

2.3.1 相关工作 23

2.3.2 算法描述 23

2.3.3 实验及分析 28

2.4 小结 31

参考文献 31

第3章面向广告推荐和情感分析的Web文本信息抽取 35

3.1 引言 35

3.2 信息抽取常用算法和模型 36

3.2.1 N-gram语言模型 36

3.2.2 隐马尔可夫模型 37

3.2.3 最大熵模型 38

3.3 基于隐马尔科夫模型的半监督中文复合词抽取算法 41

3.3.1 相关工作 42

3.3.2 算法描述 42

3.3.3 实验及分析 46

3.4 基于最大熵和LMR模板的中文情感词抽取算法 48

3.4.1 相关工作 49

3.4.2 算法描述 50

3.4.3 实验及分析 51

3.5 小结 55

参考文献 55

第4章基于监督和半监督的文本情感分类 59

4.1 引言 59

4.2 常用的监督和半监督文本分类算法 60

4.2.1 常用文本分类算法 61

4.2.2 半监督文本分类算法 63

4.3 文本情感分类的研究现状 66

4.3.1 主客观分类 66

4.3.2 情感极性分类 66

4.4 基于带先验的最大熵歌词情感分类 68

4.4.1 相关工作 68

4.4.2 歌词语料集统计信息 69

4.4.3 算法描述 71

4.4.4 实验及分析 74

4.5 基于图的半监督学习文本情感分类算法 76

4.5.1 算法描述 77

4.5.2 实验及分析 79

4.6 小结 82

参考文献 82

第5章文本观点检索研究 89

5.1 引言 89

5.2 相关研究 89

5.3 文本观点检索系统设计与评测 90

5.3.1 COAE2008观点检索任务、数据及相关评测指标 91

5.3.2 文本观点检索系统 92

5.4 小结 96

参考文献 96

第6章总结与展望 99

6.1 本书的总结 99

6.2 未来的工作展望 101