图书介绍
信毅学术文库 跨语言信息检索中的双语主题模型及算法研究pdf电子书版本下载
- 罗远胜著 著
- 出版社: 上海:复旦大学出版社
- ISBN:9787309119435
- 出版时间:2015
- 标注页数:177页
- 文件大小:49MB
- 文件页数:194页
- 主题词:情报检索-研究
PDF下载
下载说明
信毅学术文库 跨语言信息检索中的双语主题模型及算法研究PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
1引言 1
1.1 研究背景和意义 1
1.1.1 研究背景 1
1.1.2 研究意义 2
1.2 国内外研究现状 4
1.2.1 跨语言信息检索的概念 4
1.2.2 跨语言检索方法研究 8
1.2.3 跨语言文本分类方法研究 12
1.2.4 跨语言文本聚类方法研究 16
1.2.5 研究现状述评 19
1.3 主要研究内容 20
1.4 本书的基本结构 22
1.5 本章小结 24
2基于双语主题空间的跨语言信息检索总体框架 25
2.1 相关理论概述 25
2.1.1 常用信息检索模型 25
2.1.2 偏最小二乘统计理论 31
2.2 跨语言检索问题的提出 33
2.3 基于双语主题空间的CLIR总体框架 34
2.3.1 基本思路 34
2.3.2 总体框架 35
2.3.3 跨语言检索过程 37
2.3.4 跨语言文本分类过程 38
2.3.5 跨语言文本聚类过程 39
2.4 本章小结 40
3面向跨语言信息检索的中英平行语料库构建 41
3.1 相关工作 41
3.2 构建中英语料库的基本流程 46
3.3 中英平行语料库构建 49
3.3.1 中英平行语料库 49
3.3.2 跨语言信息检索评测语料库 49
3.3.3 跨语言文本分类评测语料库 53
3.3.4 构建TREC-9中英平行语料库 53
3.4 本章小结 54
4基于主题对偶空间的跨语言检索模型 55
4.1 相关工作和问题的提出 55
4.2 主题对偶空间的构建 58
4.3 主题对偶空间模型的推导和算法实现 61
4.3.1 模型推导 61
4.3.2 算法设计 64
4.3.3 算法复杂度分析 67
4.4 实验结果和分析 68
4.4.1 实验设计方案 68
4.4.2 中英文词的翻译结果分析 71
4.4.3 TDS模型抽取双语主题结果分析 75
4.4.4 文档配对搜索性能对比分析 79
4.4.5 跨语言检索性能对比分析 81
4.4.6 模型参数敏感性分析 88
4.5 本章小结 94
5跨语言中的双语主题相关性检索模型 95
5.1 问题的提出 95
5.2 双语主题空间的构建 96
5.3 BiTC模型的推导和算法分析 98
5.3.1 模型推导 98
5.3.2 BiTC模型的跨语言信息检索过程 101
5.3.3 算法复杂度分析 102
5.4 实验结果和分析 103
5.4.1 实验设计方案 103
5.4.2 BiTC模型抽取双语相关主题结果分析 105
5.4.3 文档配对搜索性能对比分析 109
5.4.4 伪查询跨语言检索性能对比分析 113
5.4.5 TREC-9中英平行文档集上的性能分析 119
5.5 本章小结 120
6基于双语语义对应分析的跨语言文本分类/聚类方法 121
6.1 相关工作和问题的提出 121
6.2 方法推导和算法实现 124
6.2.1 方法推导 124
6.2.2 跨语言文本分类……聚类过程 125
6.2.3 算法复杂度分析 127
6.3 实验结果和分析 128
6.3.1 实验设计方案 128
6.3.2 小数据集举例分析 131
6.3.3 BiSCAN抽取的双语主题数对分类性能的影响 134
6.3.4 各方法的跨语言文本分类性能对比分析 137
6.3.5 跨语言文本聚类性能对比分析 142
6.4 本章小结 148
7总结与展望 149
7.1 本书总结 149
7.2 研究展望 152
参考文献 154
后记 176