图书介绍

海量网络学术文献自动分类研究pdf电子书版本下载

海量网络学术文献自动分类研究
  • 王效岳等著 著
  • 出版社: 北京:人民出版社
  • ISBN:9787010148472
  • 出版时间:2015
  • 标注页数:245页
  • 文件大小:25MB
  • 文件页数:264页
  • 主题词:计算机网络-情报检索-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

海量网络学术文献自动分类研究PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

绪论 1

第一章 网络爬虫 7

第一节 网络爬虫 7

一、开源网络爬虫工具 7

二、爬虫工具比较分析 15

第二节 Hadoop平台 18

一、Hadoop与其他系统的比较 18

二、Hadoop项目及结构 20

三、Hadoop分布式文件系统 24

四、MapReduce编程模型 31

五、Hadoop平台搭建 38

第二章 海量网络学术文献获取及并行处理模型 40

第一节 网络学术文献的主要来源及常用文件格式 40

一、网络学术文献的主要来源及特点 40

二、网络学术文献的常用文件格式 42

第二节 网络学术文献自动获取实验 44

一、实验环境 44

二、实验平台搭建 44

第三节 网络学术文献资源获取 50

一、网络学术文献获取方案 50

二、种子站点的选择 51

三、抓取任务的配置 53

四、文件类型和大小过滤 54

五、网络学术文献获取实验结果 56

第四节 网络学术文献资源判定 58

第五节 网络学术文献并行处理 64

一、数据预处理 64

二、并行处理 65

第六节 MapReduce任务优化 70

一、任务调度 70

二、任务数量 70

三、Combine函数 72

四、文件压缩 72

五、重用JVM 73

六、网络学术文献并行处理模块实验结果 74

第三章 本体集成 80

第一节 本体研究 80

一、本体概念 80

二、本体基本构成要素 81

三、本体类型 81

四、本体表示语言 82

第二节 本体库研究 83

一、国内外主要本体库 83

二、本体库比较分析 98

第三节 本体集成基本过程 106

第四节 本体集成工具 110

一、工具介绍 110

二、工具比较与分析 114

第五节 本体集成方法 116

一、基于形式概念分析(FCA)的本体集成方法 116

二、基于范畴论的本体集成方法 119

三、基于RDFS图闭包的本体集成方法 121

第四章 基于语义驱动文本自动分类研究 123

第一节 文档自动分类基本理论 123

一、文档自动分类基本概念 123

二、文档自动分类基本流程 124

三、文档自动分类性能评价指标 133

第二节 基于语义驱动文档自动分类概念 135

第三节 基于语义驱动文档自动分类实现基础 135

第四节 基于语义驱动文档自动分类方法模型 137

一、词向量空间构建 137

二、语义向量空间构建 138

第五章 基于本体集成的文档语义分类模型 144

第一节 SUMO和WordNet本体库概述 144

一、WordNet本体库 144

二、SUMO本体库 146

第二节 WordNet与SUMO本体库映射机制研究 149

一、映射动机 149

二、映射模型 151

三、映射实例 155

四、映射效果及应用分析 160

第三节 基于WordNet与SUMO本体集成文档语义分类模型设计与实现 163

一、实验平台构建 164

二、实验数据集及方法 165

三、集成本体库构建 166

四、词向量空间到概念向量空间的映射 168

五、概念向量空间通用化 171

六、分类模型训练与测试过程描述 173

七、实验评估指标 180

八、实验及结果分析 180

第六章 海量网络学术文献自动分类系统 184

第一节 海量网络学术文献自动分类系统 184

一、开发环境 185

二、海量网络学术文献自动获取模块 185

三、海量网络学术文献词—文档矩阵处理模块 187

四、本体集成模块 189

五、基于语义驱动的分类模块 190

第二节 海量网络学术文献自动分类系统实现 192

一、系统主要技术及标准 192

二、系统功能 193

第七章 总结及展望 196

第一节 总结 196

第二节 展望 198

附录A 200

附录B 205

附录C 217

附录D 223

参考文献 229

索引 240

后记 242

精品推荐