图书介绍

基于支持向量机的聚类及文本分类关键技术研究pdf电子书版本下载

基于支持向量机的聚类及文本分类关键技术研究
  • 平源,周亚建,杨义先著 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115332691
  • 出版时间:2014
  • 标注页数:184页
  • 文件大小:55MB
  • 文件页数:193页
  • 主题词:信息泄漏-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

基于支持向量机的聚类及文本分类关键技术研究PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论 1

1.1 引言 1

1.2 机器学习理论 2

1.2.1 无监督学习 3

1.2.2 有监督学习 3

1.2.3 半监督学习 3

1.2.4 增强学习 4

1.3 支持向量机与聚类分析 4

1.4 支持向量机与文本分类 7

1.5 本书的主要工作 10

第2章 支持向量机技术基础 13

2.1 引言 13

2.2 统计学习理论 13

2.3 支持向量机技术 16

2.3.1 支持向量分类机 16

2.3.2 L2-支持向量机 19

2.3.3 多类问题的决策方法 21

2.3.4 支持向量回归机模型 23

2.3.5 支持向量机研究现状 24

2.4 支持向量聚类 29

2.4.1 支持向量聚类模型 29

2.4.2 影响支持向量聚类的关键因素 32

2.5 本章小结 40

第3章 双质心支持向量聚类 41

3.1 引言 41

3.2 噪声数据点消除策略 43

3.2.1 噪声数据分布结构分析 43

3.2.2 噪声数据消除算法 45

3.3 双质心簇标定策略 47

3.3.1 簇的分解策略 47

3.3.2 单组件双质心的构造 48

3.3.3 成员关系的判定规则 50

3.3.4 算法描述 51

3.4 DBC时间性能分析 52

3.5 聚类实验分析 53

3.5.1 数据集 53

3.5.2 实验对比算法 53

3.5.3 噪声数据消除实验 54

3.5.4 DBC聚类效果测试 57

3.5.5 DBC整体性能测试 59

3.5.6 DBC模型的半监督应用测试 60

3.6 本章小结 60

第4章 基于凸分解的簇标定算法 63

4.1 引言 63

4.2 基于凸分解的簇标定算法 64

4.2.1 簇在特征空间中的凸性质 64

4.2.2 支持超凸多面体的凸分解 65

4.2.3 凸包的标定算法 72

4.2.4 标定非凸包样本 76

4.3 CDCL算法时间性能分析 76

4.4 聚类实验分析 78

4.4.1 数据集 78

4.4.2 实验对比算法 79

4.4.3 CDCL算法适应能力分析 80

4.4.4 CDCL算法整体性能测试 82

4.5 本章小结 87

第5章 快速支持向量聚类算法 89

5.1 引言 89

5.2 快速支持向量聚类算法(FASVC) 90

5.2.1 选择簇边界样本 90

5.2.2 构造超球面 92

5.2.3 自适应的簇标定策略 96

5.2.4 FASVC算法的实现 97

5.3 FASVC时间性能及特点分析 99

5.3.1 FASVC时间性能分析 99

5.3.2 FASVC算法特点 100

5.4 聚类实验分析 101

5.4.1 数据集 102

5.4.2 实验对比算法 102

5.4.3 FASVC参数敏感性测试 103

5.4.4 FASVC算法整体性能测试 104

5.4.5 利用FASVC进行文本聚类 110

5.4.6 利用FASVC识别P2P流量 111

5.5 本章小结 112

第6章 基于支持向量机的多模式文本分类研究 113

6.1 引言 113

6.2 文本表示的关键问题与启示 114

6.2.1 场景1:特征的文档频率之外的信息 116

6.2.2 场景2:最大值保留的特征权重与特征的多类别分布信息 116

6.2.3 场景3:文本的结构信息 118

6.3 基于支持向量机的多模式文本分类方案 120

6.3.1 自适应的文本块划分算法 120

6.3.2 兼顾类别贡献度和类间区分度的特征权重方案 121

6.3.3 融合多类别倾向的特征类间区分能力强化方案 122

6.3.4 基于文本块重要性分布加权的特征频率方案 124

6.4 分类实验分析 125

6.4.1 数据集 125

6.4.2 实验对比方案 127

6.4.3 评价指标 129

6.4.4 CCE方案实验结果与分析 130

6.4.5 C2TCTVT算法框架实验结果与分析 135

6.4.6 NWET与N2WET组合方案实验结果与分析 145

6.5 本章小结 153

结束语 154

参考文献 158

名词索引 180

精品推荐