图书介绍

数据挖掘 概念、模型、方法和算法pdf电子书版本下载

数据挖掘  概念、模型、方法和算法
  • (美)Mehmed Kantardzic著;闪四清等译 著
  • 出版社: 北京:清华大学出版社
  • ISBN:7302067775
  • 出版时间:2003
  • 标注页数:309页
  • 文件大小:19MB
  • 文件页数:320页
  • 主题词:数据采集-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘 概念、模型、方法和算法PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据挖掘的概念 1

1.1 概述 1

1.2 数据挖掘的起源 3

1.3 数据挖掘过程 5

1.3.1 陈述问题和阐明假设 5

1.3.2 数据收集 6

1.3.3 数据预处理 6

1.3.4 模型评估 7

1.3.5 解释模型和得出结论 7

1.4 大型数据集 8

1.5 数据仓库 12

1.6 本书的结构 14

1.7 复习题 15

1.8 参考书目 16

第2章 数据准备 17

2.1 原始数据的表述 17

2.2 原始数据的特性 20

2.3 原始数据的转换 22

2.4 丢失数据 24

2.5 时间相关数据 25

2.6 异常点分析 29

2.7 复习题 32

2.8 参考书目 33

第3章 数据归约 35

3.1 大型数据集的维度 35

3.2 特征归约 37

3.3 特征排列的熵度量 41

3.4 主成分分析 43

3.5 值归约 45

3.6 特征离散化:ChiMerge技术 48

3.7 案例归约 51

3.8 复习题 54

3.9 参考书目 55

第4章 从数据中学习 57

4.1 机器学习 58

4.2 统计学习原理 62

4.3 学习方法的类型 67

4.4 常见的学习任务 68

4.5 模型估计 72

4.6 复习题 76

4.7 参考书目 77

第5章 统计方法 78

5.1 统计推断 78

5.2 评测数据集的差异 80

5.3 贝叶斯定理 82

5.4 预测回归 84

5.5 方差分析 89

5.6 对数回归 92

5.7 对数-线性模型 93

5.8 线性判别分析 96

5.9 复习题 98

5.10 参考书目 99

第6章 聚类分析 101

6.1 聚类概念 101

6.2 相似度的度量 104

6.3 凝聚层次聚类 108

6.4 分区聚类 112

6.5 增量聚类 114

6.6 复习题 117

6.7 参考书目 119

第7章 决策树和决策规则 120

7.1 决策树 121

7.2 C4.5算法:生成一个决策树 122

7.3 未知属性值 128

7.4 修剪决策树 132

7.5 C4.5算法:生成决策规则 133

7.6 决策树和决策规则的局限性 136

7.7 关联分类方法 137

7.8 复习题 140

7.9 参考书目 142

第8章 关联规则 144

8.1 购物篮分析 144

8.2 APRIORI算法 146

8.3 从频繁项集得到关联规则 148

8.4 提高APRIORI算法的效率 149

8.5 频繁模式增长方法(FP-增长方法) 151

8.6 多维关联规则挖掘 153

8.7 WEB挖掘 154

8.8 HITS和LOGSOM算法 156

8.9 挖掘路径遍历模式 161

8.10 文本挖掘 164

8.11 复习题 167

8.12 参考书目 169

第19章 人工神经网络 171

9.1 人工神经元的模型 172

9.2 人工神经网络的结构 176

9.3 学习过程 177

9.4 学习任务 181

9.5 多层感知机 183

9.6 竞争网络和竞争学习 189

9.7 复习题 193

9.8 参考书目 195

第10章 遗传算法 196

10.1 遗传算法的基本原理 197

10.2 用遗传算法进行优化 198

10.3 遗传算法的一个简单例证 203

10.4 图式(SCHEMATA) 208

10.5 旅行推销员问题 210

10.6 使用遗传算法的机器学习 212

10.7 复习题 216

10.8 参考书目 217

第11章 模糊集和模糊逻辑 219

11.1 模糊集 219

11.2 模糊集的运算 224

11.3 扩展原理和模糊关系 229

11.4 模糊逻辑和模糊推理系统 233

11.5 多因子评价 237

11.6 从数据中提取模糊模型 239

11.7 复习题 244

11.8 参考书目 246

第12章 可视化方法 247

12.1 感知和可视化 247

12.2 科学可视化和信息可视化 248

12.3 平行坐标 253

12.4 放射性可视化 256

12.5 KOHONEN自组织映射 258

12.6 数据挖掘的可视化系统 259

12.7 复习题 263

12.8 参考书目 264

第13章 参考书目 266

附录A 数据挖掘工具 281

附录B 数据挖掘应用 300

精品推荐