图书介绍
数据挖掘前沿问题pdf电子书版本下载
- 吴喜之,马景义,吕晓玲等著 著
- 出版社: 北京:中国统计出版社
- ISBN:9787503756399
- 出版时间:2009
- 标注页数:138页
- 文件大小:6MB
- 文件页数:150页
- 主题词:数据采集
PDF下载
下载说明
数据挖掘前沿问题PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据挖掘概论 1
1.1 引言 1
1.2 统计学家和计算机学家从不同角度看数据挖掘 2
1.3 数据源 4
1.4 数据挖掘的应用 5
第2章 传统统计面对的挑战 7
2.1 统计的黑匣子特性 7
2.2 统计从数学继承了什么 9
2.3 传统的数据建模在应用中所遇到的问题 10
2.4 算法建模 11
2.5 回到统计的最初宗旨 13
第3章 常用算法建模概述 14
3.1 引言 14
3.2 关联规则分析 14
3.3 最近邻方法 20
3.4 人工神经网络 24
3.5 支持向量机 29
3.6 VC维数和误差界限 37
第4章 决策树 41
4.1 引言 41
4.2 决策树的构建 45
4.3 不纯度 45
4.4 ID3和C4.5算法 47
4.5 CART算法 49
4.6 CHAID方法 55
第5章 模型评价 61
5.1 引言 61
5.2 贝叶斯规则 62
5.3 模型评价——再论CART 63
5.4 推广误差和期望推广误差 67
5.5 推广误差和期望推广误差的估计 70
第6章 Bagging预测方法 72
6.1 Bagging方法简介 72
6.2 分类问题的Bagging算法 72
6.3 回归问题的Bagging算法 76
6.4 Out-of-Bag(OOB)估计 79
6.5 讨论 80
第7章 Boosting预测方法 82
7.1 AdaBoost算法 82
7.2 自适应重新抽样 84
7.3 AdaBoost算法的性质 86
7.4 可加模型:从统计的角度看AdaBoost 90
7.5 梯度下降提升算法 92
7.6 分类问题的不同损失函数及LogitBoost分类算法 96
7.7 回归问题的不同损失函数及L2-Boosting回归方法 101
7.8 讨论 103
第8章 随机森林 106
8.1 子模型h(x;Θm) 107
8.2 随机森林用于分类的案例 107
8.3 分类问题中随机森林算法预测精度 111
8.4 随机森林算法用于回归问题 115
8.5 随机森林中的OOB估计 117
8.6 再析随机森林算法 119
8.7 自适应随机森林算法 126
参考文献 133