图书介绍

套路 机器学习 北美数据科学家的私房课pdf电子书版本下载

套路  机器学习  北美数据科学家的私房课
  • 林荟著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121326585
  • 出版时间:2017
  • 标注页数:316页
  • 文件大小:54MB
  • 文件页数:334页
  • 主题词:数据管理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

套路 机器学习 北美数据科学家的私房课PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 白话数据科学 1

1.1 什么是数据科学 3

1.2 什么是数据科学家 5

1.2.1 数据科学家需要的技能 6

1.2.2 数据科学算法总结 10

1.3 数据科学可以解决什么问题 20

1.3.1 前提要求 20

1.3.2 问题种类 22

1.4 小结 25

第2章 数据集 26

2.1 服装消费者数据 26

2.2 航空公司满意度调查 33

2.3 生猪疫情风险预测数据 37

第3章 数据分析流程 41

3.1 从问题到数据 42

3.2 从数据到信息 44

3.3 从信息到行动 46

第4章 数据预处理 47

4.1 介绍 47

4.2 数据清理 50

4.3 缺失值填补 52

4.3.1 中位数或众数填补 53

4.3.2 K-近邻填补 54

4.3.3 装袋树填补 56

4.4 中心化和标量化 56

4.5 有偏分布 59

4.6 处理离群点 63

4.7 共线性 66

4.8 稀疏变量 70

4.9 编码名义变量 71

4.10 小结 73

第5章 数据操作 75

5.1 数据读写 76

5.1.1 取代传统数据框的tibble对象 76

5.1.2 高效数据读写:readr包 80

5.1.3 数据表对象读取 83

5.2 数据整合 91

5.2.1 base包:apply() 91

5.2.2 plyr包:ddply()函数 93

5.2.3 dplyr包 96

5.3 数据整形 102

5.3.1 reshape2包 102

5.3.2 tidyr包 105

5.4 小结 107

第6章 基础建模技术 109

6.1 有监督和无监督 109

6.2 误差及其来源 111

6.2.1 系统误差和随机误差 111

6.2.2 因变量误差 117

6.2.3 自变量误差 121

6.3 数据划分和再抽样 122

6.3.1 划分训练集和测试集 123

6.3.2 重抽样 131

6.4 小结 135

第7章 模型评估度量 136

7.1 回归模型评估度量 136

7.2 分类模型评估度量 139

7.2.1 Kappa统计量 141

7.2.2 ROC曲线 143

7.2.3 提升图 145

7.3 小结 146

第8章 特征工程 148

8.1 特征构建 149

8.2 特征提取 152

8.2.1 初步探索特征 153

8.2.2 主成分分析 158

8.2.3 探索性因子分析 163

8.2.4 高维标度化 167

8.2.5 知识扩展:3种降维特征提取方法的理论 171

8.3 特征选择 177

8.3.1 过滤法 178

8.3.2 绕封法 188

8.4 小结 195

第9章 线性回归及其衍生 196

9.1 普通线性回归 197

9.1.1 最小二乘线性模型 197

9.1.2 回归诊断 201

9.1.3 离群点、高杠杆点和强影响点 203

9.2 收缩方法 205

9.2.1 岭回归 205

9.2.2 Lasso 209

9.2.3 弹性网络 212

9.3 知识扩展:Lasso的变量选择功能 213

9.4 主成分和偏最小二乘回归 214

9.5 小结 221

第10章 广义线性模型压缩方法 222

10.1 初识glmnet 223

10.2 收缩线性回归 227

10.3 逻辑回归 235

10.3.1 普通逻辑回归 235

10.3.2 收缩逻辑回归 236

10.3.3 知识扩展:群组Lasso逻辑回归 239

10.4 收缩多项回归 243

10.5 泊松收缩回归 246

10.6 小结 249

第11章 树模型 250

11.1 分裂准则 252

11.2 树的修剪 256

11.3 回归树和决策树 260

11.4 装袋树 268

11.5 随机森林 273

11.6 助推法 277

11.7 知识扩展:助推法的可加模型框架 283

11.8 知识扩展:助推树的数学框架 286

11.8.1 数学表达 286

11.8.2 梯度助推数值优化 289

11.9 小结 290

第12章 神经网络 292

12.1 投影寻踪回归(Projection Pursuit Regression) 293

12.2 神经网络(Neural Networks) 296

12.3 神经网络拟合 299

12.4 训练神经网络 300

12.5 用caret包训练神经网络 302

12.6 小结 311

参考文献 312

精品推荐