图书介绍

Spark快速数据处理pdf电子书版本下载

Spark快速数据处理
  • (美)凯洛著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111463115
  • 出版时间:2014
  • 标注页数:116页
  • 文件大小:12MB
  • 文件页数:134页
  • 主题词:数据处理软件-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

Spark快速数据处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 安装Spark以及构建Spark集群 1

1.1单机运行Spark 4

1.2在EC2上运行Spark 5

1.3在ElasticMapReduce上部署Spark 11

1.4用Chef(opscode)部署Spark 12

1.5在Mesos上部署Spark 14

1.6在Yam上部署Spark 15

1.7通过SSH部署集群 16

1.8链接和参考 21

1.9小结 21

第2章Spark shell的使用 23

2.1加载一个简单的text文件 24

2.2用Spark shell运行逻辑回归 26

2.3交互式地从S3加载数据 28

2.4小结 30

第3章 构建并运行Spark应用 31

3.1用sbt构建Spark作业 32

3.2用Maven构建Spark作业 36

3.3用其他工具构建Spark作业 39

3.4小结 39

第4章 创建SparkContext 41

4.1 Scala 43

4.2 Java 43

4.3 Java和Scala共享的API 44

4.4 Python 45

4.5链接和参考 45

4.6小结 46

第5章 加载与保存数据 47

5.1 RDD 48

5.2加载数据到RDD中 49

5.3保存数据 54

5.4连接和参考 55

5.5小结 55

第6章 操作RDD 57

6.1用Scala和Java操作RDD 58

6.2用Python操作RDD 79

6.3链接和参考 83

6.4小结 84

第7章Shark-Hive和Spark的综合运用 85

7.1为什么用Hive/Shark 86

7.2安装Shark 86

7.3运行Shark 88

7.4加载数据 88

7.5在Spark程序中运行HiveQL查询 89

7.6链接和参考 92

7.7小结 93

第8章 测试 95

8.1用Java和Scala测试 96

8.2用Python测试 103

8.3链接和参考 104

8.4小结 105

第9章 技巧和窍门 107

9.1日志位置 108

9.2并发限制 108

9.3内存使用与垃圾回收 109

9.4序列化 110

9.5 IDE集成环境 111

9.6 Spark与其他语言 112

9.7安全提示 113

9.8邮件列表 113

9.9链接和参考 113

9.10小结 114

精品推荐