图书介绍

Spark Streaming 实时流处理入门与精通pdf电子书版本下载

Spark Streaming  实时流处理入门与精通
  • (美)苏密特·古普塔(Sumit Gupta) 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121310492
  • 出版时间:2017
  • 标注页数:170页
  • 文件大小:48MB
  • 文件页数:185页
  • 主题词:数据处理软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

Spark Streaming 实时流处理入门与精通PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 Spark和Spark Streaming的安装与配置 1

安装Spark 2

硬件需求 2

软件需求 4

安装Spark扩展——Spark Streaming 7

配置和运行Spark集群 8

你的第一个Spark程序 11

用Scala编码Spark作业 12

用Java开发Spark作业 15

管理员/开发者工具 18

集群管理 18

提交Spark作业 19

故障定位 20

配置端口号 20

类路径问题——类没有发现 20

其他常见异常 20

总结 21

第2章 Spark和Spark Streaming的体系结构与组件 23

批处理和实时数据处理的比较 24

批处理 24

实时数据处理 26

Spark的体系结构 28

Spark对比Hadoop 28

Spark的层次化结构 29

Spark Streaming的体系结构 31

Spark Streaming是什么 32

Spark Streaming的上层体系结构 32

你的第一个Spark Streaming程序 34

用Scala编码Spark Streaming作业 34

用Java编码Spark Streaming作业 37

客户端程序 39

打包和部署一个Spark Streaming作业 41

总结 43

第3章 实时处理分布式日志文件 45

Spark的封装结构和客户端API 46

Spark内核 48

Spark库及扩展 54

弹性分布式数据集及离散流 58

弹性分布式数据集 59

离散流 63

从分布的、多样的数据源中加载数据 65

Flume框架 67

Flume的安装和配置 69

配置Spark以接收Flume事件 73

封装和部署Spark Streaming作业 77

分布式日志文件处理的总体架构 77

总结 78

第4章 在流数据中应用Transformation 79

理解并应用Transformation功能 80

模拟日志流 80

功能操作 82

转换操作 89

窗口操作 91

性能调优 94

分块和并行化 94

序列化 94

Spark内存调优 95

总结 97

第5章 日志分析数据的持久化 99

Spark Streaming的输出操作 100

集成Cassandra 110

安装和配置Apache Cassandra 110

配置Spark 112

通过编写Spark作业将流式网页日志存入Cassandra 113

总结 120

第6章 与Spark高级库集成 121

实时查询流数据 122

了解Spark SQL 122

集成Spark SQL与流数据 129

图的分析——Spark GraphX 135

GraphX API介绍 137

集成Spark Streaming 140

总结 147

第7章 产品部署 149

Spark部署模式 150

部署在Apache Mesos上 151

部署在Hadoop或者YARN上 156

高可用性和容错性 160

单机模式下的高可用性 160

Mesos或者YARN下的高可用性 162

容错性 162

Streaming作业的监听 166

应用程序UI界面/作业UI界面 166

与其他监控工具的集成 169

总结 170

精品推荐