图书介绍

Flume 构建高可用、可扩展的海量日志采集系统pdf电子书版本下载

Flume  构建高可用、可扩展的海量日志采集系统
  • (美)史瑞德哈伦著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121265587
  • 出版时间:2015
  • 标注页数:208页
  • 文件大小:25MB
  • 文件页数:227页
  • 主题词:数据采集

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

Flume 构建高可用、可扩展的海量日志采集系统PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 认识Apache Hadoop和Apache HBase 1

分布式文件系统HDFS 1

HDFS的数据格式 3

处理HDFS中的数据 4

Apache HBase 4

总结 5

参考文献 6

第2章 用Apache Flume处理流数据 7

我们需要Flume 7

Flume是否适合呢? 9

Flume Agent内部原理 10

配置Flume Agent 13

Flume Agent之间的相互通信 17

复杂的流 17

复制数据到不同目的地 20

动态路由 21

Flume的无数据丢失保证,Channel和事务 22

Flume Channel中的事务 23

Agent失败和数据丢失 25

批量的重要性 26

重复怎么样? 27

运行Flume Agent 27

总结 29

参考文献 30

第3章 源(Source) 31

Source的生命周期 31

Sink-to-Source通信 33

Avro Source 34

Thrift Source 37

RPC Sources的失败处理 39

HTTP Source 40

针对HTTP Source写处理程序 42

Spooling Directory Source 47

使用Deserializers读取自定义格式 50

Spooling Directory Source性能 55

Syslog Source 55

Exec Source 59

JMS Source 61

转换JMS消息为Flume事件 63

编写自定义Source 65

Event-Driven Source和Pollable Source 66

总结 73

参考文献 73

第4章 Channel 75

事务工作流 76

Flume自带的Channel 78

Memory Channel 78

File Channel 80

总结 86

参考文献 86

第5章 Sink 87

Sink的生命周期 88

优化Sink的性能 89

写入到HDFS:HDFS Sink 89

理解Bucket 90

配置HDFS Sink 93

使用序列化器控制数据格式 100

HBase Sink 106

用序列化器将Flume事件转换成HBase Put和Increment 108

RPC Sink 113

Avro Sink 113

Thrift Sink 115

Morphline Solr Sink 116

Elastic Search Sink 119

自定义数据格式 121

其他Sink:Null Sink、Rolling File Sink和Logger Sink 124

编写自定义Sink 125

总结 129

参考文献 129

第6章 拦截器、Channel选择器、Sink组和Sink处理器 131

拦截器 131

时间戳拦截器 132

主机拦截器 133

静态拦截器 133

正则过滤拦截器 134

Morphline拦截器 135

UUID拦截器 136

编写拦截器 137

Channel选择器 140

复制Channel选择器 140

多路复用Channel选择器 141

自定义Channel选择器 144

Sink组和Sink处理器 146

Load-Balancing Sink处理器 148

Failover Sink处理器 151

总结 153

参考文献 154

第7章 发送数据到Flume 155

构建Flume事件 155

Flume客户端SDK 156

创建Flume RPC客户端 157

RPC客户端接口 157

所有RPC客户端的公共配置参数 158

默认RPC客户端 165

Load-Balancing RPC客户端 168

Failover RPC客户端 171

Thrift RPC客户端 172

嵌入式Agent 173

配置嵌入式Agent 175

log4j Appender 180

Load-Balancing log4j Appender 181

总结 182

参考文献 183

第8章 规划、部署和监控Flume 185

规划一个Flume部署 185

修复时间 185

我的Flume Channel需要多少容量? 186

多少层? 186

通过跨数据中心链接发送数据 188

层分片 190

部署Flume 191

部署自定义代码 191

监控Flume 193

从自定义组件报告度量 196

总结 196

参考文献 196

索引 197

精品推荐