图书介绍

Storm实时数据处理pdf电子书版本下载

Storm实时数据处理
  • (澳)安德森著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111466635
  • 出版时间:2014
  • 标注页数:191页
  • 文件大小:24MB
  • 文件页数:206页
  • 主题词:数据处理软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

Storm实时数据处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 搭建开发环境 1

1.1 简介 1

1.2 搭建开发环境 1

1.3 分布式版本控制 3

1.4 创建“Hello World”Topology 6

1.5 创建Stom集群——配置机器 12

1.6 创建Storm集群——配置Storm 18

1.7 获取基本的点击率统计信息 23

1.8 对Bolt进行单元测试 31

1.9 实现集成测试 34

1.10 将产品部署到集群 37

第2章 日志流处理 38

2.1 简介 38

2.2 创建日志代理 38

2.3 创建日志Spout 40

2.4 基于规则的日志流分析 45

2.5 索引与持久化日志数据 49

2.6 统计与持久化日志统计信息 53

2.7 为日志流集群创建集成测试 55

2.8 创建日志分析面板 59

第3章 使用Trident计算单词重要度 71

3.1 简介 71

3.2 使用Twitter过滤器创建URL流 71

3.3 从文件中获取整洁的词流 76

3.4 计算每个单词的相对重要度 81

第4章 分布式远程过程调用 85

4.1 简介 85

4.2 通过DPRC实现所需处理流程 85

4.3 对Trident Topology进行集成测试 90

4.4 实现滚动窗口Topology 95

4.5 在集成测试中模拟时间 98

第5章 在不同语言中实现Topology 100

5.1 简介 100

5.2 在Qt中实现多语言协议 100

5.3 在Qt中实现SplitSentence Bolt 105

5.4 在Ruby中实现计数Bolt 108

5.5 在Clojure中实现单词计数Topology 109

第6章 Storm与Hadoop集成 113

6.1 简介 113

6.2 在Hadoop中实现TF-IDF算法 115

6.3 持久化来自Storm的文件 121

6.4 集成批处理与实时视图 122

第7章 实时机器学习 127

7.1 简介 127

7.2 实现事务性Topology 129

7.3 在R中创建随机森林分类模型 134

7.4 基于随机森林的事务流业务分类 143

7.5 在R中创建关联规则模型 149

7.6 创建推荐引擎 152

7.7 实时在线机器学习 157

第8章 持续交付 162

8.1 简介 162

8.2 搭建CI服务器 162

8.3 搭建系统环境 164

8.4 定义交付流水线 166

8.5 实现自动化验收测试 170

第9章 在AWS 上部署Storm 177

9.1 简介 177

9.2 使用Pallet在AWS上部署Storm 177

9.3 搭建虚拟私有云 181

9.4 使用Vagrant在虚拟私有云上部署Storm 189

精品推荐