图书介绍

社交网站的数据挖掘与分析pdf电子书版本下载

（美）罗素著著
出版社：北京：机械工业出版社
ISBN：9787111369608
出版时间：2012
标注页数：302页
文件大小：26MB
文件页数：314页
主题词：数据采集

PDF下载

PDF云下载[VIP在线云解压服务,PC-移动端高速直接下载PDF格式文件,方便快捷!]
种子下载[BT下载速度快] 温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：37b5f1e0d517ec26868a582440a29f20

下载说明

社交网站的数据挖掘与分析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

前言 1

第1章绪论：Twitter数据的处理 9

Python开发工具的安装 9

Twitter数据的收集和处理 11

小结 24

第2章微格式：语义标记和常识碰撞 26

XFN和朋友 27

使用XFN来探讨社交关系 29

地理坐标：兴趣爱好的共同主线 37

（以健康的名义）对菜谱进行交叉分析 41

对餐厅评论的搜集 43

小结 45

第3章邮箱：虽然老套却很好用 47

mbox:Unix的入门级邮箱 48

mbox+CouchDB=随意的Email分析 54

将对话线程化到一起 70

使用SIMILE Timeline将邮件“事件”可视化 79

分析你自己的邮件数据 82

小结 84

第4章Twitter：朋友、关注者和Setwise操作 85

REST风格的和OAuth-Cladded API 86

干练而中肯的数据采集器 90

友谊图的构建 108

小结 116

第5章Twitter： tweet，所有的tweet，只有tweet 118

笔PK剑：和tweet PK机枪（？！？） 118

对tweet的分析（每次一个实体） 121

并置潜在的社交网站（或#JustinBieber VS #TeaParty） 144

对大量tweet的可视化 155

小结 163

第6章Linkedin：为了乐趣（和利润？）将职业网络聚类 164

聚类的动机 165

按职位将联系人聚类 167

获取补充个人信息 183

从地理上聚类网络 188

小结 192

第7章GoogleBuzz：TF-IDF、余弦相似性和搭配 194

Buzz=Twitter+博客（？？？） 195

使用NLTK处理数据 198

文本挖掘的基本原则 201

查找相似文档 208

在二元语法中发Buzz 215

利用Gmail 221

在中断之前试着创建一个搜索引擎 225

小结 226

第8章博客及其他：自然语言处理（等） 228

NLP：帕累托式介绍 228

使用NLTK的典型NLP管线 231

使用NLTK检测博客中的句子 234

对文件的总结 237

以实体为中心的分析：对数据的深层了解 245

小结 256

第9章Facebook：一体化的奇迹 257

利用社交网络数据 258

对Facebook数据的可视化 274

小结 294

第10章语义网：简短的讨论 296

发展中的变革 296

人不可能只靠事实生活 297

期望 301