资源名称:Spark核心技术与高级应用

内容简介:

本书共分为四大部分:

基础篇(1~10章)介绍了Spark的用途、扩展、安装、运行模式、程序开发、编程模型、工作原理,以及SparkSQL、SparkStreaming、MLlib、GraphX、Bagel等重要的扩展;

实战篇(11~14)讲解了搜索结果的排序、个性化推荐系统、日志分析系统、自然语言处理、数据挖掘等方面的案例;

高级篇(15~18)则讲解了Spark的调度管理、存储管理、监控管理、性能优化、最佳实践以及重点算法的解读;

扩展篇(19~20)讲解了Sparkjob-server和Tachyon。

资源目录:

前言

基础篇

第1章Spark简介2

第2章Spark部署和运行11

第3章Spark程序开发27

第4章编程模型44

第5章作业执行解析59

第6章SparkSQL与DataFrame73

第7章深入了解SparkStreaming97

第8章SparkMLlib与机器学习116

第9章GraphX图计算框架与应用148

第10章SparkR(RonSpark)167

实战篇

第11章大数据分析系统188

第12章系统资源分析平台200

第13章在Spark上训练LR模型215

第14章获取二级邻居关系图225

高级篇

第15章调度管理238

第16章存储管理254

第17章监控管理264

第18章性能调优273

第19章Spark—jobserver实践282

第20章SparkTachyon实战292

资源截图:

1.png

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。