资源名称:深入理解Hadoop.第2版 

内容简介:

本书作者基于对Hadoop系统的实践,深入浅出地对Hadoop进行了详细的讲解,包含大量的实例和技巧,可帮助有一定基础的开发者快速掌握分布式系统。主要内容包括:第1章~第4章讲解大数据系统的基本概念、Hadoop系统的关键概念,以及进行Hadoop平台管理的关键概念要素。第5章~第7章是本书的重点,深入分析了MapReduce框架,不仅包括MapReduce框架的API,还介绍MapReduce框架的更复杂概念及其设计理念。第8章~第14章介绍Hadoop生态系统,包括支持MapReduce程序的单元测试和集成测试框架、Hadoop系统的监控和日志系统、Hive框架、Pig和Crunch框架、HCatalog框架、Hadoop日志流处理、HBase等。第15章~第17章介绍了数据科学基本概念及应用、云计算实例、分布式下载服务实例等。

资源目录:

译者序

作者简介

前言

第1章为什么会有大数据1

第2章Hadoop中的概念13

第3章初识Hadoop框架34

第4章Hadoop系统管理51

第5章MapReduce开发基础78

第6章MapReduce开发进阶111

第7章 Hadoop输入/输出155

第8章 测试Hadoop程序186

第9章Hadoop的监控203

第10章使用Hadoop构建数据仓库215

第11章使用Pig进行数据处理238

第12章HCatalog和企业级Hadoop266

第13章使用Hadoop分析日志277

第14章使用HBase构建实时系统286

第15章Hadoop与数据科学317

第16章Hadoop与云计算334

第17章构建YARN应用程序349

附录A安装Hadoop

附录B使用Maven和Eclipse

附录CApache Ambari

资源截图:

1.png

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。