题名:	Hadoop+Spark生态系统操作与实战指南 Hadoop+Spark sheng tai xi tong cao zuo yu shi zhan zhi nan / 余辉著 ,
ISBN:	978-7-302-47967-3 价格： CNY69.00
语种:	chi
载体形态:	12,337页 26cm
出版发行:	出版地：北京出版社：清华大学出版社出版日期： 2017
内容提要:	本书共12章，大致分为3个部分，第1部分(第1~7章)讲解Hadoop的原生态组件，包括Hadoop、ZooKeeper、HBase、Hive环境搭建与安装，以及介绍MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本环境下实战操作。第2部分(第8~11章)讲解Spark的原生态组件，包括Spark Core、Spark SQL、Spark Streaming、DataFrame，以及介绍Scala、Spark API、Spark SQL、Spark Streaming、DataFrame原理和CDH版本环境下实战操作，其中Flume和Kafka属于Apache顶级开源项目也放在本篇讲解。第3部分(第12章)讲解两个大数据项目，包络网页日志离线项目和实时项目，在CDH版本环境下通过这两个项目将Hadoop和Spark原生态组件进行整合，一步步带领读者学习和实战操作。
主题词:	数据处理软件
中图分类法:	TP274 版次： 5
主要责任者:	余辉 yu hui 著
责任者附注:	余辉，中国科学院大学硕士研究生毕业，研究方向为云计算和大数据。现供职于某上市公司担任技术经理，并在 Oracle OAEC人才产业集团大数据学院担任大数据讲师。曾在清华大学电子工程系NGNLab研究室担任软件工程师。
索书号:	TP274/8027