题名:
大数据技术入门   da shu ju ji shu ru men / 于海浩,刘志坤主编 ,
ISBN:
978-7-302-59181-8 价格: CNY49.90
语种:
chi
载体形态:
194页 图 26cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2022
内容提要:
本书基础理论、应用开发以及实际案例相结合,围绕Hadoop、Spark生态圈循序渐进介绍关于大数据技术领域中的基础知识、应用开发技术和基于Spark的常见机器学习算法,最后以两个实战案例全面、系统地应用了本书介绍的基础知识和应用开发方法。全书共14章,分别为大数据概述、Hadoop简介及安装部署、HDFS 分布式文件系统、MapReduce计算框架、Hive 数据仓库、HBase分布式数据库、Spark基础、Spark RDD弹性分布式数据集、Spark SQL、Spark Streaming实时计算框架、Spark Streaming与Flume、Kafka的整合、Spark MLlib 机器学习、实战案例-分布式优惠券后台应用系统、实战案例-新闻话题实时统计分析,书中的每个知识点都有相应的实现代码和实例。 
主题词:
数据处理软件  
中图分类法:
TP274 版次: 5
其它题名:
Hadoop+Spark
主要责任者:
于海浩 yu hai hao 主编
主要责任者:
刘志坤 liu zhi kun 主编
索书号:
TP274/1033