题名:
Python+Spark 2.0+Hadoop机器学习与大数据实战   Python+Spark 2.0+Hadoop ji qi xue xi yu da shu ju shi zhan / 林大贵著 ,
ISBN:
978-7-302-49073-9 价格: CNY99.00
语种:
chi
载体形态:
18, 519页 图 26cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2018
内容提要:
本书从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了“机器学习”内容。为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机Windows系统上通过VirtualBox虚拟机安装多机Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。 
主题词:
软件工具   程序设计
主题词:
数据处理软件  
中图分类法:
TP311.561 版次: 5
中图分类法:
TP274 版次: 5
主要责任者:
林大贵 lin da gui 著
索书号:
TP311.561/4980