题名:
|
数据科学并行计算 shu ju ke xue bing xing ji suan / 白琰冰编著 , |
ISBN:
|
978-7-300-29059-1 价格: CNY49.00 |
语种:
|
chi |
载体形态:
|
275页 图 26cm |
出版发行:
|
出版地: 北京 出版社: 中国人民大学出版社 出版日期: 2021 |
内容提要:
|
本书通俗地讲解数据科学与并行计算的基本概念、方法和原理,系统地介绍基于典型大数据场景的并行计算解决思路,同时涵盖常用的数据并行计算工具的操作实践,使读者知其然更知其所以然。 本书的特色在于:注重对大数据科学方法核心应用的讲解,突出以并行计算思维解决大数据场景问题的案例教学。基于典型大数据场景案例数据集,循序渐进地引导读者利用Parallel、Sparklyr、Dask和PySpark等主流并行计算工具实现数据的清洗、转换、描述和建模分析。帮助读者系统全面地构建数据科学的基本知识体系,领会数据并行计算方法的精髓,掌握不同编程语言和并行计算工具针对不同规模数据集的优缺点,能够利用并行计算工具解决实际的数据分析问题。 |
主题词:
|
数据处理 研究 |
中图分类法:
|
TP274 版次: 5 |
主要责任者:
|
白琰冰 bai yan bing 编著 |
责任者附注:
|
白琰冰,中国人民大学统计学院数据科学与大数据统计系讲师,硕士生导师,中国人民大学杰出青年学者,北京大数据协会理事会理事。主要开设课程包括大数据分布式计算、并行计算与软件设计、统计学。 |
索书号:
|
1 |