题名:
Apache Spark大数据分析   / (瑞典)罗伯特·伊特杰森(Robert Ilijason)著 , 袁国忠译
ISBN:
978-7-115-61456-8 价格: CNY79.80
语种:
chi
载体形态:
236页 23cm
出版发行:
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2023
内容提要:
本书总计11章,首先介绍大规模数据分析相关的概念;然后介绍受管的Spark及其与Databricks的关系,以及Databricks的版本差异和使用方法;接着介绍使用SQL和Python分别实现数据分析的过程,数据提取、变换、加载、存储、优化技巧等高阶数据处理方法以及外部连接工具、生产环境集成等内容;最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。 
主题词:
数据处理软件   机器学习
中图分类法:
TP274 版次: 5
主要责任者:
伊特杰森
次要责任者:
袁国忠