题名:
Spark高级数据分析   / (美) 桑迪·里扎 ... [等] 著 , 龚少成, 邱鑫译
ISBN:
978-7-115-48252-5 价格: CNY69.00
语种:
chi
载体形态:
18, 226页 图 24cm
出版发行:
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2018
内容提要:
本书是使用Spark进行大规模数据分析的实战宝典, 由知名数据科学家撰写。本书在第1版的基础上, 针对Spark近年来的发展, 对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API, MLlib和Spark SQL两个子项目也发生了较大变化, 本书为关注Spark发展趋势的读者提供了与时俱进的资料, 例如Dataset和DataFrame的使用, 以及与DataFrame API高度集成的Spark ML API。 
主题词:
数据处理软件  
中图分类法:
TP274 版次: 5
主要责任者:
里扎
主要责任者:
莱瑟森
主要责任者:
欧文
次要责任者:
龚少成
次要责任者:
邱鑫
责任者附注:
桑迪·里扎 (Sandy Ryza), Spark项目代码提交者、Hadoop项目管理委员会委员, Time Series for Spark项目创始人。于里·莱瑟森 (Uri Laserson) , MIT博士毕业, 致力于用技术解决遗传学问题, 曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。肖恩·欧文 (Sean Owen), Spark、Mahout项目代码提交者, Spark项目管理委员会委员。现任Cloudera公司数据科学总监。龚少成, 现任万达科技集团数据工程部总经理, 清华大学自动化系研究生毕业, 国内专注企业级大数据平台建设的先驱者之一。邱鑫, 毕业于武汉大学, 目前就职于英特尔亚太研发有限公司, 是Intel大数据团队高级工程师。 
索书号:
3
索书号:
3