题名:	Spark高级数据分析 / (美) 桑迪·里扎 ... [等] 著 , 龚少成, 邱鑫译
ISBN:	978-7-115-48252-5 价格： CNY69.00
语种:	chi
载体形态:	18, 226页图 24cm
出版发行:	出版地：北京出版社：人民邮电出版社出版日期： 2018
内容提要:	本书是使用Spark进行大规模数据分析的实战宝典, 由知名数据科学家撰写。本书在第1版的基础上, 针对Spark近年来的发展, 对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API, MLlib和Spark SQL两个子项目也发生了较大变化, 本书为关注Spark发展趋势的读者提供了与时俱进的资料, 例如Dataset和DataFrame的使用, 以及与DataFrame API高度集成的Spark ML API。
主题词:	数据处理软件
中图分类法:	TP274 版次： 5
主要责任者:	里扎著
主要责任者:	莱瑟森著
主要责任者:	欧文著
次要责任者:	龚少成译
次要责任者:	邱鑫译
责任者附注:	桑迪·里扎 (Sandy Ryza), Spark项目代码提交者、Hadoop项目管理委员会委员, Time Series for Spark项目创始人。于里·莱瑟森 (Uri Laserson) , MIT博士毕业, 致力于用技术解决遗传学问题, 曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。肖恩·欧文 (Sean Owen), Spark、Mahout项目代码提交者, Spark项目管理委员会委员。现任Cloudera公司数据科学总监。龚少成, 现任万达科技集团数据工程部总经理, 清华大学自动化系研究生毕业, 国内专注企业级大数据平台建设的先驱者之一。邱鑫, 毕业于武汉大学, 目前就职于英特尔亚太研发有限公司, 是Intel大数据团队高级工程师。
索书号:	3
索书号:	3