题名:
|
Spark高级数据分析 / (美) 桑迪·里扎 ... [等] 著 , 龚少成, 邱鑫译 |
ISBN:
|
978-7-115-48252-5 价格: CNY69.00 |
语种:
|
chi |
载体形态:
|
18, 226页 图 24cm |
出版发行:
|
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2018 |
内容提要:
|
本书是使用Spark进行大规模数据分析的实战宝典, 由知名数据科学家撰写。本书在第1版的基础上, 针对Spark近年来的发展, 对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API, MLlib和Spark SQL两个子项目也发生了较大变化, 本书为关注Spark发展趋势的读者提供了与时俱进的资料, 例如Dataset和DataFrame的使用, 以及与DataFrame API高度集成的Spark ML API。 |
主题词:
|
数据处理软件 |
中图分类法:
|
TP274 版次: 5 |
主要责任者:
|
里扎 著 |
主要责任者:
|
莱瑟森 著 |
主要责任者:
|
欧文 著 |
次要责任者:
|
龚少成 译 |
次要责任者:
|
邱鑫 译 |
责任者附注:
|
桑迪·里扎 (Sandy Ryza), Spark项目代码提交者、Hadoop项目管理委员会委员, Time Series for Spark项目创始人。于里·莱瑟森 (Uri Laserson) , MIT博士毕业, 致力于用技术解决遗传学问题, 曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。肖恩·欧文 (Sean Owen), Spark、Mahout项目代码提交者, Spark项目管理委员会委员。现任Cloudera公司数据科学总监。龚少成, 现任万达科技集团数据工程部总经理, 清华大学自动化系研究生毕业, 国内专注企业级大数据平台建设的先驱者之一。邱鑫, 毕业于武汉大学, 目前就职于英特尔亚太研发有限公司, 是Intel大数据团队高级工程师。 |
索书号:
|
3 |
索书号:
|
3 |