题名:
|
Hadoop+Spark大数据技术 / 刘彬斌主编 , 李柏章, 周磊, 李永富编著 |
ISBN:
|
978-7-302-51427-5 价格: CNY69.00 |
语种:
|
chi |
载体形态:
|
xii, 343页 图 26cm |
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2018 |
内容提要:
|
全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作, 为以后编程奠定坚实的基础。Hadoop技术篇以Hadoop生态圈为中心, 详细介绍Hadoop高可用集群搭建、HDFS技术、MapReduce技术、Hive技术, 为读者学习大数据开发技术提供便利, 并以实用的方式简单介绍HBase、Sqoop、Flume工具的使用, 使读者在精通一门技术的前提下, 能扩展了解相关知识, 真正成为一专多能的专业型人才。Spark技术篇从Spark概述、Scala语言、环境搭建、RDD核心技术、Spark SQL和机器学习等多方面讲解Spark大数据的开发, 从基础的Scala语言开始学习, 并以Hadoop环境为基础搭建Spark大数据集群, 从最基础、最常用、最容易理解的思路出发, 帮助读者逐步掌握Spark大数据技术。项目实战篇将真实的电力能源大数据分析项目作为实战解读, 帮助初学者快速入门。 |
主题词:
|
数据处理软件 高等学校 |
中图分类法:
|
TP274 版次: 5 |
主要责任者:
|
刘彬斌 主编 |
次要责任者:
|
李柏章 编著 |
次要责任者:
|
周磊 编著 |
次要责任者:
|
李永富 编著 |
附注:
|
教育部-邦飞产学合作协同育人项目 |
索书号:
|
3 |
索书号:
|
3 |