题名:
Hadoop+Spark大数据技术   / 刘彬斌主编 , 李柏章, 周磊, 李永富编著
ISBN:
978-7-302-51427-5 价格: CNY69.00
语种:
chi
载体形态:
xii, 343页 图 26cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2018
内容提要:
全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作, 为以后编程奠定坚实的基础。Hadoop技术篇以Hadoop生态圈为中心, 详细介绍Hadoop高可用集群搭建、HDFS技术、MapReduce技术、Hive技术, 为读者学习大数据开发技术提供便利, 并以实用的方式简单介绍HBase、Sqoop、Flume工具的使用, 使读者在精通一门技术的前提下, 能扩展了解相关知识, 真正成为一专多能的专业型人才。Spark技术篇从Spark概述、Scala语言、环境搭建、RDD核心技术、Spark SQL和机器学习等多方面讲解Spark大数据的开发, 从基础的Scala语言开始学习, 并以Hadoop环境为基础搭建Spark大数据集群, 从最基础、最常用、最容易理解的思路出发, 帮助读者逐步掌握Spark大数据技术。项目实战篇将真实的电力能源大数据分析项目作为实战解读, 帮助初学者快速入门。 
主题词:
数据处理软件   高等学校
中图分类法:
TP274 版次: 5
主要责任者:
刘彬斌 主编
次要责任者:
李柏章 编著
次要责任者:
周磊 编著
次要责任者:
李永富 编著
附注:
教育部-邦飞产学合作协同育人项目 
索书号:
3
索书号:
3