| 
				 
					题名:
				 
			 | 
			Hadoop与Spark入门 / 覃雄派, 陈跃国编著 , | 
| 
				 
					ISBN:
				 
			 | 
			978-7-302-61363-3 价格: CNY59.00 | 
| 
				 
					语种:
				 
			 | 
			chi | 
| 
				 
					载体形态:
				 
			 | 
			xiv, 233页 图 26cm | 
| 
				 
					出版发行:
				 
			 | 
			出版地: 北京 出版社: 清华大学出版社 出版日期: 2022 | 
| 
				 
					内容提要:
				 
			 | 
			本书包含13章:第1、2章介绍如何为深入学习Hadoop和Spark做环境准备,包括VMware虚拟机的创建和CentOS操作系统安装。第3-6章介绍Hadoop大数据平台的基本原理,包括HDFS、MapReduce计算模型、HBase数据库,以及Hive数据仓库的原理、部署方法和开发技术。第7-11章介绍Spark大数据平台的基本原理,包括弹性分布式数据集、转换与动作操作、宽依赖与窄依赖、有向无环图表达的作业及其处理过程等,并且介绍了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和开发技术。最后两章介绍了Flume(第12章)和Kafka(第13章)两个工具。 | 
| 
				 
					主题词:
				 
			 | 
			数据处理软件 高等学校 | 
| 
				 
					中图分类法:
				 
			 | 
			TP274-43 版次: 5 | 
| 
				 
					主要责任者:
				 
			 | 
			覃雄派 编著 | 
| 
				 
					主要责任者:
				 
			 | 
			陈跃国 编著 | 
| 
				 
					附注:
				 
			 | 
			国家级一流本科专业配套教材 |