题名:
Hadoop+Spark大数据分析实战   / 迟殿委编著 ,
ISBN:
978-7-302-60884-4 价格: CNY69.00
语种:
chi
载体形态:
290页 图 26cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2022
内容提要:
本书共分14章。第1章讲解Hadop框架及新版本特特性, 并详细讲解大数据分析环境的搭建工作, 包括Linux操作系统的安装、SSH工具使用和配置等; 第2章讲解Hadoop伪分布式的安装和开发体验, 使读者熟悉Hadoop大数据开发两大核心组件, 即HDFS和MapReduce; 第3-12章讲解Hadoop生态系统各框架HDFS、MapReduce、输入输出、Hadoop集群配置、高可用集群、HBase、Hive、数据实时处理系统Flume, 以及Spark框架数据处理、机器学习等实战技术, 并通过实际案例加深对各个框架的理解与应用; 第13-14章分别通过影评分析、旅游酒店评价分析实战项目来贯穿大数据分析的完整流程。 
主题词:
数据处理软件  
中图分类法:
TP274 版次: 5
主要责任者:
迟殿委 编著