题名:
|
PySpark大数据分析与应用 / 戴刚, 张良均主编 , |
ISBN:
|
978-7-115-63490-0 价格: CNY69.80 |
语种:
|
chi |
载体形态:
|
275页 图 26cm |
出版发行:
|
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2024 |
内容提要:
|
本书以Python作为开发语言, 系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出, 理论叙述循序渐进、由浅入深。本书共7章, 第1-5章包括 PySpark大数据分析概述、PySpark 安装配置、基于 PySpark的DataFrame 操作、基于PySpark的流式数据处理、基于PySpark的机器学习库, 内容介绍注重理论与实践相结合, 通过典型示例强化PySpark在大数据分析中的实际应用; 第 6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark的信用贷款风险分析两个完整的案例实战, 结合前5章的PySpark编程知识, 实现完整的大数据分析过程。本书大部分章包含实训和课后习题, 读者通过练习和操作实践, 能够巩固所学的内容。 |
主题词:
|
数据处理 |
中图分类法:
|
TP274 版次: 5 |
主要责任者:
|
戴刚 主编 |
主要责任者:
|
张良均 主编 |