题名:
PyTorch计算机视觉实战   / (印) V·基肖尔·阿耶德瓦拉, 耶什万斯·雷迪著 , 汪雄飞, 汪荣贵译
ISBN:
978-7-111-73339-3 价格: CNY149.00
语种:
chi
载体形态:
xiii, 558页, [2] 页图版 图 (部分彩图),肖像 24cm
出版发行:
出版地: 北京 出版社: 机械工业出版社 出版日期: 2023
内容提要:
深度学习是近年来计算机视觉应用在多个方面取得进步的驱动力。本书以实践为驱动,结合具体应用场景,基于真实数据集全面系统地介绍如何使用PyTorch解决50多个计算机视觉问题。首先,你将学习使用NumPy和PyTorch从头开始构建神经网络(NN),并了解调整神经网络超参数的最佳实践。然后,你将学习如何使用卷积神经网络(CNN)和迁移学习完成图像分类任务,并理解其中的工作原理。随后,你将学习二维和三维多目标检测、图像分割、人体姿态估计等多个实际任务,并使用R-CNN、FastR-CNN、FasterR-CNN、SSD、YOLO、U-Net、MaskRCNN、在自编码器和GAN部分,本书将指导你学习面部表情替换、面部图像生成和面部表情处理技术。之后,你将学习如何将计算机视觉与NLP技术(如LSTM、transformer等)和强化学习技术(如深度Q学习等)相结合,实现OCR、图像标题生成、目标检测和汽车自动驾驶智能体等应用。最后,你将学习如何将神经网络模型部署到 AWS 云等实际应用场景。通过阅读本书,你将学会:使用NumPy和PyTorch从头开始构建神经网络;实现二维和三维多目标检测、图像分割;使用自编码器和高级GAN生成数字图像和虚拟图像;使用Pix2PixGAN、CycleGAN、StyleGAN2、SRGAN等模型进行图像处理;结合计算机视觉与NLP技术实现OCR 、图像标题生成和目标检测;结合计算机视觉与强化学习技术实现玩Pong游戏的智能体和汽车自动驾驶智能体;使用FastAPI和Docker工具将神经网络模型部署到AWS云等实际应用场景;使用常用的OpenCV实用程序进行图像分析。 
主题词:
机器学习   计算机视觉
中图分类法:
TP181 版次: 5
中图分类法:
TP302.7 版次: 5
其它题名:
目标检测、图像处理与深度学习
主要责任者:
阿耶德瓦拉
主要责任者:
雷迪
次要责任者:
汪雄飞
次要责任者:
汪荣贵
责任者附注:
V.基肖尔·阿耶德瓦拉(V Kishore Ayyadevara),他在知名技术公司从事数据科学领域的工作超过10年,目前负责开发各种前沿的分析解决方案。他领导的团队专注于使用人工智能解决医疗保健领域的问题。Kishore已经在机器学习、医疗保健和运营领域申请了8项专利。除本书外,他还撰写了4本机器学习和深度学习方面的书。 
责任者附注:
耶什万斯·雷迪(Yeshwanth Reddy)高级数据科学家,专注于前沿技术的研究和实现,以解决健康和计算机视觉领域的问题。他在OCR领域申请了4项专利。他还拥有2年的教学经验,为数千名学生讲授统计学、机器学习、人工智能和自然语言处理等方面的课程。