题名:	PyTorch计算机视觉实战 / (印) V·基肖尔·阿耶德瓦拉, 耶什万斯·雷迪著 , 汪雄飞, 汪荣贵译
ISBN:	978-7-111-73339-3 价格： CNY149.00
语种:	chi
载体形态:	xiii, 558页, [2] 页图版图 (部分彩图)，肖像 24cm
出版发行:	出版地：北京出版社：机械工业出版社出版日期： 2023
内容提要:	深度学习是近年来计算机视觉应用在多个方面取得进步的驱动力。本书以实践为驱动，结合具体应用场景，基于真实数据集全面系统地介绍如何使用PyTorch解决50多个计算机视觉问题。首先，你将学习使用NumPy和PyTorch从头开始构建神经网络（NN），并了解调整神经网络超参数的最佳实践。然后，你将学习如何使用卷积神经网络（CNN）和迁移学习完成图像分类任务，并理解其中的工作原理。随后，你将学习二维和三维多目标检测、图像分割、人体姿态估计等多个实际任务，并使用R-CNN、FastR-CNN、FasterR-CNN、SSD、YOLO、U-Net、MaskRCNN、在自编码器和GAN部分，本书将指导你学习面部表情替换、面部图像生成和面部表情处理技术。之后，你将学习如何将计算机视觉与NLP技术（如LSTM、transformer等）和强化学习技术（如深度Q学习等）相结合，实现OCR、图像标题生成、目标检测和汽车自动驾驶智能体等应用。最后，你将学习如何将神经网络模型部署到 AWS 云等实际应用场景。通过阅读本书，你将学会：使用NumPy和PyTorch从头开始构建神经网络；实现二维和三维多目标检测、图像分割；使用自编码器和高级GAN生成数字图像和虚拟图像；使用Pix2PixGAN、CycleGAN、StyleGAN2、SRGAN等模型进行图像处理；结合计算机视觉与NLP技术实现OCR 、图像标题生成和目标检测；结合计算机视觉与强化学习技术实现玩Pong游戏的智能体和汽车自动驾驶智能体；使用FastAPI和Docker工具将神经网络模型部署到AWS云等实际应用场景；使用常用的OpenCV实用程序进行图像分析。
主题词:	机器学习计算机视觉
中图分类法:	TP181 版次： 5
中图分类法:	TP302.7 版次： 5
其它题名:	目标检测、图像处理与深度学习
主要责任者:	阿耶德瓦拉著
主要责任者:	雷迪著
次要责任者:	汪雄飞译
次要责任者:	汪荣贵译
责任者附注:	V.基肖尔·阿耶德瓦拉（V Kishore Ayyadevara），他在知名技术公司从事数据科学领域的工作超过10年，目前负责开发各种前沿的分析解决方案。他领导的团队专注于使用人工智能解决医疗保健领域的问题。Kishore已经在机器学习、医疗保健和运营领域申请了8项专利。除本书外，他还撰写了4本机器学习和深度学习方面的书。
责任者附注:	耶什万斯·雷迪（Yeshwanth Reddy）高级数据科学家，专注于前沿技术的研究和实现，以解决健康和计算机视觉领域的问题。他在OCR领域申请了4项专利。他还拥有2年的教学经验，为数千名学生讲授统计学、机器学习、人工智能和自然语言处理等方面的课程。