题名:
|
PyTorch计算机视觉实战 / (印) V·基肖尔·阿耶德瓦拉, 耶什万斯·雷迪著 , 汪雄飞, 汪荣贵译 |
ISBN:
|
978-7-111-73339-3 价格: CNY149.00 |
语种:
|
chi |
载体形态:
|
xiii, 558页, [2] 页图版 图 (部分彩图),肖像 24cm |
出版发行:
|
出版地: 北京 出版社: 机械工业出版社 出版日期: 2023 |
内容提要:
|
深度学习是近年来计算机视觉应用在多个方面取得进步的驱动力。本书以实践为驱动,结合具体应用场景,基于真实数据集全面系统地介绍如何使用PyTorch解决50多个计算机视觉问题。首先,你将学习使用NumPy和PyTorch从头开始构建神经网络(NN),并了解调整神经网络超参数的最佳实践。然后,你将学习如何使用卷积神经网络(CNN)和迁移学习完成图像分类任务,并理解其中的工作原理。随后,你将学习二维和三维多目标检测、图像分割、人体姿态估计等多个实际任务,并使用R-CNN、FastR-CNN、FasterR-CNN、SSD、YOLO、U-Net、MaskRCNN、在自编码器和GAN部分,本书将指导你学习面部表情替换、面部图像生成和面部表情处理技术。之后,你将学习如何将计算机视觉与NLP技术(如LSTM、transformer等)和强化学习技术(如深度Q学习等)相结合,实现OCR、图像标题生成、目标检测和汽车自动驾驶智能体等应用。最后,你将学习如何将神经网络模型部署到 AWS 云等实际应用场景。通过阅读本书,你将学会:使用NumPy和PyTorch从头开始构建神经网络;实现二维和三维多目标检测、图像分割;使用自编码器和高级GAN生成数字图像和虚拟图像;使用Pix2PixGAN、CycleGAN、StyleGAN2、SRGAN等模型进行图像处理;结合计算机视觉与NLP技术实现OCR 、图像标题生成和目标检测;结合计算机视觉与强化学习技术实现玩Pong游戏的智能体和汽车自动驾驶智能体;使用FastAPI和Docker工具将神经网络模型部署到AWS云等实际应用场景;使用常用的OpenCV实用程序进行图像分析。 |
主题词:
|
机器学习 计算机视觉 |
中图分类法:
|
TP181 版次: 5 |
中图分类法:
|
TP302.7 版次: 5 |
其它题名:
|
目标检测、图像处理与深度学习 |
主要责任者:
|
阿耶德瓦拉 著 |
主要责任者:
|
雷迪 著 |
次要责任者:
|
汪雄飞 译 |
次要责任者:
|
汪荣贵 译 |
责任者附注:
|
V.基肖尔·阿耶德瓦拉(V Kishore Ayyadevara),他在知名技术公司从事数据科学领域的工作超过10年,目前负责开发各种前沿的分析解决方案。他领导的团队专注于使用人工智能解决医疗保健领域的问题。Kishore已经在机器学习、医疗保健和运营领域申请了8项专利。除本书外,他还撰写了4本机器学习和深度学习方面的书。 |
责任者附注:
|
耶什万斯·雷迪(Yeshwanth Reddy)高级数据科学家,专注于前沿技术的研究和实现,以解决健康和计算机视觉领域的问题。他在OCR领域申请了4项专利。他还拥有2年的教学经验,为数千名学生讲授统计学、机器学习、人工智能和自然语言处理等方面的课程。 |