题名:
视觉问答   / 吴琦 ... [等] 著 , 王鑫, 聂婕, 朱文武译
ISBN:
978-7-121-47531-3 价格: CNY118.00
语种:
chi
载体形态:
xvii, 223页 图 (部分彩图) 24cm
出版发行:
出版地: 北京 出版社: 电子工业出版社 出版日期: 2024.7
内容提要:
本书共5部分。第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术; 第2部分将图像视觉问答进一步分为五类, 即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络; 第3部分讨论基于视频的视觉问答及其相关模型; 第4部分讨论与视觉问答相关的高级任务, 包括具身视觉问答、医学视觉问答、基于文本的视觉问答等; 第5部分对该领域进行总结和展望, 讨论视觉问答领域的未来研究方向。 
主题词:
计算机视觉   图象处理
中图分类法:
TP391.413 版次: 5
主要责任者:
吴琦
主要责任者:
王鹏
主要责任者:
王鑫
次要责任者:
聂婕
责任者附注:
吴琦, 阿德莱德大学副教授, 澳大利亚机器学习研究中心视觉和语言实验室主任, 2019-2021年获得ARC Discovery DECRA Fellowship。王鹏, 西北工业大学教授、博士生导师, 教育部长江学者。2000-2011年在北京航空航天大学自动化科学与电气工程学院学习并获得学士和博士学位。王鑫, 清华大学计算机系副研究员, 国家优秀青年科学基金获得者。在浙江大学计算机科学与技术学院获得学士、博士学位, 在加拿大西蒙弗雷泽大学获得计算科学博士学位。