[视频作者] 人工智能前沿讲习
[视频时长] 33:19
[视频类型] 科学科普
SFFAI论坛网站已开放注册,详情点击查看:https://bbs.sffai.com/d/312 关注公众号:【人工智能前沿讲习】,回复【SFFAI130】获取讲者PPT资料,入交流群,推荐论文下载。 虽然复杂的视觉问答(VQA)模型取得了显著的成功,但它们倾向于只根据问题和答案之间的表面关联来回答问题。最近已经有不少解决这个语言偏见(language priors)现象的工作。然而,他们中的大多数往往直接输出最高概率的答案作为预测结果,而不再对输出答案的真实性进行检查。此外,他们只研究了图像和问题之
![[图]SFFAI 130 视觉问答专题《佀庆一:中国科学院信息工程研究所在读博士》](https://i2.hdslb.com/bfs/archive/95133e2c6e4f565ea22991b295013cb4d125d74b.jpg)