视觉问答与对话系统的新技术进展

案例来源:北京航空航天大学
会议地点:上海
分享时间: 2020-07-18 13:30-14:30

秦曾昌  |

北京航空航天大学 副教授

现任北京航空航天大学自动化学院副教授、编程猫合伙人与首席科学家。曾于2002年和2005年获得英国布里斯托(Bristol)大学硕士、博士。美国加州大学伯克利分校 (UC Berkeley) 博士后、牛津 (Oxford) 大学与卡内基梅隆大学 (CMU) 访问学者。目前主要研究方向为人工智能、机器学习、数据挖掘、跨媒体检索与自然语言理解。出版英文专著1本;编辑论文集2本;在IJCAI, AAAI, CVPR,ICASSP,EMNLP, WSDM等国际会议与Information Sciences, Neurocomputing等期刊共发表论文110余篇。2010年教育部新世纪优秀人才获得者。同时广泛参与信息产业界的技术咨询工作,并曾任Keep首席科学家兼人工智能研究院院长。

课程概要

案例背景:
对于跨模态信息的处理是目前很多推荐、广告、检索等智能系统的核心问题之一,尤其是针对跨模态的问答与对话技术。我们将讨论如何应用深度学习模型对视觉问答系统于视觉对话系统提出新的技术解决方案。

解决思路:
我们将讨论利用多模态信息的融合、图卷积模型来设计相应的对话系统与问答系统。并考虑如何更好的利用知识图谱与先验的关系信息。

成果:
研究成果已经发布了国际同行认可的顶级期刊和会议。期待在实际工业落地的应用。
Jing Yu, Weifeng Zhang, Yuhang Lu, Zengchang Qin, Yue Hu, Jianlong Tan, Qi Wu (2020), Reasoning on the relation: enhancing visual representation for visual question answering and cross-modal retrieval, IEEE Transaction on Multimedia (IF=5.452).
3. Weifeng Zhang, Jing Yu, Hua Hu, Haiyang Hu, Zengchang Qin (2020), Multimodal feature fusion by relational reasoning and attention for visual question answering, Information Fusion (IF=10.716), Vol. 55: pp. 116-126.
Xiaoze Jiang, Jing Yu, Zengchang Qin, Yingying Zhuang, Xingxing Zhang, Yue Hu and Qi Wu (2020), DualVD: An adaptive dual encoding model for deep visual understanding in visual dialogue, Proceedings of National Conference on Artificial Intelligence (AAAI-2020)

听众收益

1 了解视觉问答系统技术的发展与前沿 2 了解最新关于视觉对话的研究工作 3 了解设计智能对话和问答系统的核心算法。

秦曾昌  |

北京航空航天大学 副教授

现任北京航空航天大学自动化学院副教授、编程猫合伙人与首席科学家。曾于2002年和2005年获得英国布里斯托(Bristol)大学硕士、博士。美国加州大学伯克利分校 (UC Berkeley) 博士后、牛津 (Oxford) 大学与卡内基梅隆大学 (CMU) 访问学者。目前主要研究方向为人工智能、机器学习、数据挖掘、跨媒体检索与自然语言理解。出版英文专著1本;编辑论文集2本;在IJCAI, AAAI, CVPR,ICASSP,EMNLP, WSDM等国际会议与Information Sciences, Neurocomputing等期刊共发表论文110余篇。2010年教育部新世纪优秀人才获得者。同时广泛参与信息产业界的技术咨询工作,并曾任Keep首席科学家兼人工智能研究院院长。

课程概要

案例背景:
对于跨模态信息的处理是目前很多推荐、广告、检索等智能系统的核心问题之一,尤其是针对跨模态的问答与对话技术。我们将讨论如何应用深度学习模型对视觉问答系统于视觉对话系统提出新的技术解决方案。

解决思路:
我们将讨论利用多模态信息的融合、图卷积模型来设计相应的对话系统与问答系统。并考虑如何更好的利用知识图谱与先验的关系信息。

成果:
研究成果已经发布了国际同行认可的顶级期刊和会议。期待在实际工业落地的应用。
Jing Yu, Weifeng Zhang, Yuhang Lu, Zengchang Qin, Yue Hu, Jianlong Tan, Qi Wu (2020), Reasoning on the relation: enhancing visual representation for visual question answering and cross-modal retrieval, IEEE Transaction on Multimedia (IF=5.452).
3. Weifeng Zhang, Jing Yu, Hua Hu, Haiyang Hu, Zengchang Qin (2020), Multimodal feature fusion by relational reasoning and attention for visual question answering, Information Fusion (IF=10.716), Vol. 55: pp. 116-126.
Xiaoze Jiang, Jing Yu, Zengchang Qin, Yingying Zhuang, Xingxing Zhang, Yue Hu and Qi Wu (2020), DualVD: An adaptive dual encoding model for deep visual understanding in visual dialogue, Proceedings of National Conference on Artificial Intelligence (AAAI-2020)

听众收益

1 了解视觉问答系统技术的发展与前沿 2 了解最新关于视觉对话的研究工作 3 了解设计智能对话和问答系统的核心算法。

详情咨询:400-8128-020
赞助合作:sissi
联系电话:130-4321-8801
邮箱:market@msup.com.cn
CopyRight © 2008-2020 Msup