跨语言预训练

案例来源:微软亚洲研究院
会议地点:上海
分享时间: 2021-11-27 14:30-15:30

梁耀波  |

微软亚洲研究院 资深研究员

梁耀波,微软亚洲研究院资深研究员。2016年加入微软,主要研究方向为跨语言的预训练及智能问答。开发的跨语言模型Unicoder应用场景包括微软产品十余项、语言一百余种。

课程概要

话题概述:
在把自然语言模型扩展到多语言的过程中,新的语言往往缺少标注数据。跨语言预训练的目标是利用一个语言的标注数据帮助其他语言,实现语言之间的知识迁移。在本次分享中,我将会介绍跨语言预训练相关的背景知识,以及从如何利用双语数据和知识库来提高跨语言模型的迁移效果。本介绍种涉及的模型已经帮助了十余项微软产品进行多语言扩展。我们挑选了其中的代表性场景,将数据进行了开源。开源数据集包括6个任务,19种语言,涉及搜索引擎排序、智能问答、新闻分类等多个场景。

演讲题纲:
一、跨语言预训练背景简介
二、利用双语数据提高跨语言模型
三、利用知识库提高跨语言模型
四、微软真实业务数据的开源

话题亮点:
1. 跨语言预训练领域的综合介绍, 2. 微软真实业务数据的开源

听众收益

1. 了解跨语言预训练相关的背景知识
2. 了解最新的跨语言预训练模型
3. 了解微软跨语言应用的真实场景

梁耀波  |

微软亚洲研究院 资深研究员

梁耀波,微软亚洲研究院资深研究员。2016年加入微软,主要研究方向为跨语言的预训练及智能问答。开发的跨语言模型Unicoder应用场景包括微软产品十余项、语言一百余种。

课程概要

话题概述:
在把自然语言模型扩展到多语言的过程中,新的语言往往缺少标注数据。跨语言预训练的目标是利用一个语言的标注数据帮助其他语言,实现语言之间的知识迁移。在本次分享中,我将会介绍跨语言预训练相关的背景知识,以及从如何利用双语数据和知识库来提高跨语言模型的迁移效果。本介绍种涉及的模型已经帮助了十余项微软产品进行多语言扩展。我们挑选了其中的代表性场景,将数据进行了开源。开源数据集包括6个任务,19种语言,涉及搜索引擎排序、智能问答、新闻分类等多个场景。

演讲题纲:
一、跨语言预训练背景简介
二、利用双语数据提高跨语言模型
三、利用知识库提高跨语言模型
四、微软真实业务数据的开源

话题亮点:
1. 跨语言预训练领域的综合介绍, 2. 微软真实业务数据的开源

听众收益

1. 了解跨语言预训练相关的背景知识
2. 了解最新的跨语言预训练模型
3. 了解微软跨语言应用的真实场景

详情咨询:400-8128-020
赞助合作:sissi
联系电话:130-4321-8801
邮箱:market@msup.com.cn
CopyRight © 2008-2021 Msup

获取大会更多详情

立即参会
报名咨询
报名咨询
优惠门票
×

扫码关注公众号:回复【A2M】

参与《免费领取PPT》活动



关注后,回复【A2M】

×

扫码关注公众号:回复【A2M】

参与《免费领取PPT》活动



关注后,回复【A2M】