DouZero:首个达到人类水平的开源斗地主AI

案例来源:快手
会议地点:上海
分享时间: 2021-11-27 13:30-14:30

谢静如  |

快手 AI平台部 研究员

谢静如,2020年从美国密歇根大学获得物理学博士学位,现在是快手AI平台部Research Scientist,目前主要从事游戏AI和强化学习框架的开发和研究。

课程概要

话题概述:
人工智能在很多棋牌类游戏中取得了很大的成功,例如阿法狗(围棋)、Libratus(德扑)、Suphx(麻将)。斗地主却因其极大的状态空间、丰富的隐含信息、复杂的牌型和并存的合作与竞技,一直以来被认为是一个极具挑战性的领域。我们快手游戏AI团队针对斗地主的难点,探索出了一条新的道路,提出了首个从零开始的斗地主人工智能系统DouZero。将蒙特卡洛算法与深度学习相结合,DouZero在不借助任何人类知识的情况下,通过自博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。相关论文已被国际机器学习顶级会议ICML 2021接收,开源代码在GitHub上获得近千星。同时,我们开放了在线演示平台供研究者和斗地主爱好者体验。

演讲题纲:
1. 斗地主的游戏介绍
a) 游戏玩法
b) 斗地主AI的难点
c) 现有斗地主AI的局限性

2. 斗地主AI DouZero的实现
a) 方法概述
b) 系统实现
c) 实验结果
d) 案例分析

3, 开源及后续工作

4. 快手AI在游戏领域的其他应用

话题亮点:
1. DouZero是首个达到人类水平的开源斗地主AI,并在天梯中击败344个AI取得第一
2. 使用快手的开源项目,用户不需要任何人类数据,只需要一台四卡GPU服务器就能复现出DouZero

听众收益

1. 了解强化学习的训练框架
2. 了解快手开源的斗地主AI Douzero的算法原理
3. 了解快手AI平台部在游戏AI方面的能力与架构

谢静如  |

快手 AI平台部 研究员

谢静如,2020年从美国密歇根大学获得物理学博士学位,现在是快手AI平台部Research Scientist,目前主要从事游戏AI和强化学习框架的开发和研究。

课程概要

话题概述:
人工智能在很多棋牌类游戏中取得了很大的成功,例如阿法狗(围棋)、Libratus(德扑)、Suphx(麻将)。斗地主却因其极大的状态空间、丰富的隐含信息、复杂的牌型和并存的合作与竞技,一直以来被认为是一个极具挑战性的领域。我们快手游戏AI团队针对斗地主的难点,探索出了一条新的道路,提出了首个从零开始的斗地主人工智能系统DouZero。将蒙特卡洛算法与深度学习相结合,DouZero在不借助任何人类知识的情况下,通过自博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。相关论文已被国际机器学习顶级会议ICML 2021接收,开源代码在GitHub上获得近千星。同时,我们开放了在线演示平台供研究者和斗地主爱好者体验。

演讲题纲:
1. 斗地主的游戏介绍
a) 游戏玩法
b) 斗地主AI的难点
c) 现有斗地主AI的局限性

2. 斗地主AI DouZero的实现
a) 方法概述
b) 系统实现
c) 实验结果
d) 案例分析

3, 开源及后续工作

4. 快手AI在游戏领域的其他应用

话题亮点:
1. DouZero是首个达到人类水平的开源斗地主AI,并在天梯中击败344个AI取得第一
2. 使用快手的开源项目,用户不需要任何人类数据,只需要一台四卡GPU服务器就能复现出DouZero

听众收益

1. 了解强化学习的训练框架
2. 了解快手开源的斗地主AI Douzero的算法原理
3. 了解快手AI平台部在游戏AI方面的能力与架构

详情咨询:400-8128-020
赞助合作:sissi
联系电话:130-4321-8801
邮箱:market@msup.com.cn
CopyRight © 2008-2021 Msup

获取大会更多详情

立即参会
报名咨询
报名咨询
优惠门票
×

扫码关注公众号:回复【A2M】

参与《免费领取PPT》活动



关注后,回复【A2M】

×

扫码关注公众号:回复【A2M】

参与《免费领取PPT》活动



关注后,回复【A2M】