#79. 强化学习——阿尔法围棋背后的技术牛油果烤面包

#79. 强化学习——阿尔法围棋背后的技术

46分钟 ·
播放数2302
·
评论数10

嘉宾:田博士(Facebook人工智能研究院的研究员及经理)主持:斯图亚特剪辑:王立冰

本期内容包括:

  • 嘉宾在前阿尔法狗时代研发的世界顶级围棋AI
  • 阿尔法狗使用的技术
  • 阿尔法狗之后围棋AI的进展
  • 强化学习是什么
  • 强化学习的历史
  • 强化学习的落地方向和挑战
  • 两种强化学习:有模型的和无模型的
  • 强化学习的研发体验
  • 强化学习的未来发展方向
  • 进入强化学习领域需要做哪些准备

图片截取自 “japanese robot plays igo” by hiroaki maeda on Flickr www.flickr.comLicensed under CC BY-ND 2.0 creativecommons.org

片头片尾音乐Courante 1st Cello SuiteExzel Music Publishing (freemusicpublicdomain.com)Licensed under Creative Commons: By Attribution 3.0creativecommons.org

展开Show Notes
邢永伟
邢永伟
2021.7.21
田渊栋?
奶油枪
奶油枪
2021.7.21
封面好可爱呀
SeanWang
:
汪汪
哥白尼
哥白尼
2021.7.21
😍
风语黎明
风语黎明
2021.12.17
学习才能强国哈哈
七个梦
七个梦
2021.7.21
学习强国🐶
東風_9CXa
東風_9CXa
2024.3.30
大佬
Sssmiley
Sssmiley
2023.2.19
最后总结是强化学习 不是深度学习啦
HD590504t
HD590504t
2021.7.28
科普很棒啦
布朗主任
布朗主任
2021.7.21
厉害了!