🎯左右互搏的AlphaZero大法,是怎样炼成的? 樊麾/东东枪/北冥乘海生科技修道院

🎯左右互搏的AlphaZero大法,是怎样炼成的? 樊麾/东东枪/北冥乘海生

85分钟 ·
播放数3088
·
评论数49

樊麾老师又来做客了!上次播客(www.xiaoyuzhoufm.com) 中,樊老师将自己亲身经历的围棋奇点事件——AlphaGo大战李世石讲述得无比精彩,后台也是催更评论不断。

上次的内容在五番棋大战的第四局意犹未尽地结束,今天的话题也就从这里开始。

赢下了人类面对AI最后一盘胜利的李世石,五番棋大战虽败犹荣。然而,AlphaGo团队却在对局中嗅到了危机——第四盘AI的那个误算,如果不能解决,在下几盘的话,像李世石这样的高手,大概是能摸出规律来的。

这个担忧,不幸地被樊麾老师证实了:在赛后与AlphaGo无数盘的对局中,樊老师因为摸到了AI的弱点,只要有针对性地设计棋局走向,胜率居然可以接近百分之百!

因此,当面对柯洁的叫阵时,AlphaGo团队决定:如果不能从根本上解决这个问题,只好不应战。而时间一天天过去,进展却始终不如人意。就在这时,樊麾老师的一句话,似乎提醒了哈萨比斯和他的团队......

在新的思路下,不仅原有的问题得到彻底解决,还彻底抛开了人类棋谱的束缚,诞生了AlphaZero这一靠左右互搏就能武功大成的革命性方法,而樊老师,也成了Nature文章作者中有史以来第一个围棋手。

这里的精彩故事,欢迎大家收听评论!

主播:@东东枪,@北冥乘海生,交流群请加bmchsl

展开Show Notes
纺车鸣露
纺车鸣露
2025.4.27
有点夸张的说,今年诺贝尔化学奖有樊老师贡献啊
huan9huan
huan9huan
2025.4.28
牛逼的播客,充满真正的价值
北冥乘海生
:
您多转发支持
蓝碰碰
蓝碰碰
2025.4.27
00:09 终于盼来这期了
蓝白蛙
蓝白蛙
2025.5.01
李世石是真的牛, 巨大的压力下赢了,意义非凡,如果没赢, 就不知道deep mind会不会优化bug, 可能要等和柯洁对战之后才发现bug,才会去加深神经网络层数。 AI进步时间又得推后了, 大模型的进步时间也得推后几年。 openai里面的人很多都是从deepmind过来的。 真的是蝴蝶效应, 那一步棋推进了AI进步进度。 李世石自己可能都不知道这个意义!
浩歌_oHDv
浩歌_oHDv
2025.5.03
我一直以为bug是说人类故意下一手意想不到的棋而AI不知所措,方寸全乱。今天才知道这步于人类棋手而言正是首选。这些细节,亲历者道来 。
蓝白蛙:所以才说李世石牛啊。
浩歌_oHDv:某种意义上说,李世石这手成了最优点解?那这手的优势应该很强。
4条回复
jaime-y
jaime-y
2025.4.26
没听先点个赞👍
e2e
e2e
2025.5.01
视频啥时候上啊?太精彩了👍
北冥乘海生
:
很快,请移步b站。
e2e:加修道院特别关注了,期待
M0-mo
M0-mo
2025.5.14
那个电影叫啥
M0-mo
M0-mo
2025.5.14
曾经的半拿铁忠实听众,现在移步修道院了。加油
小龙_tdOR
小龙_tdOR
2025.5.14
太精彩了!!
那天我记得特别清楚…
肖洋
肖洋
2025.5.08
57:04 less structure more intelligent
HD267857z
HD267857z
2025.5.06
等到了
杨名流
杨名流
2025.5.02
精彩
方文毅
方文毅
2025.5.02
感觉樊老师推动了整个ai的发展啊
涛_kFN9
涛_kFN9
2025.4.30
过瘾
HD356420b
HD356420b
2025.4.29
快!赶紧让樊老师继续来!太精彩啦!
蹩脚卧底
蹩脚卧底
2025.4.29
1:23:59 还有下集呐,朋友们!
Hector_oCPD
Hector_oCPD
2025.4.29
Alphazero 不会跑征子好像没说? 龙飞虎就是丁伟
Fiend_2077
Fiend_2077
2025.4.28
成评书了~👍