【节目简介】
本期我们要聊的话题,可能正在悄悄改变你玩游戏的方式——是的,它可能是你遇到过最聪明的NPC盟友,也可能是让你摔手柄的BOSS级对手,它就是——游戏中的 人工智能!
今天的AI早已突破『脚本触发器』时代——从深度学习生成的动态剧情,到能像人类一样学习的竞技对手,甚至那个让无数玩家后背发凉的问题—— 你确定屏幕对面的『队友』,真的是人类吗?
本期节目,我们邀请到了一位一线游戏大厂的“赛博训练师”,也是资深游戏玩家的Byron。让我们拿起武器,穿好装甲,一起进入游戏AI的迷宫冒险。
【主播】
Erik,《E期E会》播客创始及主理人
【本期嘉宾】
Byron,某一线游戏大厂AI研究员 & 算法工程师
【你将听到】
02:00 - 游戏AI的应用场景
- 陪玩局:通过AI降低玩家连败的挫败感,提升正反馈。
- 匹配优化:在中高端玩家稀缺时段,投放AI缩短等待时间,维持游戏体验。
- AI占比通常不超过20%,核心目标是平衡玩家情绪而非替代真人对抗。
05:10 - 技术细节:强化学习与PPO算法
- “巴甫洛夫的狗”:强化学习通过奖励与惩罚机制训练AI。
- PPO算法(Proximal Policy Optimization): 商业应用中成熟稳定的强化学习算法,平衡探索与利用。 训练需庞大算力集群支持,工程适配复杂(如环境感知、操作指令)。
- AI训练的正反馈机制:开发者通过“电子斗蛐蛐”观察AI对战,优化策略。
10:14 - 行业趋势与跨领域结合
- 大模型(如GPT)推动AI普及,但游戏AI更早探索技术落地(如NPC对话、动态剧情)。
- 案例:英伟达DLSS技术通过AI提升游戏画质,显卡与AI的协同进化。
13:53 - 如何成为赛博训练师
- 从金融数据分析转行AI:追求“活”的反馈(如训练AI在游戏中动起来)。
- 关键转折:AlphaGo与OpenAI Five激发兴趣,选择强化学习与游戏结合。
- “赛博训练师”的成就感:创造动态智能体,感受“上帝造人”般的正反馈。
- 少年感的本质:持续的正反馈驱动热情,而非单纯“热爱”。
30:03 - 奖励与反馈
- 内部奖励 vs 外部奖励: 游戏设计通过密集反馈(如经验条、装备掉落)让人上瘾。 职业选择需平衡外部奖励(薪资)与内部动机(兴趣)。
- 游戏AI的潜力:提升研发效率(如自动化测试、内容生成)。
- 挑战:魂系游戏的“高难度门槛”类比稀疏奖励,需优化训练机制。
【BGM】
Surprising discovery - lovescotch
Food and Drug - outerandeventhorizon
Guzheng City - Kevin Macleod
【节目制作】
后期制作:相桃
【在这里找到我们】
收听渠道:小宇宙|苹果|喜马拉雅|荔枝|网易云音乐|QQ音乐|蜻蜓FM
海外用户:ApplePodcast|Spotify|Youtube
联系我们:eqiehui@gmail.com
【听众群】
如果你是相关从业者,也想获得更多创业、投资、生活的前沿信息,欢迎申请加入听众群,和更多专业人士一起探讨学习。
添加方式:Rasodle,备注:E期E会+姓名+公司
【团队招募】
我们也在招募播客实习助理,你将有机会获得宝贵的播客制作经验和嘉宾建联互动机会以及各种神秘福利,如有兴趣请添加:Rasodle,备注:E期E会实习+姓名+学校