第20期丨AlexNet一战封神、深度学习崛起白话-大模型

第20期丨AlexNet一战封神、深度学习崛起

20分钟 ·
播放数116
·
评论数2

欢迎来到《白话大模型》的第20期 。

2012年的 ImageNet 图像识别大赛,原本在一片波澜不惊中拉开序幕,却因为一支名为“SuperVision”的神秘三人小队彻底改变了人类科技的走向 。65岁的“AI守夜人” Geoffrey Hinton 带着两名天才学生——Alex Krizhevsky 和后来声名大噪的 Ilya Sutskever,用两块普通玩家用来打游戏的显卡,以及一直被主流学界质疑的神经网络算法,以碾压所有对手40%的恐怖成绩完成了“屠榜” 。

本期播客,我们将一半讲故事,一半讲技术,带你重温这场宣告深度学习正式降临的破局之战 。我们将硬核拆解有着6000多万参数的超级怪兽 AlexNet,看看“双GPU并行”的工程奇迹是如何诞生的,以及 ReLU 和 Dropout 这两个看似简单却极其伟大的算法创新是如何运作的 。准备好,让我们一起回到那个AI技术突然“起飞”的历史奇点 。


  • 00:00:00 惊艳世界的破局之战: 回顾最初两届平淡无奇的 ImageNet 挑战赛,以及2012年那支将错误率断崖式降低到15.3%的神秘团队“SuperVision” 。
  • 00:02:21 穿越26年寒冬的守夜人: 65岁的 Hinton 老爷子带着学生重返赛场,证明了神经网络从来不是方向错误,只是“时候未到” 。
  • 00:04:03 幕后的两位天才门徒: 榨干两块英伟达显卡算力、事了拂衣去的 Alex,以及后来名满天下的 OpenAI 首席科学家 Ilya 。
  • 00:06:46 逼出来的工程奇迹: 面对装不下整个模型的硬件困境,AlexNet 如何巧妙地将网络劈成两半,实现双 GPU 独立并行计算与跨卡融合 。
  • 00:09:24 逐层解构超级怪兽: 深度拆解5个卷积层与3个全连接层,看模型如何从11x11大卷积核的轮廓扫描,一步步汇聚成最终的“猫”的概念判断 。
  • 00:13:55 大道至简的算法创新: 抛弃 Sigmoid 全面启用 ReLU 彻底解决梯度消失问题,以及通过“随机让一半神经元休息”的 Dropout 机制巧妙战胜过拟合 。
  • 00:16:38 一声发令枪响: AlexNet 的大获全胜如何引爆硅谷巨头的抢人战,催生“网络越深,模型越强”的新信仰,并为下一代神级模型 ResNet 埋下伏笔 。
展开Show Notes
XIIG
XIIG
4天前
有幸听到如此深入浅出的讲解,书何时能够拜读
TechAstra星科技
:
感谢鼓励。书还早😂机械工业出版社华章分社的流程特别长,可能要到七月份。 也可以去我的同名的,w x视频号,有图像,看起来更直观。