Deepseek的第三次战役:国产AI如何挑战OpenAI?AI 前线

Deepseek的第三次战役:国产AI如何挑战OpenAI?

68分钟 ·
播放数4485
·
评论数22

1. Deepseed 的三大战役      00:00

2. 多模态竞争格局        03:15

3. 多模态技术现状与缺陷      09:11

4. 统一场多模态的初步尝试       14:35

4.1 清华唐杰教授的 CogVLM      22:04

4.2 Yang LeCun 和谢赛宁教授的 MetaMorph     27:46

5. Janus-pro 系统架构      30:59

5.1  Adaptors + Pretained Encoders      31:24

5.2  AutoRegressive Transformer + Rectified Flow Model     33:48

6. 模型训练成了炼金术      37:05

6.1 分成三个阶段来训练      38:58

6.2 每个阶段的时长的配比      40:41

6.3 每个阶段不同类型数据的配比      42:26

7. 训练成本      48:20

8. 两个先进武器迎战最后的决战    51:12

8.1 用流体力学来生成图像      52:45

8.2 当多模态与 MLA 和 MoE 融合      62:48

9. 总结       66:10

1.  Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling

2. JanusFlow: Harmonizing Autoregression and Rectified Flow for Unified Multimodal Understanding and Generation

3. CogVLM: Visual Expert for Pretrained Language Models

4. MetaMorph: Multimodal Understanding and Generation via Instruction Tuning

展开Show Notes
張小米粒
張小米粒
2025.2.23
主播的南京口音好重
邓侃AI
:
确实是南京人,被你听出来了 😂
Lalania-D
Lalania-D
2025.2.16
声乐有点低,听起来有点费力。
Ray____
Ray____
2025.2.12
生成图像的网络一般叫解码器吧
邓侃AI
:
是的,解码器, 我是不是口误了?给我时间戳,我听听
Ray____:28:57
3条回复
薛薛_D4ED
薛薛_D4ED
2025.6.15
内容真心不错,就是语音质量和噪音影响听感
真心受教了,把好多观点都集合起来,让我们快速的获取核心知识点,赞👍
HD613174x
HD613174x
2025.3.11
有没有硬核技术类的AI播客?
cherdz
cherdz
2025.3.08
侃爷 你所提到的语言的语言是不是就是所谓的“信息”如果这些向量都可以通用的话 是不是可以预见vision pro的应用程序开发的降低 后面会生态大爆发
MissWednesda
MissWednesda
2025.3.07
感谢侃爷!认真听了两遍,弱弱的提个小建议,我耳机音量放到最大好像也才能正常听到,可否把原始音量放大一些,感谢分享!
陈威
陈威
2025.2.25
说的太精彩了 深入浅出,难得的非常专业独到的观点
__noble__
__noble__
2025.2.21
44:40 调比例在deepseek 67b里也详细说过
__noble__
__noble__
2025.2.21
34:46 所以实际上是上下游不一致吧
这跟微信公号是同一人吗?
moc
moc
2025.2.13
👍
烧锅炉的立大功🤦
Nan木南
Nan木南
2025.2.11
不明觉厉!
谈得来
谈得来
2025.4.12
其实普通人真的用deepseek做不了什么,实实在在说,现在人工智能大模型无非就是组稿、生成图片、制作小视频,可是每天搬砖打工的人也不写报告也不做设计,冷静冷静吧,人工智能发展基础是替代人类大量算力而产生的,所以不要盲目追风,踏踏实实做事劳动赚钱才是最美的。
目前网络上充斥着卖deepseek教程的,线下培训班等等要理性消费。
一些重复性大数据分析或者筛选或者重组才是人工智能的需求,例如海量信息中如何找到自己想要的贴合自己需求的需要deepseek去深度输出,再有设计图片想要效果图他会快速成型,再修图。
还有,本地部署是收费的,而且调用不同API也得根据数据收费,所以不要过度宣传,人工智能还在初级阶段,而且把更多算力释放给科研人员,让他们培养更加智能的大模型造福解放劳力!
支持播主的普及科技方法。
加油加油加油
__noble__
__noble__
2025.2.09
00:32 v3主要是讲工程优化吧
邓侃AI
:
同一件事儿的不同侧面,我的说法是站在系统角度,把整个系统分为 infrastructure 平台,以及平台之上的 R1 和 Janus, 你的角度是从改进的目标,模型尺寸更小,但是能力不弱,甚至更强, 都正确。