大模型是如何炼成的——训练篇

大模型是如何炼成的——训练篇

110分钟 ·
播放数3133
·
评论数17

自 2022 年 11 月底 ChatGPT 发布以来,大模型的热度持续发酵,相信高屋建瓴的讨论大家已经看了很多了。所以我们选择从实用角度,分别就算力、算法、工程、数据和团队讨论了训练一个千亿参数量级的大语言模型和ChatGPT需要些什么,希望能够给正在尝试拥抱大模型的业务决策者和技术人员一些有价值的参考。

收听指南:

01:41: 当我们讨论大模型时其实是在讨论什么?

11:37:想训大模型?这里有一张入场费账单

21:15: 如何训练大模型效率会更高?

1:17:07:训练中文大语言模型,你的数据够用吗?

1:27:23:训出大模型,人海战术可能并不好使

1:33:36:One More Thing,嘉宾的互问互答

播客讨论精华文字请见 OneMoreAI 微信公众号

本期主播:Kiwi、冠叔、龙老师、欣然

本期BGM:Prelude from Cello Suite No.1 in G major, BWV 1007,by Johann Sebastian Bach

展开Show Notes
OrangeCLK
OrangeCLK
2023.3.21

黑咖黑咖
黑咖黑咖
2023.3.25
提一个小建议,主持人有没有可能稍微「了解」的使用频率
好奇的奇异果Kiwi
:
谢谢建议 主持人听录音的时候意识到了这个习惯在播客录制中对听众不友好 影响了大家的听感很抱歉 之后会注意改进
黑咖黑咖:谢谢!期待未来能听到更多高质量的节目
郝二
郝二
2023.3.25
欣然单身吗?声音好性感呀
马哲
马哲
2023.3.20
好专业!听的津津有味🫡
HD1020487i
HD1020487i
2023.3.21
你好,我是虎嗅的编辑,我看到了你们公众号发的文字版,想咨询一下是否可以授权我们转载?
HD180934h
HD180934h
2023.8.30
里面提到的这篇“如何聪明的训练大模型”文章求个链接
主持人控制一下“可以”的使用哦
28:25 天啊啊啊,怎么能发出这么可爱的声音。老阿姨的花痴要犯了
欣然的声音好好听哦
58:55 原来还能这样
03:36 稀疏稠密是啥意思?
Lu山煙雨
Lu山煙雨
2023.3.22
05:45 应该是100 billion 一千亿
Lu山煙雨
Lu山煙雨
2023.3.22
03:10 一般认为千亿参数是一个门槛,超过这个级别一般才会出现模型能力的涌现
kriskris
kriskris
2023.3.22
干货
游翼
游翼
2023.3.15
先订阅再看!