OpenAI从来没让人失望过。一石激起千层浪,在春季发布会上推出最新大模型 GPT-4o ,能够实时“推理”音频、视觉和文本,这种多模态能力,在教育、医疗等领域将带来具大的应用潜力。
本期我们将围绕“GPT4o”带来的新变革、新机会,邀请我们的新嘉宾@AI算法工程师刘崇寒,一起与我们探讨相关问题。
欢迎你的聆听~
#AIGC #AI #人工智能
【ShowNotes】
00:26 OpenAI 的发布会后是什么样的感觉?
00:57 多模态:端到端
09:16 Pi和4o技术背后的差异
12:46 快乐的说 apple 是一个token,很丧的说 apple 是另外一个token
15:29 SORA为什么让人惊艳?
17:13 开源会落后?
18:03 随时打断随时接上,背后的技术难度在哪儿?
22:27 scaling law 失效了吗
25:22 文本卷过后,卷 long context、MoE、强化学习
32:16 4o免费开放,API价格下调,背后意味着什么?
35:02 我们人类和机器的交互方式是不是发生了变化?
38:01 苹果IOS18内置大模型
39:26 手机会向新的硬件设备迁移吗?
41:03 "指令"的消失
42:00 4o展现出“恰当”的幽默,这件事有多难?
44:50 Claude和 GPT到底有什么差异
47:43 为什么国内很多人觉得KIMI好用?
52:24 模型的好坏:普通人评判模型好不好用 vs 专业的人评判模型好不好用
53:25 现在离 AGI 的距离还有多遥远啊?
54:16 4o的发布对创业方向有什么影响
59:33 4o怎么能够用到我们自己的工作当中?
【关于主播】
包子:
AI商业应用专家/总工程师,互联网连续创业者,爱好思考和认知。
ID:包子阿巴阿巴
修饼:
科普博主,出版科普读物《迷你物理学》,AI短片创作者。
ID:修饼/修饼想当然
【关于我们】
从AI商业化视角,聊聊AI能不能把所有行业重新做一遍。
聊聊ai领域的新发现、新机会、新认知。
出发,一起看看未来~
【听友交流】
关注公众号:银河早餐铺
微信号:Edward_y