在 AI 大模型时代,我们究竟在构建一个怎样的系统?这个系统是怎么样创造了内容,又会怎么样反塑人类内容创作这件事?AI 大模型对内容创作、社会结构、个体思维方式究竟带来了怎样的震动与可能性?我们从 Transformer 结构、GPT 的技术跃迁,到 AGI 的理想图景,从技术的效率革命聊到创作者的焦虑与自洽,试图拼出一张「技术 × 人文 × 创造力」的时代剖面图。
嘉宾介绍
Mike:CS本硕、一位在一线互联网大厂工作的算法工程师,参与了 NLP、文生文、多模态方向的技术落地与探索。
shownotes &时间轴
Mike 的技术之路:从研究生选修课到大模型时代的参与者
00:02:01 为什么走上 NLP 与大模型的路径?
00:03:32 最早参与的 image caption 项目与其社会意义
00:06:35 从自动摘要到大语言模型的转型过程
GPT 前后:技术范式的巨大转变
00:09:43 GPT 之前:细分任务;GPT 之后:统一模型思路
00:12:52 Scaling Law 的极限与争议:参数堆叠是否到底?
创作的边界:生成式 AI 是搜索引擎还是创作者?
00:15:43 “AI 是一个更聪明的搜索引擎”的本质判断
00:17:30 内容创作者的焦虑与“剽窃”争议
00:41:12 个性化与大模型的统计结构是否天然冲突?
AGI 的可能路径与系统构建想象
00:20:53 AGI 是什么?不同技术门派:OpenAI vs Meta
00:24:22 Deepseek 的推理创新意味着什么?
00:27:59 我们究竟在构建什么系统?从瑞士钟表到 Jarvis 的想象
大模型时代的应用与未来方向
00:36:17 文生文、图、视频:基础模型的差异与融合趋势
01:01:02 多模态推理、Agent 规划:Mike 当前研究方向
01:02:17 Jarvis 式 AI 助手:理想应用图景需要的技术条件
从技术的宏观到个人主义的微观
00:29:24 AI 如何激发个体创新?它正在如何重塑内容生产?
01:10:00 工业革命式社会结构重塑:AI 是否也将如此?
01:15:50 零基础如何使用 AI?从 Chatbot 和轻量模型入手
本期播客提到的产品&算法
Kmeans clustering:en.wikipedia.org
NLP:aws.amazon.com
chatbot:www.ibm.com
大模型预训练:transformers.run
FLAN:arxiv.org
T0:A Prompt-Based Zero-Shot Learner:www.promptingguide.ai
Transformer 架构:en.wikipedia.org(deep_learning_architecture)
GPU(Graphics processing unit )en.wikipedia.org
scaling law:www.youtube.com
大模型幻觉
统计学习理论
prompt
few shot & in context learning
“大模型不是在创作人类世界以外的东西,它是在对既有知识进行一种重组。”
“大语言模型更像是一个更聪明的搜索引擎。”
“如果有一天我说出来的每个想法都能被AI实现,那我一定会更大胆地去做梦。”
“真正的问题不是模型有没有幻觉,而是这个世界本来就充满了不确定的数据。”
“AGI 不是取代人,而是成为思想的放大器。”
“我们不是在训练一个答案机器,而是在调教一个偏好化的思维镜像。”
“AI 没有当好一个助手,但它正在努力成为每一个人的助手。”
做一期播客的初衷就是希望和大家多多探讨去争夺未来技术主张的可能路径
推荐嘉宾或者对播客有一步留言欢迎联系jaydezhang0901@gmail.com
最后感谢您的收听:)

