与 Koji 的 2025 开年对谈:AI 关键之年,Agent 开启元年

与 Koji 的 2025 开年对谈:AI 关键之年,Agent 开启元年

100分钟 ·
播放数49985
·
评论数60

2025 开年第一期,是「此话当真」与「十字路口」的串台节目。站在新年年初的时间点,雨森和 Koji 最近都很兴奋,因为正在亲历科技史上一个重要时刻。这种感觉源自两个重大事件:一是 Devin 的公开,二是 OpenAI o3 模型的发布。

Devin 为何如此令人兴奋?半年前,雨森做客「十字路口」时曾打过一个比方,「大模型还是小学生,别着急让它去打工。」而在亲自体验过Devin之后,雨森认为,作为第一个真正能用的 Agent 产品,Devin让人们看到了工作的 Scaling Law。从「你问我答」到「你问我做」,在 AI 能够异步自主完成计划与执行后,摆在每个人们面前的新问题已经变成了「如何学会当 AI 的老板。」

本期节目,除了探讨 Devin 的使用感受与技术飞跃以外,我们还回顾了过去一年 AI 行业的快速发展,并展望着 2025 年属于 AI 创业的大机会将是什么。

新年宜畅想。AI 技术的发展波涛汹涌,然而只要深入其中就能看到,令人惊叹的进步总发生在一次次具体而微的努力中。新的一年,就让我们继续满怀期待,且看这滔天巨浪,将带人们驶向何方。

祝大家新年快乐,拥有爱和希望。

【主持人】

戴雨森:真格基金管理合伙人,投资了包括月之暗面在内的多家头部 AI 公司
Koji:
「十字路口」主播,新世相/躺岛的联合创始人

【时间轴】

PART 1: 2024
02:19 用一个字形容2024年的感受:「快」
10:06 未来已来,但尚未均匀分布
11:58 AI 应用落地新要件:幻觉减少、编程能力提高、计算机使用
14:35 AI是属于00后创业者的时代吗?新一代创业者身上的共性?
17:03 过去一年的超预期进展:预训练进入瓶颈、Agent落地加速、大模型成本下降
20:50 新的产品形态,将在「强化学习」和「上下文语境」中诞生
26:30 AI编程发展四段论:ChatGPT → Github Copilot → Cursor → Devin
30:22 为什么鼓励 AI 出海?鼓励什么样的人出海?
32:45 给中国创业者的出海建议:想清楚「做什么」+「如何推广」

PART 2: 2025
37:02 Devin 为何如此令人兴奋?月薪500美金的全能「实习生」
40:37 从 Devin 中,体验到了怎样的未来?
42:36 新范式的特征:异步体验、云端虚拟机、知识积累、任务收费
54:47 「Cursor 是程序员的Copilot,Devin 是老板们的 Scaling Law。」
01:05:08 对AI保持乐观:人、模型、产品,PMF 磨合仍需耐心
01:11:27 2025年,什么应用方向更容易落地?创业边界在哪里?
01:17:16 暗含潜力的新技术浪潮:Agent、可拓展个性化、o3
01:30:08 生成式 AI Native 的大机会长成什么样子?
01:33:30 2025年,投资人的共识与非共识

【延伸阅读】

Devin

OpenAI o3:

【Staff】

监制:Wendi、Zoe
后期:Keyone Studio

【关于真格】

《此话当真》是一档由真格基金出品的泛商业类播客,真格基金投资团队将在此和各领域的领军人物一起分享最新热点和行业洞察。

真格基金创立于 2011 年,是国内最早的天使投资机构之一。自创立伊始,真格基金一直积极在人工智能、芯片与半导体、机器人与硬件、医疗健康、企业服务、新能源、跨境出海、消费生活等领域寻找最优秀的创业团队和引领时代的投资机会。

真格,你的创业第一站!

【联系我们】

公众号: 真格基金(ID: zhenfund)
官网链接:www.zhenfund.com
邮箱:media@zhenfund.com

你可以通过小宇宙、苹果Podcast、喜马拉雅收听我们。
如对节目有任何的建议与期待,也欢迎大家在留言中互动~

展开Show Notes
听到一个小时,做了许多记录,结合我们现在自己的项目,感兴趣朋友可以交流

00后ai创业独特优势:年轻,国际化视野,国内国外一起走,ai 原生
但没经过互联网的流程,包括推广运营商业化等方面经验不足,需要老司机

18:10 互联网数据是化石燃料,被我们消耗的差不多了。但关键在于,人类脑子里尚未被提取的知识,以及ai合成的数据

23:00 目前用ai都是一问一答,没有之前聊天的上下文,用户个性记录等等,输出出来的东西当然质量不高
所以,如何在产品设计中,让用户无痛输入自身更多的,更高质量的信息,并被ai理解存储,是最重要的事之一
一问一答还是非常原始的方式

22:30 现在ai回答都是系统一,几秒钟就答出来
如果系统一系统二结合?有些很复杂的问题,思考20分钟给你答案?
现在这是逐渐能做到的

25:00 context上下文的应用特别特别特别重要,甚至是最重要的,谁能真正把用户深度高质量数据获取到,存储好,应用好,结合新的产品形态,就是王炸

27:00 这个比喻很有意思,现在一问一答,就像是只能写一封邮件的笔友一样。这个上限太低了

32:00 工程师和市场类型的执行能力特别重要,但定义关键问题的能力同样特别重要
对用户和需求的洞察,技术发展趋势的洞察,人性洞察

34:00 巧妙的做营销,利用自己产品的特性。非必要不投流,真知道用户是谁,为什么用,用户在哪,精准kol性价比极高

37:00 新视角
人类过往的工具就是两种
一种是需要持续注意力的(比如锤子,电脑)
一种是重复机械的(洗衣机)

Devin是第一个真正像真人实习生一样,既不需要你持续注意力,又能解决复杂问题的。在体验过程中,有很多细节会让你有启发,感觉未来产品就是这样的

55:40
未来会有产品经理型的ai,调度很多程序员ai去做事情
那我反问:未来是不是教练型以人为本的ai,慢慢就会成为所有ai的上游?
能力逐渐扩展,数据逐渐丰富时

56:00
工作的规模效应(scaling law)
有钱有算力,就能堆叠更多的生产力工作效率
当执行本身变成不是一个稀缺资源时,【做什么】就变成一个极其重要的问题,未来每个人都需要有【老板意识】,知道要做什么

管理AI agent比管理人容易多了,需要的就是钱和算力
未来企业就是两方面:少数最顶尖人才的吸纳,大量AI Agent的协调调度

1:04:00
看到亮点而不是问题,看到未来更多可能性而不是今天值得批评的点
批评者往往正确,建造者成功
我们现在要服务的是前者,是Prosumer
Eva_YxhU:好棒!!
YUYINGSUN:感谢!!
3条回复
关山_WHZo
关山_WHZo
2025.1.09
就想问这个小宇宙APP,能不能也结合一下AI,让节目都可以有文稿,不难吧
HD724271y:阿里通义支持小宇宙播客解析
春泥村雨:这一点得到做的就不错,不仅有文稿,还跟着逐行颜色标识
3条回复
终于把全部内容都听完了,今天中午吃饭的时候打开小宇宙,看见推送了关于AI的话题。我原本对AI是不感兴趣的,但是通过这期内容,我觉得我是能够使用AI做到一些我所感兴趣的领域的事情。我对AI放下了偏见,今天中午我合成了一张我非常喜欢的图片,并当做了我的头像。把市面上有关AI的软件全部下载了一遍,我觉得我真的可以深入去学习,或许我一个文科生也能做一个程序员。
噶噶噶噶噶:你好,你这是用啥 ai 生成的啊
快雪时晴_v7e1:00:00 这个头像不是AI生成的,是古茗画的。
阿氓
阿氓
2025.1.14
1:04:16 📝看到亮点,而不是看到问题,看到未来的可能性,而不是看到今天值得批评的点。批评者是往往感到正确的,只有建造者虽然看上去笨拙,但他们更有可能会成功。
1:37:14 技术进步解锁更多应用机会
你问我答——你问我做的进步,agent
预测下一个action,cursor,与sonnet

移动互联网成熟期,产品特别容易使用。
技术早期,使用好产品是需要学习的
绝大多数人用ai,还没有把模型里的智能很好用出来的
模型中压缩大量大量智能,但是如何提问能更好提取更高质量的智能

我们还没有变成很好的提问者

原本使用者使用的目的是为了更好的赚钱,这使得prosumer能支付费用的

哪几个方向能做
1. 首先能帮客户赚到钱的,客户能付钱
2. 能提升10倍生产力的工具
3. 满足人性基本需求(黄色)

移动互联网的产品都是杀时间
针对普通人的陪伴,很难和抖音竞争的

现在有100个团队在做智能眼镜

25年会出现很多agent产品
(改变组织结构,改变原有工作流)

浪潮式的机会
1. agent要素:异步,工具使用,能规划,按照工作量付费
卖工作结果,而不是过程?

2. 可扩展的个性化(scalable personalization)
能否按照你的个性化需求生成你想要的东西
个性化是可以scale up的
(bolt.new,输入生成网站)

已有的软件开发是集中化,每人都一样的
现在或许可以实时生成

对精英人类的benchmark(ai能否通过)
o3就是为了解决人类没解决的前沿问题的

多端到多端的多模态输入输出,很重要
每个模态有每个模态最适合消费的形式
(比如,把三体变成适合视频消费的内容)

同时接收多端,同时发送多端

随着技术扩散,我们用新技术解决老问题
比如电子邮件,解决发邮件
门户网站,解决看新闻
电子商务,解决卖货
随着进一步扩张
人都上网了才有社交网络,信息上网了才有搜索引擎,买卖家物流等准备了才有电商


AI与AI的互动,有什么逻辑?
如何管理agent群

ai时代的商业化?
(互联网都是广告的商业模式)
比如ai会直接略过广告,广告没有意义的

杀时间的,留存很高的,靠投放起量的toc应用。没必要找字节跳动
犀牛勇士
犀牛勇士
2025.1.10
genai 产品可以起手直接做国际化的原因之一是这类产品相较于移动互联网时代的传统产品(信息流/电商/本地生活服务)更加地“轻资产”化,即生产/供给过程更加中心化,几乎只依赖开发商后端服务,而不需要创作者/商家/骑手这类社群资产,因而也就省去了地推的成本。
李子jojo
李子jojo
2025.1.09
超级喜欢这期 谢谢宇森
bcy_a52j
bcy_a52j
2025.1.08
沟通,了解业务,挖掘和定义用户真实需求,营销和销售技巧,是目前出海遇到的比技术方案要难的问题。
HD993762t
HD993762t
2025.1.16
25:38 多模态图像
1:32:55 AI时代商业化,对广告行业的冲击
量子Bug
量子Bug
2025.1.13
41:27 这种,我们一般把它叫做家畜。
02:32 来了!首发
木木山
木木山
2025.3.10
51:26 AI 可以帮你把人类历史上已有的结晶利用起来,因为迄今已经沉淀了非常多的书籍/代码等,知识可能你不知道,AI 可以帮助你把“寻找确认相关知识是否存在”的过程省掉。
菠萝卜罗
菠萝卜罗
2025.1.17
1:09:34 是的!想让ai更大程度地帮你达成目的,需要写一个好的提示词,还需要多轮你来我往地完善。对我来说,怎样写提示词真的是一门需要不断摸索的知识,现在网络上也找不到非常系统的教程,只能自己慢慢摸索了。
Jinyyy
Jinyyy
2025.1.08
06:49 拥抱变化 的含金量还在上升。从人员 业务 商业发展
Beluga111
Beluga111
2025.1.08
03:11 这里很多都是过拟合吧,不一定是真的能力提升了几十倍,只不过训练的时候就把这些任务都见过了
对的,我整理的报告里AI硬件小红书上的渗透度也是比较低的
BazaarHa:是说在小红书上讨论 “AI+硬件”的热度低么?有观察到是什么原因么?
银河系丽人:搜索热度比较低,远不如具体的应用场景。可能原因有很多,比如没有做用户增长的推广动作、产品力不足无法引发自传播,这些需要进一步结合内容数据下探
6条回复
52:15 您好。我是一个艺术家。毕业于人民大学。我在蒙古国与俄罗斯都展览国。我最近有个困扰。我只能在脑海中与自己手简单的表达自己的想法。很希望AI可以帮助我。文本故事梗概草图都有。希望可以有机会合作。万分感谢。
画画的朋友wwwgube:52:17 我的绿色泡泡软件。15233423631。我很想用“脸熟”与“非死不可“。我不知道怎么用。我很想与世界的艺术家交流。我感觉我被困在一个井里 。求帮助!
衷匹
衷匹
2025.1.26
未来已经到来了 只是没有均匀分布。
HD431339z
HD431339z
2025.1.09
不报道是担心有更多人模仿,希望广大文科研究者能提升专业水平,不要把总是主观的把事情都想的那么肤浅和片面