EP 53. AI Agent会取代程序员吗?硬核对话硅谷顶尖研究员与AI独角兽:软件开发的未来,Agent的技术本质

EP 53. AI Agent会取代程序员吗?硬核对话硅谷顶尖研究员与AI独角兽:软件开发的未来,Agent的技术本质

167分钟 ·
播放数19248
·
评论数78

今年上半年 AI 领域最大的热点,除了 OpenAI 的 Sora 之外,当然就是——AI程序员!与 Github Copilot 的代码补全不同,AI Agent 公司 Cognition Labs 和其产品 Devin,宣称世界上第一位“AI 软件工程师”,拥有全栈技能,通过一个指令就能完成整个开发过程。可以端到端构建和部署程序。成立不到半年,估值就高达 20 亿美金!相应的,从Princeton SWE-agent, 到开源项目OpenDevin 这些直接竞争者,到Replit, Augment 等独角兽玩家,都纷纷进入这个领域。这是新的泡沫,还是不远的未来?

Hello World, who is OnBoard!?

这一期我们邀请的三位来自硅谷的嘉宾,在这个领域都太有发言权了!有著名的软件开发云平台独角兽 Replit 的 AI 产品核心成员,有 Agent 领域数个奠基之作的顶尖研究员,还有 ex-Google Deepmind, 现任明星 AI 编程辅助独角兽公司 Augment 的早期核心研究员。

借着小酒,我们长达两个多小时的对话,畅聊了你最关心的话题:

AI 会取代工程师吗?

AI取代了一部分软件开发需求之后,会如何重塑软件开发?

Devin 是否能代表 AI Agent 应用开发的方向?

Agent 产品未来还会迎来怎样的提升?基础大模型的边界在哪里?

最后,生成式 AI 对个人职业和社会会产生怎样的深远影响?

这或许是市面上你能听到的对于这个话题最深入的讨论(之一?!)——还有,结尾有来自 Princeton 高材生的彩蛋!

Enjoy!

嘉宾介绍:

  • 李珎:Replit AI 团队负责 AI Coding agent,ex- startup 创始人, ex- Googler。Replit 成立于 2016 年,是一个基于浏览器的 IDE,允许用户在多种编程语言中编写、运行和分享代码。2023 年$97.4M 的 B 轮,投资人包括 A16Z,Khosla Ventures、Coatue 等,估值 $1.16B
  • 姚顺雨:普林斯顿大学博士,清华大学获学士。他在Agent 领域发表了一系列非常有影响力的论文:从有奠基意义的 ReAct,Tree of Thoughts, 到成为行业标准的基于 GitHub 的代码能力评估数据集 SWE-Bench,到首个开源AI 程序开发 agent 项目 SWE-agent,是绝对的天才研究员!
  • 赵宇哲:Augment 任 AI 研究员,曾在Google Brain(现Google Deepmind)任 Staff Research Engineer,主要研究方向是语言模型预训练,指令训练,神经检索和检索增强语言模型。Augment 成立于 2022 年,是一家为提供企业级全栈式 AI 编程助手的初创公司,由硅谷著名老牌风投 Sutter Hill Ventures 孵化(Snowflake也诞生于此),并在最新一轮获得由Index Ventures、Lightspeed Venture Partners 和 Google 前 CEO Eric Schmidt 等领投的 2.5 亿美金融资,估值接近 10 亿美金。

OnBoard! 主持

  • Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学
  • 高宁:前美元 VC 投资人,Global SaaS 社区及服务组织 Linkloud 联创,公众号我思锅我在 (ID: thinkxcloud) 主理人。| 即刻:High寧

我们都聊了什么

03:30 三位嘉宾背景、如何进入AI领域以及最近常用的AI产品。

20:26 Replit是如何设计AI产品的,背后逻辑是什么?

28:58 Replit需要训练Coding专属模型的原因是什么?

34:04 训练代码或数学等专属模型的目的是什么?

37:50 现在Coding模型跟基础大模型的能力相比有什么差异?

40:51 Coding模型的训练方法对基础大模型的训练还有什么启发?

45:26 为什么Replit当初选择构建自己的IDE,以及对后来AI功能设计的影响在哪里?

51:01 为什么Augment选择以插件的形态服务专业程序员,以及难点在哪里?

55:27 为什么RAG能更好理解企业级Codebase的需求?

58:13 使用RAG的过程中最有挑战的地方在哪里,以及如何保证准确率?

63:38 Augment如何将服务企业的产品标准化?

67:04 为什么短时间内具有更长Context的大模型仍无法替代RAG?

69:57 为什么没有针对Coding能力好的Benchmark,以及SWE-Bench诞生的背景?

73:48 什么是SWE-Agent,以及Agent解决了什么问题?

78:50 为什么SWE-Agent或Devin相比RAG的准确率有很大提升?

81:33 SWE-Agent跟Devin的差异在哪里?

83:12 往后这类Coding agent的准确率提升会在哪里?

86:50 回顾Agent领域的发展,其中有哪些重要里程碑?

93:01 是否有必要训练针对Agent的大模型?

98:37 Replit是如何探索Coding agent的?

102:03 对Devin印象最深刻的是什么,还有什么是不知道的?

105:43 Devin现在的用户画像可能是谁?

109:45 为什么Coding agent能力提升不仅在大模型上,还需在产品化上?

116:46 顺雨最新一篇解决奥数问题的研究对Coding模型有什么启发?

120:31 现在基础大模型的能力提升还在哪里,还有哪些是我们不知道的?

122:15 大模型是否具备System 2的慢思考能力,以及我们如何实现?

127:13 关于Multi-agent,Replit在做怎样的探索?

131:13 如何定义Multi-agent系统,什么情况下需要?

135:08 要实现Multi-agent环境,具体会面临什么挑战?

137:31 展望未来,AI编程究竟会如何重塑软件开发流程?

145:45 基于语言模型的Agent带来的社会影响有哪些,人类真的会被替代吗?

158:56 最后,快问快答:今年研究的小目标、业余爱好和短期内AI最期待的事件?

165:14 彩蛋!来自顺雨的一段RAP,欢迎来到“宇宙中心”!

我们提到的公司或产品

我们提到的论文或文章

欢迎我们的微信公众号,了解更多中美软件、AI与创业投资的干货内容!

M小姐研习录 (ID: MissMStudy)

我思锅我在(ID: Thinkxcloud)

欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。

OnBoard! 终于成立听友群啦!新年新气象,加入Onboard听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes, 发送你的姓名、公司和职位,小助手会拉你进群。期待你来!

展开Show Notes
内容很好,但就是嘉宾的声音听不太清,得非常非常集中才能听清在说什么
有人跟我说:开启设置中的人声增强
Ben_uGTu:同感,听不太清楚
9条回复
至少给每个嘉宾配个收音的麦克吧,好像不止一次了,这声音质量太差了,都要听不下去了。准备找个模型翻成文本总结来看了
骁霖
骁霖
2024.5.16
能不能不用Mac电脑录制声音,用一个简单的录音设备效果就会好很多,这个声音质量听着很辛苦。因为我同事与客户开会就喜欢用Mac电脑录音,听着效果是完全一样的,非常辛苦才能听清内容。建议去买一个会议麦克,效果好太多了
Alan42
Alan42
2024.5.17
听不清是容易走神🥺
HD249687n
HD249687n
2024.5.15
太棒了!非常高质量的访谈如果有show note summary就更好了
NLive
:
小宇宙能不能出个 ai 总结哈哈😂
NLive
:
嗯嗯 我们这几天稍晚有点忙 这周马上处理请求 感谢等待!
3条回复
HD636422z
HD636422z
2024.5.22
开头提到的好用的AI产品是Perplexity吗?
linusturing:是的
红咕宁
红咕宁
2024.5.19
1:29:52 第一件事 action space,然后是decision making。目前action space 大多not well defined.
Jasmine_O1aJ:所以coding比较好定义?想听更多的例子
Eric0112
Eric0112
2024.5.18
音质太差了,这么优秀的受访者有点可惜。看能否用一些ai工具净化一下音效?
AI-Nate
AI-Nate
2024.5.18
Rap很棒啊!👍
oliviak
oliviak
2024.5.16
音质效果确实一般,内容真好,但要在家里安静的听
Jasmine_O1aJ
Jasmine_O1aJ
2024.5.26
58:51 这里是重点
Jasmine_O1aJ:学术界retrieval,标注hard
Wendy_1
Wendy_1
2024.5.22
嘉宾说的这个搜索工具是什么?
北纬27度
北纬27度
2024.10.21
短短几个月变化真快,嘉宾提到的 buildspace 前不久关掉了,opendevin 也转成一家叫 all hands 的商业化公司了
罅喺lumpy
罅喺lumpy
2024.6.04
来了
李得水
李得水
2024.5.30
Program language 确实需要进化,期待自然语言编程早日实现
十月Angel
十月Angel
2024.5.20
声音啥都听不清,简直是听力练习,太嘈杂了
红咕宁
红咕宁
2024.5.19
Language as interpretation, visual as perception
hal呀
hal呀
2024.5.19
这期录音似乎有些问题..听得费力
Damon_NWGA
Damon_NWGA
2024.5.19
嘉宾声音听不清
AI-Nate
AI-Nate
2024.5.17
24:00 说的主要功能都是MS Copilot的功能,在VS加插件可以实现了。是有其他特别的地方吗?