01:07 苏黎世大学的研究:AI说服力超越人类
- 研究在Reddit的r/ChangeMyView社区进行实验,发现AI生成的回应比人类更具说服力
- 该研究在未告知社区的情况下进行,引发了学术伦理争议
04:01 Cursor:重塑编程体验的AI工具
- Cursor商业上已取得巨大成功,ARR达3亿美元
- 观点:工程师角色的转变,未来编程将更像使用自然语言描述"意图",AI负责实现细节,工程师的核心竞争力将转变为对产品和逻辑的"taste"以及任务分解能力
05:50 AI编程模型的能力之争
- Claude 3.7可能已不是编程领域的第一,Gemini 2.5 Pro和Qwen 3展现出强大能力
- Chatbot Arena等排行榜面临可信度挑战:
- 模型提供商可能私下测试大量模型,只提交表现最好的结果
- 不同模型的采样率差异很大,影响评估数据量
- 评估条件随时间变化,退役模型的历史分数可能不反映当前性能
引用来源
- 苏黎世大学论文:Can AI Change Your View?
- Cursor CEO做客Lenny's Podcast
- Cursor创始团队在Lex Fridman的播客
- 来自Cohere、普林斯顿、斯坦福大学等的论文The Leaderboard Illusion
主播:NotebookLM
编辑:兔非、NotebookLM
剪辑:NotebookLM