EP3: 验证的不对称性

内容简介

这篇文章核心围绕 “验证不对称性” 与 “验证者定律” 展开。所谓验证不对称性，指的是不同任务中 “验证” 与 “解决” 的难度关系存在差异：有些任务验证远易于解决，比如数独和填字游戏解起来耗时，验证答案却很简单，搭建像 Instagram 这样的网站需要工程师团队多年努力，普通人却能快速检查网站是否正常运行；有些任务则相反，验证比解决更难，比如核查一篇论文中的所有陈述往往比撰写论文本身更费精力，提出一个新的饮食假说很容易，验证其对大众是否有益却可能需要数年；还有些任务的验证与解决难度接近对称，例如计算两个 900 位数的和，验证答案与解题本身的工作量相差无几。

验证不对称性可以通过前期准备得到改善。比如竞赛数学题若有答案密钥，验证任何答案都会变得简单；编程题通过设计覆盖全面的测试用例，能快速核查代码正确性，Leetcode 正是采用了这种方式。不过，有些任务即便优化验证流程，也难以让验证变得轻而易举，比如 “说出一位荷兰足球运动员” 这类问题，即便有著名球员名单，很多时候仍需要一定的验证工作。

文章提出的 “验证者定律” 指出，AI 训练解决任务的难易程度与任务的可验证性成正比。具体而言，具备客观真理（大家对好的解决方案有共识）、快速验证（几秒内可完成验证）、可扩展验证（能同时验证多个解决方案）、低噪声（验证结果与解决方案质量高度相关）、连续奖励（易于对多个解决方案的优劣排序）等特性的任务，最终都会被 AI 攻克。这是因为在强化学习中，验证能力等同于创建训练环境的能力，而可测量的事物往往能被优化。

文中以 AlphaEvolve 为例说明，在科学创新领域，解决单个未被攻克的问题（此时训练与测试合一）极具价值。未来，验证不对称性的普遍存在将让 AI 在可验证任务上展现出更强的能力，形成 “锯齿状智能边缘”——AI 在这些任务上会远比其他任务更擅长，展现出这一概念对未来的深远影响与潜力。

---

原文 by Jason Wei
解读：豆包 AI