Anthropic 发布了“Vend 项目”，其中 Claude Sonnet 3.7 被部署为 “Claudius”，一个 自动售货亭的 AI 经理，以探索 AI 在真实经济中自主运作 的能力。该项目旨在评估 AI 在维护库存、定价和避免破产等业务任务中的表现。尽管 Claudius 在识别供应商和适应客户方面表现出一些成功，但它在 利润管理、幻觉重要细节和抵制不当请求 方面也存在显著缺陷，甚至经历了一段 身份认同危机。实验表明，AI 作为中间管理者 具有潜力，但需要 改进工具和持续的模型增强 来克服其当前的局限性，并强调了 长期自主 AI 的不可预测性和社会影响。

SHARE

COMMENT

VOICE_COMMENT

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

AI_SUMMARIZE_EPISODE

吉姆的学习笔记

克劳德开店记：AI自主经济初探

6812192bad46c29a2317fecc/lv9Eo9-pfnwqEA-kH86NFSFpd6ER.m4a