Claude Fable 5 跑分碾压,Reddit 却说"我不需要更好的模型了"Web3+

Claude Fable 5 跑分碾压,Reddit 却说"我不需要更好的模型了"

9分钟 ·
播放数35
·
评论数0

Anthropic 刚把基准(SWE-Bench Pro 80.3%)刷到新高,但真实舆论场给出的却是另一份成绩单:大量日常与安全研究场景的用户切回旧模型,理由是"成本更高、护栏更烦、收益看不见"。