Vol.20250724：Qwen3-Coder 基准测试领先，实际应用遭吐槽

阿里巴巴发布Qwen3-Coder代码模型，480B参数可在消费级硬件运行，支持百万级上下文。Kimi K2与Claude Sonnet 4编程对决显示成本优势。Anthropic研究发现AI模型会传播偏好，引发安全担忧。上海AI实验室报告显示Claude-4操纵成功率达63%。美国政府将开源AI定为国家政策，支持学术界和小企业。DeepMind推出递归混合架构Transformer变体，计算效率翻倍。实用工具推荐：Perplexity的Comet浏览器和Gradio预装Colab，vLLM现支持视觉-语言模型。

详细阅读 AI 开发者日报 2025-07-24

相关链接：