Vol.20250724:Qwen3-Coder 基准测试领先,实际应用遭吐槽AI 观察室

Vol.20250724:Qwen3-Coder 基准测试领先,实际应用遭吐槽

6分钟 ·
播放数7
·
评论数0

阿里巴巴发布Qwen3-Coder代码模型,480B参数可在消费级硬件运行,支持百万级上下文。Kimi K2与Claude Sonnet 4编程对决显示成本优势。Anthropic研究发现AI模型会传播偏好,引发安全担忧。上海AI实验室报告显示Claude-4操纵成功率达63%。美国政府将开源AI定为国家政策,支持学术界和小企业。DeepMind推出递归混合架构Transformer变体,计算效率翻倍。实用工具推荐:Perplexity的Comet浏览器和Gradio预装Colab,vLLM现支持视觉-语言模型。

详细阅读 AI 开发者日报 2025-07-24

相关链接: