摘要: 本周是“架构创新”压倒“参数堆叠”的一周。DeepSeek 通过发布 86 页技术报告,几乎“开源”了对标 OpenAI o1 的完整强化学习训练方案,终结了行业对推理模型的技术猜测。与此同时,微软开源 BitNet b1.58,用 1-bit 量化技术向 GPU 霸权发起挑战,让 CPU 推理重回视野。NVIDIA 则在 CES 后持续发力,通过 Cosmos 和 GR00T 模型将 AI 战火引向物理世界(Robotics)。

好虫子周刊:DeepSeek R1 配方揭秘、BitNet 1.58bit、实体 AI 进场
17分钟 ·
8·
0