做家务
清晨洗漱
听播客,上小宇宙!
点击下载
第一时间!深度解读DeepSeek-V3.2-Exp模型的DSA稀疏注意力机制
叔的赛博大乱炖
22分钟
·
7个月前
3
·
0
今日DeepSeek-V3.2-Exp 发布,叔第一时间深度解读DSA,如何用“闪电索引”和“细粒度选择”打破大模型O(L²)计算魔咒,实现成本减半的长序列推理。
在小宇宙打开
00:00
00:00