AI 的“读心术”:我们如何才能信任一个“聪明的大脑”?

AI 的“读心术”:我们如何才能信任一个“聪明的大脑”?

5分钟 ·
播放数75
·
评论数0

[LG] Taming Polysemanticity in LLMs: Provable Feature Recovery via Sparse Autoencoders  

[Yale University & Shanghai Jiao Tong University]  

arxiv.org