如何让AI“明辨是非”,而不是“投机取巧”?

如何让AI“明辨是非”,而不是“投机取巧”?

5分钟 ·
播放数90
·
评论数0

[LG] Robust Reward Modeling via Causal Rubrics

[Google DeepMind]

arxiv.org