AI学会品味中国画意境

AI学会品味中国画意境

15分钟 ·
播放数12
·
评论数0

HanMoVLM: Large Vision-Language Models forProfessional Artistic Painting Evaluation

这篇论文的核心是解决一个问题:普通的视觉语言模型(VLMs)虽然能识别中国画里的 “山”“鸟” 等元素,但没法像专业艺术评论家那样,对中国画做专业的艺术评估。于是研究者们打造了一个专门给中国画做专业评分的 AI 模型 ——HanMoVLM,还配套了一个专属数据集 HanMo-Bench。

先说说为啥普通 AI 不行:中国画的评价不靠 “像不像”,而是看 “笔墨、气韵、意境” 这三个核心,得有深厚的艺术功底才能判断,普通 AI 没学过这套专业逻辑,要么评得不准,要么只会描述元素不会评价,而且之前也没有高质量的中国画专业评估数据集。

研究者们的解决方案分三步:

建了个专业数据集 HanMo-Bench:里面有 1.3 万多幅画,既有拍卖行里的真迹名作,也有 AI 生成的画,都标了 0-5 分的专业分数(真迹按拍卖价值换算,AI 画由专家打分),还附带了专家的评价逻辑,确保数据质量。

给模型设计了 “专家级思考流程”(CoT):让 AI 像专业评画师一样一步步分析,不是直接给分:

先看画的整体内容、构图和风格,确定是山水画、花鸟画还是人物画;

再聚焦重点区域(比如笔墨特别好的地方)做细节分析;

按对应题材的标准评(比如山水画看皴法、留白,人物画看神态、线条);

最后按 “笔墨→气韵→意境” 三层打分(意境权重最高,就算笔墨精致,意境不够也得不了高分)。

给模型加了 “奖励机制”:训练时不仅看最终分数对不对,还看每一步的分析是不是和专家一致(比如重点区域找得准不准、分析逻辑对不对),确保模型不瞎评、不跑偏。

这个模型还有个额外用处:给 AI 画画当 “评委”。现在的 AI 画中国画时,可能生成好几幅作品,HanMoVLM 能从中挑出艺术价值最高的那幅,大幅提升 AI 绘画的质量。

实验结果很亮眼:HanMoVLM 的评分和专业艺术专家的一致性特别高(相关系数 0.845),远超 GPT-4、Gemini 这些通用大模型;用它当评委选 AI 生成的画,也能选出最符合中国画审美标准的作品,比普通的审美评分工具靠谱多了。

简单说,HanMoVLM 就像一个专门的 “中国画专业评委 AI”,既解决了普通 AI 不会评中国画的问题,还能帮 AI 画得更有艺术感,填补了中国画专业评估领域的 AI 空白。