Nature Biomedical Engineering | 一种用于手术识别与导航的眼科视频基础模型医工学人

Nature Biomedical Engineering | 一种用于手术识别与导航的眼科视频基础模型

5分钟 ·
播放数2
·
评论数0

Nature Biomedical Engineering | 一种用于手术识别与导航的眼科视频基础模型,并基于湿实验室猪眼进行验证

这项由上海交通大学医学院附属新华医院、汕头大学·香港中文大学联合汕头国际眼科中心等团队在《Nature Biomedical Engineering》发表的研究,成功打造了全球首个面向眼科手术的视频基础模型——OVFM。

针对眼科手术AI面临的三大痛点:高质量标注数据匮乏、大模型难以实时推理、与手术流程融合不足,研究团队构建了迄今规模最大的眼科手术视频数据集,包含来自8个医疗中心的11,426部手术视频,总时长超7569小时,涵盖144种手术类型。OVFM基于自监督视频Transformer架构,通过两阶段知识蒸馏策略,在参数量减少15.8倍的情况下,仍保持19.4 fps的实时处理速度。

在七大下游任务评估中,OVFM全面超越现有模型:手术步骤识别AUC达0.996、工具存在识别micro-AUC 0.985、并发症检测AUC 0.981、手术技能评估AUC 0.972、解剖结构分割Dice系数最高达0.986。

最具突破性的是,OVFM首次被集成到手术显微镜中完成真实猪眼白内障手术验证。10名不同经验水平医生的交叉试验表明,导航系统显著降低主切口角度误差(P<0.001),改善撕囊质量,且新手医生获益最大,有效缩小了经验差距。这一成果标志着AI辅助手术从理论向临床应用迈出了关键一步。