778-CellHermes:语言模型驱动的多组学数据融合与理解聊聊Sci

778-CellHermes:语言模型驱动的多组学数据融合与理解

22分钟 ·
播放数1
·
评论数0

CellHermes 是一种创新的生物语言模型,通过将复杂的多组学数据转化为自然语言指令,实现了对细胞系统的统一理解。该研究突破了以往从头训练特定模态模型的限制,利用预训练大语言模型(LLM)的推理能力,高效整合了转录组、蛋白质相互作用网络及文本知识。在功能上,它不仅能作为编码器生成高质量的基因和细胞嵌入,还能作为预测器统一处理药物扰动和细胞适应性等多种任务。此外,该模型具备独特的解释器功能,能结合注意力机制与语言推理揭示生物分子的作用机理。测试结果表明,CellHermes 在多项基准测试中表现优异,为构建可解释的虚拟细胞和自动化生物科研循环奠定了基础。

References:

  • Gao Y, Wang W, Zhao Y, et al. Language may be all omics needs: Harmonizing multimodal data for omics understanding with CellHermes[J]. bioRxiv, 2025: 2025.11. 07.687322.