这篇文章介绍了一种名为 TranscriptFormer 的创新性生成式单细胞基础模型,旨在解决跨物种比较细胞生物学的难题。该模型家族通过对涵盖 12 个物种、跨越 15 亿年进化史 的 1.12 亿个细胞 进行大规模预训练,成功捕捉了生命树中保守的基因表达规律。研究表明,该模型在 细胞类型鉴定、疾病状态预测 以及 药物扰动模拟 等任务中达到了顶尖性能,甚至能对未见过的物种进行零样本预测。此外,TranscriptFormer 展现出了惊人的涌现能力,能够自发识别发育轨迹和系统发育关系,并作为“虚拟仪器”通过提示词预测 基因调控网络。这项研究证明了复杂的细胞转录组遵循可学习且可预测的进化模式,为利用人工智能驱动生物学发现奠定了基础。
References:
Pearce J D, Simmonds S E, Mahmoudabadi G, et al. TranscriptFormer: A generative cell atlas across 1.5 billion years of evolution[J]. Science, 2026: eaec8514.

