scpFormer 是一种专为单细胞蛋白质组学设计的生成式预训练大模型,旨在解决该领域数据高度碎片化和特征不连续的难题。通过引入基于蛋白质序列的连续语义映射和动态表达嵌入,该模型打破了传统方法对固定抗体面板的依赖,实现了跨平台数据的统一表示。研究表明,scpFormer 在细胞类型注释、批次效应整合以及缺失值补全等任务中展现出超越现有技术的性能。此外,其学习到的蛋白质共表达逻辑具有很强的泛化能力,能够有效提升癌症药物反应预测的准确性。作为该领域的首个基础模型,它为生物标志物发现和精准医疗提供了一个灵活且可扩展的计算框架。
References:
Zhou Q, Yu L, Guo Y, et al. scpFormer: A Foundation Model for Unified Representation and Integration of the Single-Cell Proteomics[J]. arXiv preprint arXiv:2604.20003, 2026.

