这份研究介绍了一种名为 eSIG-Net 的新型交互语言模型,专门用于预测单点突变如何干扰蛋白质之间的相互作用(即“蛋白质代码”)。该模型创新性地结合了蛋白质序列嵌入、语法与进化感知编码以及对比学习技术,通过分析野生型与突变型蛋白之间的细微序列差异来识别相互作用扰动。实验结果表明,eSIG-Net 在预测精度上显著超过了现有的基于序列和结构的计算方法,能够更准确地定位致病变异并揭示分子机制。此外,该框架具有较强的通用性,可应用于多种生物学场景,为海量意义不明变异(VUS)的特性分析提供了高效的计算手段。总之,这一工具为理解基因突变如何重构蛋白质信号网络提供了全新的视角,有望推动遗传病治疗与生物标志物发现的研究进程。
References:
Pan X, Shrawat A, Raghavan S, et al. eSIG-Net: an interaction language model that decodes the protein code of single mutations[J]. Nature Methods, 2026: 1-6.

