Human-scATAC-Corpus 是一个针对人类单细胞染色体开放性测序数据(scATAC-seq)构建的大型综合数据库,旨在解决该领域特征空间不统一和处理流程复杂等挑战。该资源涵盖了来自37个组织或细胞系的540万个细胞,并为每个数据集提供三种标准化格式,以支持跨研究集成、灵活处理和单研究分析。为了增强实用性,该平台集成了名为 EpiAgent 的预训练大模型,用户可以直接在线进行细胞类型注释、特征提取和参考映射。数据库通过直观的网页界面提供交互式可视化、多维度搜索和按需下载功能,极大地方便了生物医学研究。这一科研成果为开发单细胞表观基因组学基础模型提供了高质量的训练底座,也为标准化方法评估奠定了基础。未来,该项目计划将其范围扩展到多物种及多组学数据的整合与深度挖掘。
References:
- Chen X, Gao Z, Li K, et al. Human-scATAC-Corpus: a comprehensive database of scATAC-seq data[J]. Nucleic Acids Research, 2026, 54(D1): D175-D183.

