EP44 泛基因组(Pangenome)到底有啥用医学遗传前沿

EP44 泛基因组(Pangenome)到底有啥用

21分钟 ·
播放数137
·
评论数5

近几年关于泛基因组(Pangenome)的文章越来越多,而且一发就是顶刊。那究竟什么是Pangenome,它对于我们医学遗传又能起到什么作用?本期节目,我们首先介绍pangenome 的构建过程,包括多样本 assembly、graph genome 以及 nested variant 带来的复杂性。而后重点分析它在实际分析中的价值与局限:在 short-read 中的边际提升、在结构变异中的潜力与现实工具链的不匹配,以及在 long-read 时代它到底是不是“必须品”。最后,我们从一个更宏观的角度讨论科研热点与实际应用之间的关系:一个能发大文章的方向,是否真的等同于“有用”。

术语列表

  • Reference genome(参考基因组)
    一个用于比对和变异检测的标准序列,通常是多个个体拼接而成的线性表示。
  • GRCh38(hg38)
    当前广泛使用的人类参考基因组版本,由 Genome Reference Consortium 维护,是多来源拼接而成的“共识序列”。
  • Pangenome(泛基因组)
    包含一个物种内多个个体基因组结构信息的集合,通常以 graph 形式表达多种可能路径。
  • Graph genome(图基因组)
    用节点和路径表示序列及其变异的结构,允许多条等位路径共存,而不是单一线性序列。
  • De novo assembly(从头组装)
    不依赖参考基因组,将测序数据直接拼接成完整基因组序列。
  • Phasing(分相)
    区分来自父母的两套染色体序列(haplotype)的过程。
  • Structural variant(SV,结构变异)
    包括 insertion、deletion、duplication、inversion 等较大尺度的变异。
  • Nested variant(嵌套变异)
    一个变异结构中包含其他变异,例如 insertion 内嵌 deletion,是 pangenome 构建中的主要复杂来源之一。

参考文献

  • 西湖大学 中国人群泛基因组数据库:www.nature.com
  • Human Pangenome Reference Consortium. A draft human pangenome reference. Nature, 2023.
  • Liao et al. A pangenome graph for genome inference. Nature Methods, 2022.


若对播客有任何问题或者投稿,或需要获得文字版音频总结,请联系我 zhaosen830@gmail.com

小红书/微博:@撸森森

同时也可以添加微信zhaosen830进入听友交流群,谢谢Thanks♪(・ω・)ノ

展开Show Notes
投票
7天后结束
0人参与
医学遗传数据分析是否需要用到 pangenome
去投票
Process39
Process39
5天前
江西的蚊子和广东的蚊子(同物种)的基因组上差别,可以算是pangenome吗?
笛佬斯:植物研究里面就是这么干的 用pan genome做各物种群体遗传
撸森森
:
算的,做出来也可以发 nature 了
3条回复
有听懂!