由宾夕法尼亚州立大学、国家人类基因组研究所和华盛顿大学的研究人员领导的国际合作团队制作了五种大型猿类和一种小型猿类性染色体的全新完整“端到端”参考基因组,突显了猿类物种中雄性特有的 Y 染色体的极快变化。这些发现揭示了性染色体的进化,并有助于了解猿类和人类中与这些染色体上的基因相关的疾病。
“Y 染色体对人类生育能力至关重要,而 X 染色体则含有对生殖、认知和免疫至关重要的基因,”宾夕法尼亚州立大学生物学教授、生命科学 Verne M. Willaman 主席、研究小组负责人 Kateryna Makova 说道。“我们的研究为未来许多关于性染色体、性染色体如何进化以及与性染色体相关的疾病的研究打开了大门。我们研究的现存非人类类人猿物种都濒临灭绝。它们的完整性染色体序列的可用性将有助于研究它们在野外的性别特异性分布以及它们对生殖和生育能力至关重要的基因。”
此类参考基因组可作为代表性样本,对未来研究这些物种大有裨益。研究小组发现,与 X 染色体相比,Y 染色体在猿类物种间差异很大,且包含许多物种特异性序列。然而,它仍受自然选择的净化作用——一种通过消除有害突变来保护其遗传信息的进化力量。
这项新研究于 5 月 29 日发表在《自然》杂志上。
“研究人员在 2001 年对人类基因组进行了测序,但实际上并不完整,”马科娃说。“当时可用的技术意味着某些空白直到 2022-23 年由端粒到端粒 (T2T) 联盟领导的新努力才能填补。我们利用人类 T2T 联盟开发的实验和计算方法来确定我们现存最亲近的亲属——类人猿的性染色体的完整序列。”
研究小组为五种类人猿(黑猩猩、倭黑猩猩、大猩猩、婆罗洲猩猩和苏门答腊猩猩,它们构成了现存的大多数类人猿物种)以及一种较小的类人猿合趾猿生成了完整的性染色体序列。他们为每个物种的一个个体生成了序列。由此产生的参考基因组充当基因和其他染色体区域的图谱,可帮助研究人员对该物种的其他个体的基因组进行测序和组装。这些物种以前的性染色体序列不完整,或者(对于婆罗洲猩猩和合趾猿)根本不存在。
“Y 染色体的测序一直具有挑战性,因为它包含许多重复区域,而且由于传统的短读测序技术以短脉冲方式解码序列,因此很难将得到的片段按正确的顺序排列,”宾夕法尼亚州立大学博士后研究员、该研究的共同第一作者 Karol Pál 说道。“T2T 方法使用长读测序技术来克服这一挑战。结合我们与 NHGRI 的 Adam Phillippy 团队合作的计算分析进展,这使我们能够完全解决以前难以测序和组装的重复区域。通过将 X 和 Y 染色体相互比较以及在物种之间进行比较,包括与之前生成的 X 和 Y 的人类 T2T 序列进行比较,我们了解到了许多有关它们进化的新知识。”
Y 染色体变异性高
“性染色体的起始过程与其他染色体对一样,但 Y 染色体却独一无二,积累了许多缺失、其他突变和重复元素,因为在其大部分长度上,它并不与其他染色体交换遗传信息,”马科娃说,她同时也是宾夕法尼亚州立大学 医学基因组学中心主任。
结果,研究小组发现,在六种猿类中,Y 染色体在各种特征(包括大小)上的变异性都比 X 染色体大得多。在所研究的猿类中,X 染色体的大小范围从黑猩猩和人类的 ACTG 字母表(代表组成 DNA 的核苷酸)的 1.54 亿个字母到大猩猩的 1.78 亿个字母不等。相比之下,Y 染色体的范围从合趾猿的 3000 万个 DNA 字母到苏门答腊猩猩的 6800 万个字母不等。
物种间共享的 DNA 序列数量在 Y 染色体上也更具可变性。例如,人类和黑猩猩之间约有 98% 的 X 染色体对齐,但只有约三分之一的 Y 染色体对齐。研究人员发现,这在一定程度上是因为 Y 染色体更有可能被重新排列或部分遗传物质被复制。
此外,Y 染色体上重复序列所占染色体百分比变化很大。根据物种不同,X 染色体上重复序列所占百分比为 62% 至 66%,而 Y 染色体上重复序列所占百分比为 71% 至 85%。这些百分比在 X 和 Y 染色体上都高于人类基因组中其他染色体。
Y 如何生存下来
“我们发现猿类的 Y 染色体正在缩小,积累了许多突变和重复,并且丢失了基因,”马科娃说。“那么为什么 Y 染色体没有像一些先前的假设所暗示的那样消失呢?与天普大学的谢尔盖·科萨科夫斯基·庞德等人合作,我们发现 Y 染色体上仍然有许多基因在净化选择下进化——这是一种保持基因序列完整的自然选择。其中许多基因对精子发生很重要。这意味着 Y 染色体不太可能很快消失。”
研究人员发现,Y 染色体上的许多基因似乎使用两种策略来生存。第一种策略利用遗传冗余——染色体上存在同一基因的多个拷贝——这样完整的基因拷贝就可以补偿可能发生突变的拷贝。该团队首次通过完成猿类性染色体上多拷贝基因家族的景观来量化这种遗传冗余。
第二种生存策略利用了回文,即 DNA 字母表中的字母序列后面是相同但倒置的序列,例如 ACTG-GTCA。当基因位于回文中时,回文可以纠正突变,从而为基因带来好处。
“我们发现 Y 染色体可以在两个回文臂的重复序列之间与自身交换遗传信息,这些回文臂折叠起来,使倒置序列对齐,”Pál 说。“当同一基因的两个副本位于回文中时,如果其中一个副本发生突变,则可以通过与另一个副本进行遗传交换来挽救突变。这可以弥补 Y 染色体与其他染色体之间缺乏遗传信息交换的缺陷。”
研究小组还首次获得了猿类性染色体上回文序列的完整序列,此前这些序列很难测序和研究。他们发现,回文在猿类Y染色体上特别丰富且很长,但它们通常只在近亲物种之间共享。
研究人员还与约翰霍普金斯大学的迈克尔·沙茨及其团队合作,研究了 129 只大猩猩和黑猩猩的性染色体,以更好地了解每个物种内的基因变异,并寻找自然选择和其他进化力量作用于它们的证据。
“通过将大猩猩和黑猩猩的性染色体测序读数与我们的新参考序列进行比对,我们从之前研究的大猩猩和黑猩猩个体中获得了大量新信息,”宾夕法尼亚州立大学生物学助理教授、论文作者扎卡里·斯皮耶希 (Zachary Szpiech) 表示。“虽然未来增加样本量将非常有助于提高我们检测不同进化力量特征的能力,但在研究濒危物种时,这在道德和后勤方面可能具有挑战性,因此,充分利用现有数据至关重要。”
研究人员探索了可以解释大猩猩和黑猩猩 Y 染色体变异的多种因素,这项分析揭示了 Y 染色体上净化选择的额外特征。这证实了这种自然选择对 Y 染色体的作用,正如他们在之前的基因分析中发现的那样。
“我们利用生物信息学技术和进化分析的强大组合,更好地解释了我们现存近亲类人猿性染色体上的进化过程,”宾夕法尼亚州立大学生物学助理教授、论文作者克里斯蒂安·胡贝尔 (Christian Huber) 说道。“此外,我们制作的参考基因组将对未来灵长类进化和人类疾病的研究起到重要作用。”
免责声明:本文由用户上传,如有侵权请联系删除!