佛罗里达长柄海鞘基因组揭示脊索动物进化奥秘
本文报道了佛罗里达长柄海鞘('Branchiostoma floridae')的基因组结构和基因内容。佛罗里达长柄海鞘是脊索动物门的现代生存者之一,其化石记录可追溯到寒武纪时期。通过对其基因组进行全基因组比较并结合脊索动物门的进化背景,揭示了三个脊索动物类群(海鞘、长柄海鞘和脊椎动物)之间的关系,并重建了最后一个脊索动物祖先的基因组成分,描述了两个脊椎动物谱系中的全基因组重复和后续重组。这些基因组事件塑造了脊椎动物基因组,并为脊椎动物进化提供了额外的遗传变异。
长柄海鞘,或称文昌鱼,是体型小的蠕虫状海洋动物,它们大部分时间都埋藏在海底,通过无颌、有纤毛的嘴巴进行滤食。这些不起眼的生物与脊椎动物的亲缘关系在19世纪初首次被注意到1,2,并被胚胎学家亚历山大·科瓦列夫斯基3进一步阐明。特别是,科瓦列夫斯基观察到,与其他无脊椎动物不同,文昌鱼与脊椎动物和海鞘(也称为尾索动物)共享关键的解剖学和发育特征。这些特征包括一个空心的背神经管、一条脊索、一个有孔的咽部区域、一个分节的体壁肌肉(在胚胎学上源于体节)和一个肛后尾。脊椎动物、尾索动物和长柄海鞘(也称为头索动物)共同构成了脊索动物门,它们起源于大约5.5亿年前的最后一个共同祖先。
虽然科瓦列夫斯基、达尔文和其他一些人认识到脊索动物类群之间的进化关系,但脊椎动物在形态学、生理学和神经学方面比其他脊索动物更为复杂,这提出了一个难题:脊索动物的祖先——可能是一种类似现代文昌鱼或海鞘幼虫的简单生物——是如何进行如此转变的?
也许关于脊椎动物复杂性起源的最普遍的假说是基于须田春雄(1970)4的想法,他提出脊椎动物基因组是由一系列古代的全基因组重复塑造的。在须田春雄最初的提议中,文昌鱼和脊椎动物的基因组相对于基本的无脊椎动物基因组被一到两轮基因组加倍所扩大,尽管后来的研究表明这些事件发生在脊椎动物谱系从文昌鱼谱系分离后的脊椎动物干线上5,6。
虽然人类和其他脊椎动物基因组的测序表明脊椎动物的基因数量与无脊椎动物相当,或者只是略微多于无脊椎动物7,8,但脊椎动物干线上大规模片段或全基因组重复的证据越来越多,同时人们也意识到,来自这些事件的大多数基因重复会迅速丢失(参见文献9)。来自脊椎动物干线的相对较少的剩余基因重复提供了古代人类染色体组之间旁系同源关系的证据10,11,12,13,14,这些同源关系很可能是由现代脊椎动物出现之前多轮全基因组重复造成的。然而,重复事件的数量、时间甚至基因组范围以及它们对随后基因组进化的影响尚不清楚(参见文献15),部分原因是海鞘基因组相对于未重复的早期脊索动物核型(见下文)发生了高度重排。
佛罗里达长柄海鞘B. floridae(属名Branchiostoma指的是其特征性的有孔鳃弓)为这些研究提供了重要的参考点16。这个物种及其近缘种(统称为文昌鱼,源于希腊语amphi+oxys,‘两端尖锐’)被广泛认为是脊索动物祖先的活化石,部分原因是现代文昌鱼与来自早寒武世澄江动物群(云南虫Yunnanozoon lividum17和类似的昆明鱼Haikouella lanceolatum18)和中寒武世伯吉斯页岩(皮卡虫Pikaia gracilens19)的假想化石脊索动物总体相似,尽管仍存在争议(参见文献20,21)。对文昌鱼关键发育基因的研究揭示了脊椎动物器官(如脑、肾、胰腺和垂体)的进化,以及早期胚胎模式的遗传机制(参见文献22–24)。文昌鱼在Hox基因簇25的研究中也作为原脊椎动物祖先的基因组替代物,在特定基因组区域26,27,28的研究中也作为替代物,以及在许多基因家族研究中作为外群(参见文献29)。
这里我们报道了佛罗里达长柄海鞘的基因组草图序列,并将它的结构与其他动物的基因组进行了比较。对基因序列和外显子-内含子结构的稳健系统发育分析证实了最近的提议,即海鞘是脊椎动物的姊妹类群,文昌鱼是最基础的脊索动物亚门,而棘皮动物-半索动物联合分支是脊索动物的姊妹类群。通过比较分析,我们识别了17个祖先脊索动物连锁群,它们在现代文昌鱼和脊椎动物基因组中是保守的,尽管它们经历了超过5亿年的独立进化。超过90%的人类基因组包含在这些连锁群中,这些连锁群显示出明显的四倍冗余,这与脊椎动物干线上的全基因组四倍化是一致的。与来自海鞘、七鳃鳗、象鲨和几种硬骨鱼的序列比较,将全基因组事件的时间限制在脊椎动物从海鞘和文昌鱼分离之后,但在软骨鱼和硬骨鱼分离之前。在我们的分析分辨率内,我们发现了在无颌脊椎动物(例如七鳃鳗)和有颌脊椎动物分离之前和之后发生基因组重复的证据,尽管一个涵盖无颌脊椎动物和有颌脊椎动物分离的八倍体时期仍然是一种可能性。虽然来自这些全基因组事件的大多数重复基因已经丢失,但参与发育过程的基因却不成比例地保留了下来。
基因组序列 我们使用全基因组鸟枪法30对约520兆碱基(Mb)的文昌鱼基因组进行了测序,该方法来自于从具有不同插入大小(补充说明2)的随机剪切文库中产生的约11.5倍冗余的配对末端序列覆盖率。基因组DNA是从2003年7月从佛罗里达州坦帕湾收集的一个受孕雄性的性腺中制备的,并表现出广泛的等位基因变异(3.7%的单核苷酸多态性,加上6.8%的多态性插入/缺失;补充说明4)。这是在任何单个生物体中报道的最高水平的序列变异,超过了在紫色海胆31中发现的水平。组装版本1分别报告了两种单倍型,而在组装版本2中,在每个基因座选择了一种单倍型(补充图63)。组装版本2跨越522 Mb,其中一半的序列位于62个长度大于2.6 Mb的支架中。
目前没有文昌鱼的物理或遗传图谱,因此我们无法将其重建为19对染色体32。然而,由于预测基因中有一半包含在包含138个或更多基因的支架中,因此当前的草图组装足够长,可以允许对与其他物种的保守同线性进行有用的分析,如下所示。将组装的序列与来自表达序列标签(EST,见下文)的开放阅读框进行比较表明,该组装捕获了超过95%的已知蛋白质编码内容,并且与完成的克隆序列的比较证明了该组装的碱基水平和长距离准确性(补充说明2)。
蛋白质编码基因和转座因子 我们估计单倍体文昌鱼基因组包含21,900个蛋白质编码基因座。这个基因组使用针对文昌鱼调整的标准方法进行了建模,将同源性和从头基因预测方法与来自各种发育阶段的超过480,000个ESTs24相结合(补充说明3)。大约三分之二的蛋白质编码基因座(15,123)被捕获在两种单倍型中。转座因子构成文昌鱼基因组组装的约30%(补充表5),属于>500个家族。根据它们对基因组大小的总体贡献,DNA转座因子比逆转录转座因子丰富两倍。
多态性 在短距离尺度上观察到的局部杂合性的分布服从几何分布(补充图1),这与随机交配模型的预测一致,正如在Ciona savignyi33中观察到的那样,群体突变率4μNe = 0.0562,其中μ是每代的突变率,Ne是有效群体大小。高杂合性原则上可以解释为:(1)在许多代中保持的有效群体大小很大,(2)每代的突变率很高,或者(3)先前隔离的群体最近混合在一起;在后一种情况下,不期望局部杂合性的几何分布。假设典型的后生动物突变率约为每代每千兆碱基(Gb)一到十个替换34,35,这种观察到的等位基因之间的杂合性表明,有效繁殖群体很大,但合理,约为数百万个个体。观察到的杂合性在短距离上显示出相关性,这些相关性在超过约1 kb的尺度上衰减,表明群体中存在广泛的重组(补充图2)。对非同义替换与同义替换的比率Ka/Ks的分析表明,纯化选择作用与哺乳动物物种之间发现的相似(补充说明4)。插入/缺失多态性很常见,正如在其他基因组内和基因组间比较中发现的那样36(补充图3)。单倍型之间的结构变异还包括局部倒位和串联重复(补充图63)。
后口动物关系 有了文昌鱼基因组草图序列,我们重新考虑了脊索动物内部以及后口动物门(脊索动物、棘皮动物和半索动物)之间的关系。传统上将文昌鱼放在脊椎动物的姊妹位置,海鞘是最早分离的脊索动物亚门,最近受到了质疑37,38。一项使用146个基因座(33,600个比对的氨基酸位点)和来自目前的文昌鱼基因组项目的痕迹数据的初步研究39发现支持海鞘是脊椎动物的姊妹类群。然而,这项分析还表明(尽管统计支持有限),文昌鱼与棘皮动物的关系比与海鞘或脊椎动物的关系更密切,这将使脊索动物成为一个并系群。另一项使用类似大小的基因集,但包含更多元的后口动物类群的研究支持了头索动物谱系的早期分支,但没有支持文昌鱼和棘皮动物的密切关系40。
为了解决文昌鱼有争议的系统发育位置,我们分析了一组更大的1,090个直系同源基因(参见补充说明5)。贝叶斯和最大似然法都支持新的脊索动物系统发育38,39,40,其中头索动物代表现存的最基础的脊索动物谱系,海鞘(在我们的分析中由Ciona intestinalis和Oikopleura dioica代表)是脊椎动物的姊妹类群,但具有较长的分支,表明氨基酸替换水平更高(图1)。单个基因树也支持这种拓扑结构;支持海鞘是脊椎动物姊妹类群的基因数量是支持文昌鱼处于此位置的基因数量的两倍。对后口动物中内含子获得和丢失的分析为文昌鱼作为现存最基础的脊索动物亚门提供了独立的支持(见下文)。我们将棘皮动物(即紫色海胆)和半索动物(即海豆芽)归为一组(腕足动物),作为单系脊索动物分支的姊妹类群,如文献41中所述,但与文献39中的建议相反。除了长分支的海鞘之外,最大似然树表明,在后口动物树上,肽变化的进化速率大致恒定,尽管脊椎动物中的替换数量超过了简单分子钟模型的预测。
原文地址: https://www.cveoy.top/t/topic/oONF 著作权归作者所有。请勿转载和采集!