科学普及

前沿科普

6-20 Science:RNA基因Xist通过一个蛋白编码基因的假基因化进化

日期:2006-06-20  访问次数:3601


生物谷博客报道:Xist基因的非编码性RNA是真哺乳亚纲哺乳动物(eutherian mammal)中X染色体失活过程的关键性起始物,然而它的精确功能和起源仍然不清楚。尽管Xist在真哺乳亚纲保守性较好,但在其他的哺乳动物动物中还未找到它的同源物。作者显示Xist至少部分上是从一个编码蛋白的基因进化而来的,而Xist原始类型(proto-Xist)的蛋白编码功能的丢失与Xist两端存在着四个蛋白编码的假基因相一致。这一事件在真哺乳亚纲动物和有袋动物(marsupial)进化上分开后发生,这就表明这两个世系(lineage)的剂量补偿进化机制是独立的。
 
 当哺乳动物从其他的羊膜动物(amniote)中分化出来后不久,哺乳动物的X和Y染色体便从一对常染色体中进化而来[1]。在哺乳亚纲动物和有袋动物中,雄性的XY染色体和雌性的XX染色体之间的基因剂量上的不平衡通过沉默雌性中的一条X染色体而得以弥补[2-4]。在哺乳亚纲动物里,这种沉默作用涉及Xist基因,该基因位于X染色体失活中心(X inactivation center,Xic),编码一个长的非翻译性的RNA[5]。Xic位于人类X染色体的长臂上,这与哺乳动物最后一个共同祖先(cenancestor)(6,7)原始的X染色体上的情形吻合。这种观察也也这一假设相一致,即在哺乳动物进化早期,X染色体的失活可能与染色体的性别决定机制同时进行[8]。
 
 为了研究X染色体失活的进化机制,作者在14脊椎动物基因组中搜索了14个Xist同源物,发现在真哺乳亚纲动物的最后一个共同祖先上已经存在,然而在非真哺乳亚纲的脊椎动物里不能检测Xist的明显序列相似性。
 
 在人类位于Xist基因附近的基因组区域含有3个蛋白编码基因(Cdx4, Chic1和Xpct),在三个基因的垂直同源序列在所有的脊椎动物种类中存在。在鸡和爪蟾中这些基因之间的连锁性质也是保守的。作者因此推断非真哺乳亚纲动物种类中Chic1和Xpct在基因组上的间隔作为Xic的同源区域(XicHR)。在真哺乳亚纲中,除了Xict基因外,Xic还含有两个RNA基因(Jpx和Ftx)和两个蛋白编码基因(Tsx和Cnbp2)[9]。Cnbp2是一个逆转座基因(retrotransposed gene),且在真哺乳亚纲中是特异性的。在非真哺乳亚纲脊椎动物中不能检测检测到Tsx,Jpx和Ttx的任何同源物。在鸡和爪蟾中,XicHR含有5个蛋白基因(Fip1l2, Lnx3, Rasl11c, UspL和Wave4),而在真哺乳亚纲动物基因组中不能检测这些基因的垂直同源物。此外,在鸡和爪蟾中XicHR中的基因内容、次序和定向都非常保守,表明在鸡的一个常染色体上的XicHR符合它的四脚动物最后一个祖先的原始状态。
 
 为了搜索XicHR基因在真哺乳亚纲中可能存在的痕迹,作者将鸡基因组序列与代表真哺乳亚纲动物不同目(人类、老鼠、狗和牛)的基因组序列进行比较。在鸡中XicHR序列覆盖162kb(而人类中为998kb),由5%的外显子(人类中为2%)和3%的重复序列(人类中为59%)组成。人类和鸡基因组序列的比较还显示在非重复性序列里存在22个比对序列。尽管这些比对序列较短(在平均62bp序列有72%的同源性),但是其中8个与鸡中已知的外显子重叠,而与人类中的已知外显子重叠的只有5个。这些比对是由于偶然性产生的概率非常低,表明它们属于保守性区域,在人类和鸡中保守。作者在鸡中总共检测63个明显不同的片段,覆盖3.4kb,能与真哺乳亚纲这四种种类的至少一种比对上,其中这些比对序列中的12与来自鸡,,Lnx3和Rasl11c的外显子重叠。
 
 Fipll2的六个外显子与人类或老鼠的序列有同源性,其中的3个外显子人类Tsx外显子同源。蛋白质的比对结果表明老鼠的Tsx是一个被截断的基因,编码一个与Fip1l2的编码蛋白的氨基端垂直同源的蛋白。Tsx(不论是转录物还是翻译物)在大鼠和小鼠中都是功能性的,但是进化速度比较快[10]。Tsx在人类、狗和牛中都是假基因[9]。作者在牛和狗中鉴定出Rasl11c基因的四个外显子同源物,人中也有一个,而老鼠中没有。然而在这些物种中,Rasl11c已经成为假基因。Lnx3的两个外显子与Xist同源,其中第一个与Xist中在真哺乳亚纲动物比较保守的h4/m4外显子同源,第二个则与Xist的h5/m6外显子同源,而在真哺乳亚纲动物中h5/m6外显子在人和老鼠中保守,但在狗和牛差别较大。由于存在两个独立的比对序列在狗和牛中的外显子重叠的可能性非常低,表明RNA基因Xist的这些外显子是Lnx3蛋白基因的同源物。
 
 在有袋动物中,XicHR位于X染色体上[7,12]。作者已经测序含有Rasl11c和5'端Lnx3的负鼠(opossum)的基因组克隆,同时也测序了Lnx3的mRNA序列。在基因序列数据库中,作者已经鉴定出Wave4基因。系统进化树分析表明这三个基因在负鼠中是有功能性的。因此,在真哺乳亚纲动物世系中发生的Lnx3的编码蛋白功能的丧失,至少同时伴随着XicHR的四个其他基因中的两个的假基因化。
 
 Lnx3在所有脊椎动物纲中保守,且与其平行同源的Lnx1和Lnx2非常类似[11]。Xist保守的外显子与两个PDZ基序相似,且两者都含有移框突变。通过筛选表达序列标签(EST),作者发现在鸡和爪蟾中,Lnx3在不同的组织和发育阶段转录。在负鼠中,Lnx3在雄性和雌性中都表达,这一情形与真哺乳亚纲动物中的Xist很不相同。在老鼠中,尽管Xist的h4/m4外显子(与Lnx3同源)对X染色体的失活不是必需的[12],但是已经表明该外显子影响Xist RNA的转录和(或)加工[12]。这就暗示Xist起着Lnx3转录单位的某种调控成分的作用。
 
 作者的结果显示Xist的两个外显子起源于Lnx3。然而,Lnx3和Xist分别含有11个和6个其他的外显子,因此,不能检测到显著的相似性。此外,作者也没有检测到Xist中A-重复序列(A-repeat)的同源序列,而该序列是不连续的序列元件,暗含着沉默X染色体的功能[13]。这种缺乏可能是由于RNA基因和蛋白基因遭受着极其不同选择性限制和快速分歧开来。也有可能Xist的前几个外显子与Lnx3不同源,由于某个序列(如转座元件)的插入而获得的,而插入的序列被利用而形成proto-Xist。作者还分析了Rasl11c和Lnx3在负鼠基因组上间隔以便搜寻到潜在的proto-Xist基因的标志,然而还是不能检测与Xist存在显著相似性的序列。考虑到Xist外显子在真哺乳亚纲动物之间高度保守,负鼠中这种相似性的缺乏强烈地表明有袋动物在这个位点上不含有任何proto-Xist,因此Xist是特异性地存在于真哺乳亚纲动物中。
 
 在有袋动物和真哺乳亚纲动物中的剂量补偿机制都涉及到染色体范围内的X染色体失活(XCI),不过存在一些显著性的差别。在有袋动物中,总是来自父本的X染色体失活,而且这种失活是不完全性的组织特异性的失活,而且似乎不涉及DNA甲基化[4]。此外,作者的结果表明在有袋动物中,XCI不需要Xist的参与。在单孔类动物(monotreme)中,XicHR转位到常染色体上,表明剂量补偿也不需要XicHR在染色体所处的位点[6]。因此,没有证据表明在真哺乳亚纲动物、有袋动物和单孔类动物中的剂量补偿效应是保守性的。可能的情况是Xist独立的XCI哺乳动物的最后一个共同的祖先存在,而在真哺乳亚纲动物中Xist替代了该机制发挥作用。然而,也应该强调X染色体和Y染色体进化分开的早期阶段中,大多数X染色体连锁的基因仍然拥有活性的Y染色体同源物,因而不需要剂量补偿。只有当Y染色体丢失掉大多数基因后才可能是通过失活整个染色体而进行剂量补偿得机制具有优越性。因此。作者提出,XCI可能是性染色体进化后期出现的。(翻译:David Towersimper)
 
 
 摘自:生物谷