微型的基因组

除了类核基因组和核基因组外,还有一些微型的基因组,包括病毒基因组和细胞器基因组。前者是一类简单的寄生生物病毒的基因组,一般都很小, 最小的只有几千个核苷酸对,它们必须进入宿主的细胞内才能复制。在结构上,它们与宿主基因组中富含基因的区域相似。例如,真核生物的病毒的基因组除了没有什么非编码的重复序列外,其他方面的结构特点与核基因组的有很多共同之处;细菌病毒的基因组的结构特点则与细菌的相似。因此,有人认为病毒是从宿主基因组中分离出来或“逃跑”出来的一部分基因。由于病毒基因组的结构与宿主基因组的相似,从而它们的进化是在很大程度上取决于宿主基因组的进化。

细胞器基因组则存在于真核生物细胞中的两种细胞器官内。细胞器官是细胞内专门进行某一类新陈代谢并且有一定结构的小体系,它们好比一个个微型的生物化工厂,利用细胞内的原料生产出各种“产品”。例如,为细胞内各种各样的生命活动提供能量,合成出各种生命分子。大部分细胞器官内是没有基因组的,但有两种细胞器官是例外,一种是进行细胞呼吸,即产生能量的线粒体,另一种是进行光合作用的叶绿体。线粒体和叶绿体由于具有基因组,从而可以在一定程度上掌握自己的命运,例如可以自行编码细胞器官内的核糖体 RNA 和一些蛋白质,并可以在细胞内通过分裂而进行“繁殖”。不过,它们的基因组是不完全的基因组,不少构成线粒体或叶绿体的蛋白质仍然是要核基因组编码并且在细胞质中合成后才运送到线粒体或叶绿体内的。因此,它们并不能脱离细胞而长期生存。线粒体内的基因组就称为线粒体基因组,叶绿体内的基因组则称为叶绿体基因组。核基因组、线粒体基因组和叶绿体基因组是真核细胞内的 3 种既相对独立、又有相互联系的遗传系统。

线粒体存在于几乎所有真核生物的细胞中,而且都起着同样的作用。不过,其基因组的大小和结构在不同的真核生物中却差别很大。线粒体基因组的大小可以从猪蛔虫的 14300 个核苷酸对直至甜瓜的 240 万个核苷酸对。而且在结构组成特点上,它们同样存在着很大的种类间差异。

多细胞动物的线粒体基因组有着相当一致的结构特点。它们都十分细小和致密,大小只有 16000 个核苷酸对左右。基因组呈单环状,基因的排列顺序比较稳定,而且也排列得很紧密,没有或很少基因间隔序列,所有基因都没有内含子,基因组中也不存在非编码的重复序列。除了一两千个核苷酸对的序列作为非编码的调控区外,整个基因组都是编码的(图 21)。因此,多细胞动物线粒体基因组被认为是极端遗传节俭的例子。下表是有代表性的动物线粒体基因组的大小和构型的情况。

表 2 多细胞动物线粒体基因组的大小和构型

物种

大小(核苷酸对)

构型

16569

环状

黑猩猩

16400

环状

小家鼠

16295

环状

黄牛

16338

环状

家兔

17300

环状

家鸡

16200

环状

蜥蜴( 11 种)

17500

环状

爪蟾( 2 种)

17700

环状

海扇

32100 ~ 39300

环状

果蝇( 2 种)

15700 ~ 19500

环状

猪蛔虫

14300

环状

图 21 多细胞动物的线粒体基因组, 图中的符号为基因的代号

从表中可以看出,绝大部分动物线粒体基因组的大小都在 15700 至19500

个核苷酸对这个范围内,这个大小只有最小的动物核基因组的 1/4000 左右。另一方面,线粒体基因组的大小与动物类群并无一定的关系,如在昆虫果蝇中,基因组的大小就几乎包括了所有动物的变化范围。近年来发现了一些较为特别的例子,如猪蛔虫只有 14300 个核苷酸对的基因组,而软体动物海扇

却有大于 30000 个核苷酸对的基因组,是一般动物的两倍。这些例子在一定程度上影响了多细胞动物线粒体基因组大小的均一性,但与其他种类比较, 这一类群的线粒体基因组的大小和结构总的说来是十分保守的。

与此相反,高等植物线粒体基因组是各类真核生物线粒体基因组中最大、最复杂的。目前已知的最小的高等植物线粒体基因组是苔藓植物地钱的186608 个核苷酸对的基因组,这一基因组的全部核苷酸序列已在几年前被测定出来。此外,已知白芥具有最小的被子植物线粒体基因组,其大小差不多有 21 万个核苷酸对,比动物的线粒体基因组大 10 倍以上。而最大的被子植

物线粒体基因组是甜瓜的 240 万个核苷酸对的基因组,比一些原核生物的类

核基因组还要大。因此,在高等植物中,线粒体基因组的大小相差可达 10 多倍。即使在同一个科的植物中,变化范围也可以很大,如葫芦科中的西瓜与甜瓜的线粒体基因组大小的差异可有 7 倍之多(表 3)。

在结构组成上,植物线粒体基因组的变化也很大。基因组呈单环状、多环状或多线状,基因的排列顺序在不同种类中往往不一样。植物线粒体基因组所含的基因可比动物的多两倍左右,但这远远不能说明它们是如此之大。因此,它们是含有大量的非编码序列,包括基因间隔、重复序列和内含子。这样就使得基因散布在基因组上,使得基因和基因组都显得“臃肿”。

表 3 高等植物线粒体基因组的大小和构型

物种

大小(核苷酸对)

构型

地钱

186608

环状

白芥

208000

环状

野油菜

218000

三环

豌豆

370000

西瓜

340000

西葫芦

870000

黄瓜

1500000

甜瓜

2400000

玉米

570000

多环(多线状)

可以说,多细胞动物与高等植物的线粒体基因组是真核生物中这种细胞器基因组在大小和结构方面的两个极端的代表。

其他几类较为低等的真核生物,即原生动物、藻类和真菌的线粒体基因组在结构上一方面可以说是或偏向于动物型,或偏向于植物型,另一方面又有它们的独特之处。

原生动物的线粒体基因组的大小在 18500 至 55000 个核苷酸对之间,它们在有些种类中呈环状,在另外一些种类中则呈线状,或甚至是由大环与小环组成的网状结构(表 4)。基因组不像多细胞动物的那样致密,可有一些非编码的区域,在有些种类的线粒体基因组中已发现有长短不一的多种重复序列的存在。不过,还没有在研究过的原生动物线粒体基因组的基因中发现有内含子。

表 4 原生动物、藻类和真菌线粒体基因组的大小和构型

物种 大小(核苷酸对) 构型

原生动物

疟虫

18500

环状

梨形四膜虫

55000

线状

布氏锥虫

20000 ~ 22000

大环

利什曼虫

30500

大环

藻类

莱因衣藻

15800

线状

蛋白核小球藻

80000

纤细裸藻

60000

无色鞭毛藻

200000

真菌

构巢曲霉

32000 ~ 33000

环状

异旋孢腔菌

115000

环状

姆拉克汉逊酵母

55000

线状

粗糙脉孢菌

62000

环状

柄孢壳

95000

环状

酿酒酵母

68000 ~ 77800

环状

粟酒裂殖酵母

17600 ~ 23000

环状

藻类的线粒体基因组被研究得不多。比较突出的是莱因衣藻的 15800 个核苷酸对的线状基因组,它是已知的单细胞真核生物中最小的,在结构上也更像动物的而不像植物的线粒体基因组。有一些藻类,如无色鞭毛藻,却有植物线粒体基因组般大小,在结构上也似乎偏向于植物型。

真菌的线粒体基因组也有较大的变化,大小从粟酒裂殖酵母的 17600 个

核苷酸对到异旋孢腔菌的近 12 万个核苷酸对。绝大部分基因组呈环状,基因的排列顺序在不同种类中可以很不同。由于基因组中所含的基因数目在不同种类的真菌中都差不多,所以基因组的大小主要由非编码区域的多少,包括基因间隔的长度、内含子及重复序列的数量等来决定。此外,部分基因组片段的倍增也会影响到基因组的大小。随着基因组变小,非编码序列,特别是内含子的数量,也减少,使得基因组比较致密,偏向于动物型。但与多细胞动物不同的是,即使在最小的真菌线粒体基因组中,也有个别基因有内含子。

概括起来,多细胞动物和高等植物线粒体基因组的差异与类核基因组和核基因组的显著差别类似,也是在于基因组的相对大小以及重复序列和内含子等非编码成分的含量。它们代表了线粒体基因组在大小、结构上的两种形式,因此也可以把它们分别称为(线粒体)“小基因组”型(即动物型)和

(线粒体)“大基因组”型(即植物型)。“小基因组”型以线粒体基因组细小、致密,基本上不含重复序列和内含子等非编码成分为特点;“大基因组”型则以线粒体基因组相对较大,含有很多非编码序列为特点。至于原生动物、藻类和真菌的线粒体基因组,虽然在大小和结构上差异很大,而且在同一类生物中也很不同,不过总的说来,基因组较小的偏向于动物型,基因组较大的则偏向于植物型。

与线粒体存在于所有真核生物的细胞中不同,叶绿体只存在于能进行光合作用的高等植物和藻类的细胞中。而且,与不同类型生物的线粒体基因组有上述如此之大的差异比较起来,叶绿体基因组是相对的均一。

从最低等的藻类到最高等的被子植物,已研究过的种类的叶绿体基因组绝大多数呈单环状,大小的变化范围在 85000 至 29 万多个核苷酸对之间(表5)。若把刺松藻、衣藻等几种藻类排除在外,则这一变化范围大大缩小。在高等植物中,叶绿体基因组大小的变化范围在 12 万至 22 万个核苷酸对之间,

不过基因组超过 16 万个核苷酸对的只有 3 种被子植物,它们是烟草、少根紫

萍和天竺葵。因此,绝大部分高等植物叶绿体基因组的大小都在 12 万至 16 万个核苷酸对之间。

叶绿体基因组的大小虽然在绝大多数种类中都比较均一,但在藻类中却有一个特例。伞藻属种类的叶绿体基因组有 200 万个核苷酸对左右的大小, 是一般叶绿体基因组大小的 10 几倍(表 5)。伞藻是一类海藻,个体成一小伞状,故得其名。伞藻的高

表 5 高等植物和藻类叶绿体基因组的大小和构型

物种 大小(核苷酸对) 构型

被子植物

( 200 多种)

120000 ~ 217000

环状

裸子植物

银杏

158000

环状

松树( 2 种)

120000

环状

蕨类植物

分株紫萁

144000

环状

雀巢蕨

150000

环状

蜈蚣草

150000

环状

苔藓植物

地钱

121024

环状

囊果苔

125000

环状

藻类

刺松藻

85000

环状

椭圆小球藻

174000

环状

莱因衣藻

195000

环状

卵配衣藻

243000

环状

摩氏衣藻

292000

环状

无柄无隔藻

125000

环状

无色鞭毛藻

127000

环状

纤细裸藻

130000 ~ 152000

环状

网地藻

123000

环状

间囊藻

140000

多环

黑顶藻

150000

多环

地中海伞藻

2000000

伞藻

2000000

度和伞的直径都可有数厘米,而如此之大的一个个体只由单个细胞组成,因此是非常特别的。正是由于这种特殊性,它们成为了细胞学研究的一种很好的材料。对它们的叶绿体基因组的研究也发现了与一般的叶绿体基因组十分不同的情况。由于伞藻叶绿体基因组是如此之大,所以其构型还未能确定下来。另外,也还没有发现更多的类似例子。不过,伞藻中叶绿体基因组的这种特殊性无疑是代表了叶绿体基因组的另一种形式。考虑到有很多藻类的叶绿体基因组还未被研究过,因此完全有可能会再发现一些类似伞藻属叶绿体基因组的情况。

在大多数藻类和高等植物的叶绿体基因组中,通常有两段相当大、成两侧对称分布且编码基因的反向重复序列。这两段序列占了基因组很重要的比例,从而成为叶绿体基因组的一个标志(图 22)。基因组的基因排列顺序在藻类中变化较大,而在大部分高等植物中却没有什么变化。基因的总数有 100 个以上,而且一些基因是编码分子量较大的核糖体 RNA 或与光合作用有关的酶,从而对于一个只有 10 多万核苷酸对的基因组来说,基因的排列还是相当紧凑的。在基因组中只发现少量的非编码重复序列,其拷贝数的多少对基因组的大小有一定的影响。此外,基因组中的一些基因具有内含子,总数与生物种类有关,可从几个至几十个。藻类叶绿体基因组的内含子多在编码蛋白质的基因中,而被子植物的则多在转移 RNA 基因中,少数也可在编码蛋白质的基因中。同样的一种基因,在一种生物中有内含子,而在另一种相似的生物中却可以没有内含子。因此,内含子在某一基因内存在与否是比较随意的, 而且总的数量也不多。

图 22 典型的叶绿体基因组。IRA 和 IRB 为反向重复序列,LSC 为大单拷贝区域,SSC 为小单拷贝区域,其余符号为基因代号

伞藻属种类的叶绿体基因组却与众十分不同。虽然详细的基因组结构还

有待进一步研究,但已有的资料表明,这些基因组所含的基因和一般的叶绿体基因组差不多,所不同的是含有很多的非编码序列,包括重复序列。

因此,虽然大多数叶绿体基因组都比较均一,但与线粒体基因组类似, 叶绿体基因组也有两种可从其大小及相应的结构特点加以区分的形式,这两种形式也可以称为(叶绿体)“小基因组”型和(叶绿体)“大基因组”型。“小基因组”型包括大部分已研究过的藻类和高等植物的叶绿体基因组,以叶绿体基因组较小,基因排列较紧密,重复序列,内含子等非编码成分虽然存在,但数量较少为特点;“大基因组”型则以伞藻属的叶绿体基因组为代表,以叶绿体基因组相对很大,含有很多非编码序列为特点。