第四章 基因工程

一、基因进入工程的前夜

孟德尔提出的基因决定性状,经过 100 余年的研究,已经演绎为 DNA 决定蛋白质。三体密码的概念,又具体生动地说明了 DNA 中的核苷酸与组成蛋白质的氨基酸的关系。但是,细胞学所揭示的事实是这样的:DNA 主要存在

于细胞核中,而蛋白质主要存在于细胞质中,另外,由氨基酸合成蛋白质是在细胞质内进行的,而且 DNA 这种大分子不能随意进入细胞质。根据这种事实,法国的生物化学家雅各布和莫诺首先提出“位于细胞核内的 DNA 怎样决定蛋白质的合成”,或者说“锁在档案室中的密码如何把密码所记载的信息传递出去呢?”

在提出问题时已经在思考答案了。他们作出这样的推理:“档案室里的密码虽不能外借,但一定是可以翻录的,而翻录带一定可以带出档案室。” 那么,细胞核里除了 DNA 外,有没有结构与 DNA 相似又能从细胞核内进入细胞质的物质呢?有,那就是核糖核酸(RNA)。RNA 的结构与 DNA 十分相似, 因为 RNA 也是由核苷酸连接而成的长链,这种长链也确实是按照 DNA 的模子, 象 DNA 半保留复制那样形成的。即在细胞核内的 DNA,首先双链拆成单链, 然后在 DNA 单链的乌嘌呤(G)处,连上一个胞嘧啶(C),在腺嘌呤(A)的地方,接上一个尿嘧啶(U),这样形成的一条新链就是 RNA。由此可见,RNA 与 DNA 相比,在碱基的种类上只是由尿嘧啶代替了 DNA 链中的胸腺嘧啶。此外,RNA 的糖是核糖,DNA 是去(脱)氧核糖,DNA 是双链,RNA 是单链。

照着细胞核内 DNA 的样子,由 4 种核苷酸连成 RNA 长链,叫做转录(或翻录),可想而知,RNA 是带着 DNA 的信息的,意思是说 DNA 中碱基的相互连接情况也反映在 RNA 的结构上,例如 DNA 一条链上组成密码的碱基如果是

—AAC-CGG—,那么,由此链转录成的 RNA 链,碱基的排列为—U-UGGCC—。这种 RNA 长链由于带着 DNA 链上的信息,因此叫做信使 RNA(mRNA)。

mRNA 能从细胞核内进入细胞质。但是,根据罗马尼亚血统的美国生物化学家帕拉德 1956 年用电子显微镜观察的结果,进入细胞质的 mRNA 是与细胞质中的小颗粒结合在一起的,这个小颗粒叫“核糖体”。细胞里的蛋白质都是在这个小颗粒里合成的,因此,可以说,核糖体是细胞中合成蛋白质的车间。

美国另一位化学家霍格兰在研究细胞质中的 RNA 时,又发现了一种分子量比 mRNA 小得多的 RNA,后来证明,这种 RNA 一头能与某种特定的氨基酸结合,另一端有三个碱基组成的一个密码子,这个密码子能与 mRNA 相应的密码子结合,为了与 mRNA 上的密码子区别起见,特把这种能与氨基酸相结合的分子量较小的 RNA 上的密码子叫“反密码子”。实际上,这种 RNA 是专门“搬运”氨基酸的,所以也叫搬运 RNA(tRNA)。

由于对 DNA 转录为 RNA 的研究和发现了细胞质中合成蛋白质的车间以及搬运 RNA,最终阐明了 DNA、RNA 和蛋白质三者的关系。这三者是密切相连的, DNA 上由碱基排列顺序组成的信息,先传给 mRNA,再由mRNA 指导蛋白质的合成。套句时髦的话说,遗传信息由 DNA 流向 RNA,再由 RNA 流向蛋白质的过程,就是遗传学中的中心法则。

克里克提出的“三体密码”虽然赢得一片赞美声,但那个“密码子”代表着哪个具体氨基酸呢?这个问题吸引着一大批科学家。

1961 年,美国生物学家尼伦伯格和马太合成了由许多“尿核苷酸”连结成的长链,称为“多聚尿苷酸(U—U—U—U⋯)”,他们把这条人工合成的长链加入含有多种氨基酸、酶、核糖体和一些合成蛋白质所需要的其他物质的溶液中。奇迹出现了,这种溶液中形成了一条只有苯丙氨酸连接而成的多肽链,这样,尼伦伯格和马太就确认苯丙氨酸的三联体密码是 U—U—U。

第一次成功,鼓励着他们第二次的试验。尼沦伯格和奥乔亚联手进行了

比第一次稍复杂的试验。首先,他们用“尿苷酸”和“腺苷酸”(A)两种核苷酸合成一条多苷酸,这条多核苷酸链中,除 UUU 外,当然还会有 UUA、AUU、UAU 等多种三联体出现。当他们把这条多核苷酸加进具有合成蛋白质一切必要物质的溶液中时,多肽链也在溶液中出现,可在这条多肽链中除苯丙氨酸外,还有亮氨酸、异亮氨酸和酷氨酸。

就是这样一步步的分析,到 1967 年,才写出了廿余种氨基酸的密码子, 此外也发现了有些密码子另外还代表着起始、终止和标点。

氨基酸密码的破译,尼伦伯格和印度血统的美国人考拉那等立下了不朽功绩,因此他们分享了 1968 年的诺贝尔医学和生理学奖。

DNA 中核苷酸组合成的密码被破译,是一个世纪以来,生命科学中最令人激动的巨大成就,但是这并不等于生命世界再也没有任何秘密,因为没有秘密的世界将会是一片死寂。实际上,在密码被破译的时候,密码中之密码又在等待着人们去探索。

1968 年,布里顿等人在用蛙和蝾螈作实验材料时,发现这些真核生物的DNA 中,与大肠杆菌等原核生物不同之外是某一段上会出现同样核苷酸的重复,如某一段 DNA 上可能全是 AAAA⋯或 ACACACAC⋯⋯或三个、四个等核苷酸重复,重复的次数可成千上万甚至百万。有人估计,高等生物的 DNA 中,这种重复顺序(序列)在 50%以上,甚至高达 80%。这些重复成千上万次的几个核苷酸究竟起什么作用呢?可以肯定,这些重复序列不能作为蛋白质的密码,也从未见到过这些重复序列转录出已知顺序的 RNA。难道高等生物中 50

%、以至 80%的 DNA 都是废料吗?要是这样,那么高等生物实在太“铺张浪费”了,难道高等生物连细菌也知道的“节约原则”都不清楚吗?!不要说 DNA 中有 50%或 80%的废料,就是连 10%的废料存在,恐怕这样的生物也早在自然选择的长河中,被某些“励行节约、高效运转”的强者所取代了。重复序列真是密码中的密码,至今仍然等待着有识之士去揭开这个千古谜案。 1971 年,美国微生物学家内森斯和史密斯在细胞中发现了一种“限制性

核酸内切酶”,这种酶能在 DNA 上核苷酸的特定连接处以特定的方式把 DNA 双链切开。此外,他们又发现了另一种“DNA 连接酶”,这种酶能把二股 DNA 重新连接起来,从而为干预生物体的遗传物质,改造生物体的遗传特性,直至创造新生命的类型奠定了物质基础。在这样的科学背景下,基因工程应运而生了。