【三思言论集】→【三思藏书架】→《基因天堂》          〖本书由Jerry2002扫校〗

        第十二章 无所不在的融合

 
乘风破浪的航空母舰
  
  “21世纪是生物技术(Biotechnology, BT)时代”,“21世纪是信息技术
(Information Technology, IT)时代”,从十几年前开始,我们就几乎每天都在受
到这样的舆论冲击,使我们不知不觉地在脑海中形成了这样一幅情形:BT业和
IT业好似两艘快艇,并驾齐驱,乘风破浪,冲在21世纪的最前沿。

  不过,在我看来,我倒更乐意用以下的情形来描绘:生物技术和信息技术共
同构建起一块密不可分的钢板,支撑起整个科学技术,像一艘庞大的航空母舰在
21世纪飞速而平稳地前进。因为这种理解至少从一个方面更加能够说明实际情
况,即在任何时候,任何一项科学都不是在本领域内孤立无援地发展,同时,任
何一项科技的进步都会对整个科学的发展起到推动作用。

  像信息技术这样的工具性科学,它不仅水到渠成地融入其他科学,也渐渐成
为我们日常工作生活密不可分的一部分,使我们传统的生活方式发生日新月异的
变化。例如,我完全是对着计算机屏幕写完这本书,当然我也比以往更加小心翼
翼地防范计算机病毒,我从网络上获取必要的资料,并且我也计划在网络上进行
部分销售。在进行所有这一切时,这些事情变得就像吃饭睡觉一样自然而然,我
甚至怀疑我们是不是在进化中产生了“IT基因”。

  如果说IT业改变的是我们生活的方式,那么BT业在改变我们生活方式的同
时,更在改变我们生命的方式。生物工程广泛地应用于医药、农业、能源、地
矿、环保等诸多领域,而这些领域的任何一项又都对人类产生至关重要的影响。

  当BT业和IT业为整个科学技术的发展注入新的动力的同时,这两个产业之
间也在进行着前所未有的融合。

  一方面,由于人类基因组计划和蛋白组计划的实施,每天都要涌现出数以万
计的数据,这些数据的储存和处理必须依赖像RS/6000这样性能卓越的计算工
具。另外,通过网络,身处世界各地的生物学家能够方便快捷地获取信息,分享
资源。如果没有计算机和网络,像人类基因组计划这样的宏伟工程只能是空中楼
阁。闭门造车显然已经无法适应现在的大科学时代。

  与此同时,BT对IT所产生的影响,可能足以使整个IT业发生一场翻天覆
地的大革命。目前整个IT业的基础可以说都建立在一个字上,这就是“硅”。
硅元素与计算机的关系如此之密切,以至于我们把加州的信息产业高科技区称为
“硅谷”。然而,由于我们对计算机运算能力的要求越来越高,对计算机体积要
求越来越袖珍,继续要硅来完成这样艰巨的任务实在勉为其难。这时,DNA这个
存储有生命信息的大分子开始显示出其得天独厚的计算和存储优势,以DNA为基
础的生物计算机已经展现出无可限量的前景。恐怕连大自然也没有想到,它用来
创造生命的DNA竟然还会肩负起创造计算机的任务。


数字化基因

  摩尔根时代以来,生物领域就由一个个散在的手工业作坊组成,大伙在各自
充满瓶瓶罐罐的作坊里独立经营,学术刊物是彼此之间信息交流的主要渠道,偶
尔的时候,大伙能聚在一起分享心得和体会,从整体而言,这种信息交换的效率
充其量也只相当于1兆的带宽,但各个生物作坊就要凭借这点信息的反馈来协调
彼此的工作。

  老实说,能在这种条件下取得今天生物学的成就,更多是依靠个别科学家超
人的智慧和机遇。尽管这样零打碎敲的工作方式已经奇迹般地为现代生物科技奠
定了坚实的基础,但如果要完成像人类基因组计划这样宏伟的建筑,我们无论如
何需要用网络把各个作坊统一成一个有机的整体,大家相互协调,知道自己做什
么,也要知道别人在干什么,每个人都知道自己该在这个大厦的那个部位添上一
块砖,最大限度地避免了重复劳动,你如果身处其中,你就会真切地感到一种热
火朝天的氛围。同时,大家共享彼此的成果,像GENEBANK这样的在线数据库更
成了所有已完成的基因序列的集散地,当我第一次从GENEBANK上获得一个基因
的全部序列时,最大的疑虑就是:这到底是真的吗?如此重要的数据怎么这么容
易就跑到我的计算机里了?

  由于大伙协同作战,与人类基因组计划相关的数据几乎每天在呈几何级数增
长。在这里,你最能感受到“信息爆炸”这个词有多么贴切,稍有松懈,你就会
有被成堆的信息淹没的危险。我们必须不断地面对这些汹涌而来的数据,将它们
进行收集、处理、解释和利用,在一大堆诸如AGCT之类的数据中推算基因的二
级、三级结构,进而预测这些基因的功能,不言而喻,这些都需要超量运算。幸
好,和我们并肩作战的还有无数台当前最先进的计算机,它们日夜兼程满负荷地
运转,只要瞧着它们紧张而忙碌的样子,我就由衷地觉得这些计算机真是我们亲
密的伙伴。


终将衰退的硅谷

  我至今还清楚地记得,当我第一次看到树立于中关村街头的DNA双螺旋雕塑
时,我有多么惊讶。我当时问一旁的朋友:“这个雕塑的设计者怎么这么有先见
之明?”

  “先见之明?”我朋友面带不解地问。

  “是啊,他怎么会在好几年前就预测到计算机将要以DNA为基础?”我同样
不解地问。

  “原来是你误解了,”朋友好像恍然大悟地笑起来,接着说:“据我所知,
这个DNA雕塑是用来象征生命和朝气,并非什么DNA计算机。”

  “原来是这样。”我不禁也笑起来,“不过,这虽然不是先见之明,但至少
也是个好兆头,预示着尽管中关村现在和硅谷相比还差一些,但到了生物计算机
时代一定有希望超过它。”

  不知是谁为斯坦福周围的信息产业园区起了“硅谷”这个名字,这个人显然
对硅元素在计算机中的垄断地位充满信心,大有“舍硅其谁”的信念和勇气。但
他却过于高估了硅的作用,而同时低估了科学创造奇迹的能力。

  虽然我们无法统计现在的信息量究竟比以往增加了多少,但可以肯定的是,
这一定是个呈几何级数增长的过程。如今,各种有意义的、没意义的信息塞满了
各种有形的、无形的网络。我们人类把信息爆炸的压力转嫁于计算机上,对计算
机的存储和运算能力提出了前所未有的挑战,“功勋显赫但年老体迈”的硅开始
日益显得力不从心,与此同时,脱氧核糖核酸(DNA)这个创造生命的大分子却
在新的计算机领域大有再创辉煌之意。


基因化数字

  尽管我们大多数人并不能确切地说出硅是如何进行信息存储和运算的,但我
们还是会迷迷糊糊地想到一长串“01010101……”,并且因此而觉得我们似乎已
经理解了硅在其中所起的作用。 至于用DNA来制造计算机对我们来说则是一件
不可思议的事情,其实只要你想到一长串“AGCTTGAC……”,生物计算机的概念
也会因此而变得具体起来。

  由于DNA在创造生命中就扮演存储生命信息的角色,因而我们对DNA具有储
存能力并不奇怪,但如果你没有足够心理准备的话,它所能存储的信息量之大足
以让你目瞪口呆,1克DNA的信息容量竟然有100万兆字节(相当于1万亿张现
有的CD光盘),这样的巨量足以容纳下我们能够收集到的所有信息!

  但当你从惊诧中清醒过来后,可能仍然会对DNA能否胜任硅的位置表示怀
疑,毕竟,存储功能只是计算机的一部分而已。

  可事实上计算能力也是DNA的禀赋之一,而并非我们强加于它。在生命系统
中,有很多例子可以明确地显示DNA这一特性。例如,免疫系统每次为了从庞大
的抗体库里选择出合适的抗体来对付特定的抗原,就必需动用极其复杂的计算。

  了解这些或许可以使我们对DNA的计算能力不至于感到太意外,而且,由于
数百万亿个DNA分子可在一个狭小的区域内在某种酶的指令下同时工作,这一
并行处理能力足以使那些只知道埋头苦算的超级硅计算机相形见绌。

  任何一样东西只要具备两个要素——能够存储信息并且能够加工信息——就
可用来进行运算,而DNA恰恰在这两个方面都具有得天独厚的优势。


硬币上的计算机

  和当初制造硅计算机一样,你不要指望一上来就能在DNA上看到丰富多彩的
图形界面或玩三角洲部队游戏,我们必须从一些比较基本的运算开始。

  1994年,南加州大学的爱德尔曼(Leonard Adelman)成功地用DNA解答了
令硅计算机望而生畏的“销售员旅行”问题,在整个计算世界引起了轰动。所谓
“销售员旅行”问题就是假设一个销售员要从A城市出发,经过若干个城市后,
终于到达特定的B城市,设计一个最经济、有效的销售路线。

  这类问题实际上有非常广泛的应用,最典型的莫过于我们常在电影里看到破
译密码的过程,如果你设定的密码只有两位,而且都是阿拉伯数字,就是手工一
对对数字试也花不了多少时间,但当你的密码每增加一位数,运算量随之就呈几
何级数增长,如果你再向一个较长的密码中掺入字母的话,这可就够让硅计算机
头痛一阵了。

  对于这类“销售员旅行”问题,爱德尔曼则将每个城市和每两个城市之间的
路径用DNA链编码。几百万根DNA链弥漫于溶液中,能够自动组成所有可能的路
径组合方式,然后经过一系列分子操纵把正确的解决方法筛选出来。

  但过去用DNA进行计算时,总是让DNA随意地漂浮于试管的液体中。威斯康
星大学的刘庆华等科学家则克服了这个弊病,他们把DNA分子附着在镀金物体的
表面,这个成果向最终设计出具有实用功能的生物计算机迈出了重要一步。我们
只需要一枚硬币,上面就能够容纳数以兆计的DNA同时进行并行处理,而不必像
传统计算机那样按照次序一个一个地分析。

  这些科学家还采用“排除法”来执行一个有16个解的复杂数学运算。他们
先用一串二元数字分别代表问题中涉及到的变量,每一个二元字串又可以用一段
核苷酸单链代表。如果有n个变量,就要有2n个不同的单链(例如5个变量则
需要32个单链)。

  研究者先将符合题目第一个条件的所有单链固定在一个镀金物体表面,然后
根据题目给出的第二个条件加入互补单链,只有满足该条件的核苷酸单链才能够
互补结合成DNA双链,而余下的单链则用酶解清除,接着用加热法使双链分离,
经过清洗后在镀金表面保留下来的就是所有符合前两个条件的单链。同样的步骤
依次重复几次后,最终只有满足所有条件的DNA单链才能在镀金表面保留,而这
正是题目的解。不过,为了看清答案,还必需加一个步骤,即用PCR技术将这些
单链扩增。

  很明显,对于一个有m个条件n个变量的问题, 生物计算机的整个求解过程
共需要3m+1步,而硅计算机则要1.33n个步骤得出答案。例如一个有50个条
件50个变量的问题,生物计算机只要151步,而硅计算机竟然需要160万步。

  这一相差好几个数量级的对比使我们几乎无法想像等到了生物计算机完善的
那一天,会给整个世界带来怎样翻天覆地的震动,不需地震预报部门预测,我分
明已经感受到了这场地震的前兆。


绝妙而令人头痛的错误

  大自然花了几亿年时间,经过无数次推敲,最终才选择了DNA(或RNA)来
做生命的承载体,今天我们已然了解了大自然煞费苦心的理由,DNA能够当选,
不仅是因为它可以精确地进行复制,更在于它会偶尔犯些错误。如果DNA只知道
一心一意、机械刻板地复制自身,我们至今还只是海洋里一些原生动物而已。DNA
偶然的错误为进化提供了丰富的原材料,使最初的一段简单的DNA能够不断编码
出新的生命信息。因此,这些错误非但可以原谅,而且不可或缺。

  但生命和机械毕竟存在着本质的区别。DNA在生命中恰到好处的“错误”特
性却着实令生物计算机设计者头痛一阵,甚至一度使不少人因此而认为DNA根本
就无法承担起硅的角色。尽管随后生物计算机的进步已经使这种言论失去市场,
并且也已经有一些方法来纠正DNA中可能发生的计算错误,但这仍然是亟待解决
的主要问题之一。

  但无论如何,生物计算机在短短几年内就已经取得如此成就,足以稳固了
DNA在计算领域中的黑马地位,对硅长期奉行的垄断政策构成了最具威胁的挑
战。

  20年后,取代我现在桌面上电脑的将是一只小巧的试管,外面的标签上写
着“DNA inside”。
【三思言论集】 欢迎给制作人来信:jasper_uk@sina.com