财新传媒
位置:博客 > 汪丁丁 > 汪丁丁:从生命系统论到系统生物学

汪丁丁:从生命系统论到系统生物学

老米勒夫妇辞世于2002年——参阅我的文章“生命系统”(财新博客2021年3月26日)。此前两年,胡德(Leroy Hood)辞去他在华大的教职,于2000年在西雅图创立世界第一个“系统生物学研究所”,图4。生物学与基础医学终于成熟,可以引入系统论研究方法了。这是我的理解,学科“成熟”的标志:仅当这一学科嵌入于其中的社会关于这一学科形成的“供求关系”进入平衡状态并能够为这一学科提供足以与其他学科“竞争生存”的学术资源。图3,是2020年出版的“牛津极简引论系列”《系统生物学》封面,图1和图2是这本小册子第3章的表1和表2,这两张表格(必须细读我的注释文字)足以表明系统生物学方法应用于现代临床医学可能引发怎样的革命。当然,目前最容易获取学术资源的,是“实验系统生物学”。
图1. 取自 Eberhard O. Voit,2020,《Systems Biology —— A Very Short Introduction》(系统生物学牛津极简引论)chapter 3,table 1:生物学的传统科学方法,第一阶段,“观测”;第二阶段,“提出问题”;第三阶段,“背景研究从而获知以往关于这一问题的研究”;第四阶段,“细化问题到足够建立可检验假设的程度”;第五阶段,“设计旨在检验假设的可实施的实验”;第六阶段,“分析实验数据从而确认假设获得实验支持的程度”;第七阶段,“若实验不支持假设,返回第二、第三、或第四阶段”;第八阶段,“若实验支持假设,则可产生新的洞见并与科学共同体分享这些洞见”;第九阶段,“新的洞见通常导致新的问题,从而,针对新的问题建立新的假设。”
图2. 取自 Eberhard O. Voit,2020,《Systems Biology —— A Very Short Introduction》(系统生物学牛津极简引论)chapter 3,table 2:实验系统生物学应用于临床医学时的新科学方法,第一阶段,“识别一类有研究兴趣的现象,例如,疾病”;第二阶段,“判断哪一种组学——转录组学、蛋白组学、代谢组学……,最富于成果”;第三阶段,“从健康群体和患者采样并进行相关的组学分析——基因组分析、蛋白组分析、代谢组分析……”;第四阶段,“从健康群体和患者的相关组学数据确立病态与常态的显著差异”;第五阶段,“根据病态与常态的组学差异建立案例”;第六阶段,“提出旨在解释案例组学差异的假设”;第七阶段,“返回传统科学实验阶段检验这些假设”;第八阶段,“若实验结果不支持假设,则返回第二、第三、或第六阶段”;第九阶段,“若实验结果支持某一假设,则可产生新的洞见并与科学共同体分享洞见。”
 
由图1和图2的注释文字可见临床医学已经历或将要经历怎样的方法论革命。虽然,传统中医始终保持着这样的系统论视角,而且在“中西医结合”的时期(1970年代至1980年代)获得普及。西医引入这一整体论视角之后形成的医学,称为“整合医学”(integrative medicine)——物理、生理、心理,“身心灵”的整合协调,流行于1990年代(借助于世纪末的“新时代运动”)并延续至今,瑜伽、冥想、正念修行、积极心理学,与日本禅宗1960年代流行于西方社会,一脉相承。思想史考察表明,积极心理学恰好也是系统论思想运用于心理学的产物。
图3. Eberhard O. Voit,2020,《Systems Biology —— A Very Short Introduction》(系统生物学牛津极简引论),封面。
 
百度百科“系统生物学”词条:系统生物学的基本工作流程有这样四个阶段。首先是对选定的某一生物系统的所有组分进行了解和确定,描绘出该系统的结构,包括基因相互作用网络和代谢途径,以及细胞内和细胞间的作用机理,以此构造出一个初步的系统模型。第二步是系统地改变被研究对象的内部组成成分(如基因突变)或外部生长条件,然后观测在这些情况下系统组分或结构所发生的相应变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化,并把得到的有关信息进行整合。第三步是把通过实验得到的数据与根据模型预测的情况进行比较,并对初始模型进行修订。第四阶段是根据修正后的模型的预测或假设,设定和实施新的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精练。第一到第三阶段,也就是以下的“整合”- 系统理论、“干涉”- 实验生物学和“信息”- 计算生物学等研究,即系统论和实验(experimental)、计算(computational)方法整合的系统生物学概念,目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的真实性。……作为后基因组时代的新秀,系统生物学与基因组学、蛋白质组学等各种“组学”的不同之处在于,它是一种整合型大科学。首先,它要把系统内不同性质的构成要素 (基因、mRNA、蛋白质、生物小分子等) 整合在一起进行研究。……系统科学的核心思想是:“整体大于部分之和”;系统特性是不同组成部分、不同层次间相互作用而“涌现”的新性质;对组成部分或低层次的分析并不能真正地预测高层次的行为。如何通过研究和整合去发现和理解涌现的系统性质,是系统生物学面临的一个带根本性的挑战。……21世纪伊始,权威刊物 Nature、Science 发表系统生物学、合成生物学等专刊,终于进入了系统生物科学(简称系统生物学)全球化迅速发展时代。
图4. 西雅图2000年成立的“系统生物学研究所”主要领导人,中间这位就是胡德。
 
本世纪医学的“大数据”运动,为实验系统生物学提供了更充足的资源。例如,2020年《细胞》杂志“值得关注的科学家”栏目专访的人物是“Yanlan Mao”(百度却不得其名),剑桥大学培养的一位细胞学家,年轻的华裔女性(她名字的汉语拼音表明她父母是大陆中国人)。她以数学和物理学的优势转入生物学研究,并于2014年在伦敦大学学院成立了自己的实验室,图5。
图5. LMCB(分子细胞生物学实验室)PI(首席研究员),伦敦大学学院杰出教授,MRC职业发展研究员,伦敦大学学院IPLS副主任,Yanlan Mao。此处“MRC”(医学研究委员会),相当于美国的“NIH”(国家卫生研究院)。2018年获得联合国教科文组织颁发的“欧莱雅”女科学家奖,同年获得李斯特研究院颁发的“研究大奖”。2019年获得生物物理学会颁发的“生物机制研究早期职业成就奖”。2020年获得不列颠细胞生物学会颁发的“细胞生物学女性早期职业成就奖”。
 
她与Jeremy B. A. Green联合主编于2017年英国皇家学会“通讯”B372卷“系统形态动力学”专号,1月16日(收稿日期)发布的“导言”,标题是:“systems morphodynamics — understanding the development of tissue hardware”(系统形态动力学——理解组织硬件的发育过程),开篇就引我关注:基因不制造组织,细胞制造组织。晚近几十年,正常组织的物理形态分析退居二线,让位于基因调节网络分析。最近,因为越来越多地意识到基因无法驱动复杂的组织形态改变,基因与染色体的思路已进入成熟阶段,……。阿兰•图灵在1952年皇家学会通讯发表的一篇论文里标识了两类形态动力学——“化学的”和“机械的”。包括图灵机在内主导着化学形态动力学的机制,我们今天称为“模式构型”,伴随着批量而来的实验和综述,正在开始被很好地理解。可是,机械的形态动力学刚开始涌现成为一个令人兴奋的新的发现与研究领域。
图6. 截图取自:Terrence Deacon,2011,《Incomplete Nature — How Mind Emerged from Matter》(不完整的自然——从物质如何涌现心智),第9章。这是迪亚肯学说的核心内容,他认为,意识的涌现,来自图示的第3类过程,他称之为“目的论动力学”(例如生命和语言),他确实是在亚里士多德“目的因”的意义上使用这一语词的。图示的第1类过程,“稳态动力学”(例如热力学),基于热力学第二定律,描述的是“熵增”过程。图示的第2类过程,“形态动力学”(例如自组织现象),描述的是“熵减”过程,特征在于各种约束的持续涌现。此处的“约束”,特指系统对能量的各种可能形态的约束。
 
迪亚肯现在是加州伯克利大学的教授,他最初引我关注的,是1997年的著作《符号物种》,Terrence Deacon,1997,《The Symbolic Species — The Co-evolution of Language and the Brain》(标题直译:符号物种——语言与脑的共生演化)。那时,我在写一篇运用不动点定理于语言演化的小文章,并因此与鲁宾斯坦(Ariel Rubinstein)通信提醒他读迪亚肯。因为,他刚发表的《语言经济学》表明他没有读过迪亚肯的这本书。后来,迪亚肯从脑科学转入意识研究,十多年后,2011年,发表《Incomplete Nature — How Mind Emerged from Matter》(标题直译:不完整的自然——从物质如何涌现心智)。这本书,与上一本书同样,立即引我关注。迪亚肯的叙事过于跨学科,甚至我这样的跨学科教授也很难理解这本书的核心命题。直到他多年的同事,一位广受欢迎的科普作家舍曼写了下面这本书:Jeremy Sherman,2017,《Neither Ghost nor Machine — The Emergence and Nature of Selves》(标题直译:既非幽灵又非机器——自我的本质及其涌现)。于是,我开始认真研读迪亚肯的理论,试图将他的思路与著名的科赫2019年新书的思路相结合,为要完善我的“观念拓扑”关于生命的想象。此处顺便推荐科赫这本新书:Christof Koch,2019,《The feeling of life itself — why consciousness is widespread but can’t be computed》(标题直译:生命自身的感受——为何意识广泛存在却不能被计算)。
图7. 截图取自 Christof Koch,2019,《The feeling of life itself — why consciousness is widespread but can’t be computed》(标题直译:生命自身的感受——为何意识广泛存在却不能被计算),第11章。
图8. 截图取自 Christof Koch,2019,《The feeling of life itself — why consciousness is widespread but can’t be computed》(标题直译:生命自身的感受——为何意识广泛存在却不能被计算),第13章。
 
系统生物学的思路原本就是将生命视为信息熵的减少过程。按照我理解的“新的综合”,不必有“信息”二字,只应讨论熵减过程。熵减之得以发生,在迪亚肯学说的视角下,是因为系统持续涌现更强的约束,从而能量必须以越来越精致的形态存在。此处的“能”,可由金岳霖《论道》的第一组命题澄清:道是“式-能”;道有“有”,曰式曰能;有能;有可能;有式,而式是析取地无所不包的可能;……式无二;能不一;式无内外;能有出入;式常静,能常动;……居式由能莫不为道。
 
科赫2019年著作是他和克里克晚年深入讨论意识起源问题的第三次总结,他称之为“三部曲”之三(之二已有中译本:克里斯托弗•科赫《意识与脑:一个还原论者的浪漫自白》)。根据科赫在这本书里阐发的“信息整合理论”(首先提出这一理论的是:Giulio Tononi,2015,“Integrated information theory”,Scholarpedia, 10,1,41-64),只要有生命,就有意识。整体多于其局部之和的,可表达为意识。确切而言,如果系统包含N个局部,那么,这一系统能够具有的意识水平可表达为贝尔数列的第N项。任一集合,如果它包含N个元素,那么,贝尔数列第N项表达的就是在这一集合上可能定义的全部等价关系的数目,也就是这一集合的全部可能的“划分”(partition)的数目。图7,甚至最低级的生命也可以有超过100个细胞,贝尔数的计算量极大。科赫借助计算机仿真绘制了这张图,横轴,适存度0.5的系统与适存度0.2的系统相比,整体大于局部之和的贝尔指标(纵轴)大约在5倍至10倍的范围。图8,横轴是智能水平,纵轴是意识水平。最简单的生物也有远高于超级计算机的意识水平。虽然,超级计算机有远比人类更高的智能。
 
2021年4月9日
 



推荐 11