(资料图片)
2023年8月3日,应北京大学生物医学前沿创新中心(BIOPIC)谢晓亮教授的邀请,美国华盛顿大学应用数学系Olga Jung Wan讲席教授钱纮访问BIOPIC,并作题为“Toward a Biophysical Chemistry of Living Cells”的学术讲座,讲座由谢晓亮主持。
生物物理化学最常见的研究对象是以蛋白质为代表的生物大分子,其背后的基础是物理化学、尤其是吉布斯能量理论。钱纮主要聚焦于为生命系统的随机分析和统计物理学等方面的研究,他认为对于处于平衡态的生物大分子,生物物理化学家们从吉布斯能量理论中物质浓度与能量的关系式出发,通过测量不同物质(或物质的不同形态)的浓度,就能够计算出相关研究对象的能量信息。这意味着吉布斯能量的概念和基于能量的叙述是我们理解蛋白等生物大分子的基本途径。随着表征生物大分子结构技术的快速发展,以及分子动力学模拟对分子中每个原子所受力的详细描述,使得以蛋白质为代表的生物大分子已经成为自然界中人类了解最深刻的复杂体系之一。
当科学家将研究对象转移到活细胞时,和处于平衡态的生物大分子不同,活细胞处于非平衡稳态中,其组成十分复杂,无法简单地利用吉布斯能量理论。钱纮提出从实验得到的统计数据出发,从一个新角度将生物大分子和活细胞两个体系统一理解。他假定所研究的体系有多种可能的状态,实验测量能够得到一组数据,这组数据能够描述此体系处于每种状态的概率,只要此体系处于稳定状态,不论其状态是平衡或是不平衡的,只要测量次数足够多,则该组概率值应当是可重复的,意味着该组概率只有一种可能的取值组成。
另一方面,假定系统满足独立同分布,钱纮认为可以用简单的排列组合及概率计算得出系统处于每组频率取值的概率表达式,结果发现此表达式与香农信息熵定义具有关联:当将处于每种状态的概率取值限定为实验测量值,即实际情况时,可能性的概率表达式取到极值且与信息熵有着同样形式。钱纮表示,这是完全由数据科学出发给出的一个新的理解熵极值原理的角度,无论我们研究的对象是单个生物大分子、单个细胞乃至大到种群,以上的讨论都成立。
钱纮进一步补充到,在求解信息熵极值过程中,可以使用勒让德-芬切尔变换来求解此含约束的优化问题,求解过程中引入的限制性常量实际上带有能量的定义。除此之外,以上的全部讨论的前提是所研究的体系在各可能的状态间满足独立同分布假设,如果是更为复杂的体系,钱纮表示也可以用类似的思路来进行研究,最后能够得出数学形式不一样的熵表达式。
作为非平衡态统计力学的专家,钱纮用缜密的逻辑和极富感染力的语言,为BIOPIC师生奉献了一场非常精彩的学术报告,深入浅出地介绍了自己从数据科学的角度理解熵、能量等热力学概念的一些思考。在问答环节,钱纮一一解答了观众提出的问题,并在会后与中心研究员等就科学问题和学术合作等进行了深入探讨。