Tag Archives: science history

P. Flory自述对M. Huggins工作的首次关注

聚合物溶液的Flory–Huggins理论是高分子物理经典理论体系中的基石。它哪怕十分不准确,也被当作“标准模型”,作为更真实理论的参照。之所以使用这两个名字,是因为这两个人几乎同时做了同样的工作。更准确地说,是Maurice L. Huggins先做的。从发表的时间来看,Huggins发表于1941年5月[1],Flory发表于同年8月[2],并且已经引用了Huggins的工作了。实际上这两篇论文都提到了,在同年的6月份的一个会议——Wilder D. Bancroft Colloid Symposium上,Huggins报告了他的工作。多年之后的1985年,Flory的后一篇1942年的论文[3]被美国科学信息研究所(Institutide of Scientific Information,ISI)的期刊Current Contents选为“本周经典引用”(1985年5月6日,第18期),这个栏目会邀请论文作者写点故事。Flory在这里亲自回忆了他在Wilder D. Bancroft Colloid Symposium首次得知Huggins做了跟他重复的工作的很多细节。Huggins是Lewis的学生,是Flory的前辈。以下是Flory回忆的一段原文的中文译文。

我们的研究是独立进行的。我第一次了解到Huggins的工作,是在1941年6月于康奈尔大学举行的胶体研讨会上,当时他展示了他的研究成果。在那次研讨会上,我发表了一篇关于非线形聚合物凝胶化和网络形成理论的论文,这个主题与上述内容无关,但像它一样,也获得了广泛的认可。从Huggins的演讲中,我惊讶地得知他所进行的工作与我当时正准备发表的关于聚合物溶液热力学的研究非常相似。演讲结束后,我走近他,指出我也在进行类似的研究。他非常和蔼,鼓励我这个当时还只是个无名小卒的人发表我的工作,并与他交流。这是我们的第一次会面,也开启了我们一生的友谊。后来,我们就各种主题和发展进行了许多科学讨论,虽然并不总是完全一致,但总是相互尊重,关系融洽。正如我常说的,以我们名字命名的这个理论,我们的名字顺序应该颠倒过来,因为他的第一篇论文比我的早了一两个月。他最初的贡献更详细地阐述了晶格理论,而我的可能在某些方面更全面。

References

  1. M.L. Huggins, "Solutions of Long Chain Compounds", The Journal of Chemical Physics, vol. 9, pp. 440-440, 1941. http://dx.doi.org/10.1063/1.1750930
  2. P.J. Flory, "Thermodynamics of High Polymer Solutions", The Journal of Chemical Physics, vol. 9, pp. 660-660, 1941. http://dx.doi.org/10.1063/1.1750971
  3. P.J. Flory, "Thermodynamics of High Polymer Solutions", The Journal of Chemical Physics, vol. 10, pp. 51-61, 1942. http://dx.doi.org/10.1063/1.1723621

传统教学内容数学语言的近世化

[latexpage]

很多经典物理范畴的小题,可能19世纪末的人勉强懂做,20世纪初或者中叶的人也懂做,很难说需要用到什么近世物理学成果,但是今天的人做这些题目所使用的数学语言照样是十分近世化的。这也许是理论物理的非经典部分在二十世纪碰到的难题所催生的数学语言革新照进了经典物理领域的一种效应。经典范围由于数学语言和思想的近世化,在二十世纪也诞生出很多新物理,所以也不能说这是“杀鸡用牛刀”,但当然也免不了很多没经过“奥卡姆剃刀”修剪的边边角角。充斥于大量令人摸不着头脑的“高观点本科讲义”中。

经典物理知识很早就已经是大学本科教学的常驻内容。只不过,就算这些内容的数学语言或体系形式在二十世纪已经“近世化”了不止一轮了,但本科教学所采取的数学语言和体系很可能仍然是19世纪的。在中国的普通高校尤为如此。但凡我们听说,哪所大学哪个系的哪门课讲义,胆敢从某种近世数学的较高观点去讲某门经典课,都会引起同行们“很update、很赶得上潮流、很不过时”的评价,同时引起学生“很地狱”的评价。因为本科普通数学教学本身迟迟没有完成近世化革命。而且越是进入到二十一世纪,越看不到这样的可能性。学生在数学课学的仍是19世纪的体系,因此也只能教用这个数学语言写就的物理版本。所有学生都免不了要在研究生阶段重新作近世化学习。这也使得一些近世物理成果,迟迟无法写进本科教产书当中,因为它们从一开始就用近世数学语言来write down的。

P. J. Flory在1951年的闻名著作 Principles of Polymer Chemistry 中显示出的热力学的统计力学方法,基本上还是这两个学科1950年之前的形态。当他离开康奈尔大学之后(1960s ~ 70s),无论是热力学还是统计力学的工作都吸收了这两个学科的近世化成果。但都只体现在他后来发表的论文当中。而再没有总结成一本像1951年这本书那样对学科本科教学影响深远的新书。现在的高分子物理本科教材,基本没有六、七十年代的东西,完全是Flory1951年这本书的复刻,甚至还丢失了Flory原书中很多充满物理洞见的叙述(因为译者看不懂)。

格子模型用于液体

虽然Kirkwood,Onsager的工作可以追溯到30年代,但这些工作无论是对非平衡的热力学/统计力学,还是对液体物理的影响,都要到60年代左右才被公认。而且Flory关心的问题也主要从平衡态切入。在这方面在50年代已经形成十分成熟的理论工具。其中热力学当时的表现形式就跟今天本科《物理化学》中的差不多。而统计力学的表现形式可以用Fowler & Guggenheim (1949), Statistical Thermodynamics, CUP来代表。这本书首印是1939年,1949年有一个修订版,之后就只有重印,没有新版。这本书在当时是十分流行的参考书。该书的一个特点是有好几个关注今天所谓的软凝聚态体系的应用章节——液体纯物质和混合物和界面问题。至少,液体的长程无序特点以“径向分布函数”这种图像已被熟知。

Flory原书在刚一抛出“格子模型”的时候,就插入了一段评述:

The molecules in the pure liquids and in their solution are considered to be arranged with enough regularity to justify approximate representation by a lattice, as is indicated schematically in Fig. 109. In a simple liquid consisting of nearly spherical molecules, the first neighbors of a given molecule in the liquid will occur at a distance from its center which is fairly well defined, although not as precisely as in a crystal. The tier of second neighbors will occur at less accurately specified distances, and so forth. Since we shall be concerned only with the first coordination sphere about a given molecule (or polymer segment, see below), the rapid deterioration of the lattice as a valid representation with increasing distance from the reference point is unimportant. The adoption of a lattice scheme is not in itself, therefore, a necessarily hazardous idealization. The succeeding postulate, namely, that the same lattice may be used to describe the configurations of both pure components and of the solution, is a much more serious one from the standpoint of application to real solution. It requires (among other things) that the geometry of the two molecular species be virtually identical.

这段解释,是面向当时就已经熟知的液体的长程无序性,解释为什么一个格子模型仍然是对液体的一种足够的近似:它仅适用于仅存在短程相互作用的情况。

使用格子模型来描述溶液,不是Flory或Huggins首先做的,而应该是更早的van Laar和Hilderbrand的做法,是1920s时候的事情。后者采用格子模型来描述溶液,也跟固体物理中的Lenz–Ising模型纯属巧合。但是,在具体处理时的“平均场假定”则是明显与固体物理相通的。Bragg–Williams近似被Fowler和Bethe立刻用于液体的统计当中,这是1930s年的事情。这些都已见于Fowler & Guggenheim (1949)那本书里,因此到Flory做聚合物溶液热力学的时候是为人所熟知的。但唯独Flory在写1951年的书的时候,注意对格子模型的简化带来的问题作预见性的批判。

学会作这种预见性的批判,才是教给学生如何独立建模解决新理论问题的素质。现在的教科书重点似乎放在让学生学懂旧理论讲什么,而不是学懂旧理论当时是怎么想的。这就是“高分子专业教不出高分子理论研究者”的原因。

我在给学生讲这部分内容的时候,先给学生介绍了液体的分子图像,以及分子间相互作用势的计算任务的截断简化(类似分子动力学的一些知识),为此突出了两种常见相互作用势——范德华势和静电势。它们的差别就在于截断距离。范德华势不到一个分子大小之后就可以截断了,而静电势大概作用距离到7个分子大小。当大家对这个简单结论了然于心之后,再了解格子模型只考虑相邻两分子之间的作用势时,就可以直接明确——我们的理论不适用于电解质溶液。我想这是溶液热力学这一章内容的一个最有价值的take home message。

橡胶弹性的超弹性模型

50年代的固体力学和流体力学也基本习惯直接写出坐标的描述方法。理性力学家对连续介质力学的公理化建设,到1960年才造成比较广泛的影响(以Truesdell & Toupin的Classical Field Theory为标志)。由于统一采用集合映射语言,所以坐标无关的向量空间和算符的语言变得更重要,因为它们能够道出物理定律的客观性。当然,这对具体力学问题没有根本性的影响,但重塑了数学语言和概念。比如,旧的形变的描述常常从拉伸比$\lambda_i$出发,但新的描述常考虑形变梯度张量$\mathbf{F}$、柯西-格林应变张量$\mathbf{C}$及其主不变量。另一方面,超弹性理论的一般化,是Rivlin在1950年代开始推进的。超弹性这个词也是Truesdell不可逆热力学的基本框架,也是de Groot在1950年代总结的。这两者与连续介质力学的张量化语言的合流,才形成今天我们教科书所展示的有限弹性的不可逆热力学基础。这些都应该要到60年代之后了。例如,各向同性函数的表示定理的证明是Gurtin在1974做的。

Flory在1951年的书出版之前,就已经确立了$G\left(I-3-\ln J\right)$的应变能形式。虽然Flory的橡胶弹性理论是分子理论,与力学研究不可混为一谈,但毕竟终需应用于解力学问题,跟使用现象学力学模型同样需要面对具体形变问题的计算。Flory在这些工作中表现出来的数学工具是传统的以标量为中心、依赖坐标的传统微积分语言。这跟上一段介绍的历史进程相比,是可以理解的。

进入60年代,离开康奈尔大学后,Flory的发表的工作体现出明显的数学语言的近世化。

60年代“旋转异构态”理论开始流行(其背景是一维Ising模型的灵感以及电子计算机的问世,详见本博客的上一篇文章),用到大量高阶的矩阵代数(其实仍然是抽象代数的显坐标形式)。Flory与同事的工作,总结在1969年出版的Statistical Mechanics of Chain Molecules一书中。书的前言特别强调矩阵直积(克劳内克积)运算少见于当时的科书中,而这在今天即是算符间的张量积的一种坐标表示。

60年代Flory和同事的另一方面工作是橡胶弹性问题的一些后续研究。在当时橡胶力学模型无论是现象学的超弹性模型还是第一原理性的网络统计,都在溶胀态的热机械行为中显示出不足。其中一个具体的现象溶胀网络力学响应中的少量的内能贡献。当时笃信的是力学主要由网络贡献,因此这个内能贡献也应该是网络形变的效应,从而急于修改纯熵弹性基础的橡胶网络模型。Flory当时强调,实际实验是在恒温恒压条件下做的,用相同的方法求得的是焓贡献而非内能贡献,其中相差的是材料的体积压缩性。虽然这一因素并非当时争论的唯一焦点,但明确这个体积压缩性,实验上并非易事,必须求助于既有理论,因而涉及到橡胶弹性理论的可压缩性。

在1961年的这篇论文[1]当中,Flory具体讨论了可压缩性的问题,他把超出之前的应变能形式预测的额外可压缩性归到一个新的自由能项中,解释为普适于所有液体的一般分子间力。这篇文章完全使用了连续介质力学的非坐标表示,只不过所使用的字母跟今天的惯例不一样。而且他用到了应力与自由能的关系——这在今天常通过不可逆热力学的基本不等式加上Coleman–Noll procedure得到,在当时则按照实际等价的“虚功原理”得到。这虽然在物理上与Treloar时代的$F=\partial A/\partial L$没什么不同,但连续介质力学的一般严格证明在1960年若不说是新的,至少也是高阶的。Flory在当时可能的参考书是F. Murnaghan (1951), Finite Deformation Of An Elastic Solid, Wiley。但就算这本书也仍是用矩阵语言的。

题外话:Flory在这篇1961年的论文给连续介质力学界作出了至仍归到他名下的贡献,那就是主张把形变分解成纯等容(isochoric)和纯膨胀(volumetric):$\mathbf{F}=\mathbf{F}_\text{vol}\mathbf{F}_\text{isoc}$。这在今天被称为“轻微可压缩”(slightly compressible)或“近不可压缩”(nearly incompressible)问题下的假定。事实上,从Rivlin早期的工作一开始就注意到,并非所有不可压缩形变都是可控的。但一直到Ericksen在1960年代才数学上严格地列举了几种不可压缩体的可控形变。所以,如果一个材料实际发生了可压缩形变,那么把从它的总形变中分出一个等容形变来,似乎它能单独发生,就常常会违反物理实际;或者说这种分解造成了一个不真实的“中间状态”。因此只有当体积变化小到好像“微扰”那般时,才可近似采用这种分解来分析。但无论如何,这个分解已经被称为“弗洛里分解”(Flory decomposition)了。

尽管在60年代之后,Flory逐渐扮演一种“领军”角色,只负责提出想法,由很多有才能的后辈帮他做具体的理论和实验工作,但实际上他对这些新工作采用的新数学方法十分熟悉,甚至仍然比这些后辈或学生更熟悉。今天我们对Flory和他的共事者在60年代之后的贡献的认知多来自他们共同署名的论文,但少数Flory单独署名的论文反而更加突出地体现了他本人的理论认识深度和与时俱进。

References

  1. P.J. Flory, "Thermodynamic relations for high elastic materials", Transactions of the Faraday Society, vol. 57, pp. 829, 1961. http://dx.doi.org/10.1039/TF9615700829

Flory的“另一本书”

某校《高分子物理》课期末考试的“英文名词解释”题中,考到“rotational isomeric state”(旋转异构态)这个术语。我感到很困惑。因为这个术语是比较深的。我们所采用的本科高分子物理教材,根本没有涉及到这个概念。这个概念甚至没有出现在P. J. Flory的“那本书”——Principles of Polymer Chemistry中(出版于1953年),因为这个概念是由Михаи́л Влади́мирович Волькенште́йн(M. V. Volkenstein)在1959年发表的著作Конфигурационная статистика полимерных цепей(聚合物链的构象统计)中正式提出的。1963年,该书的英文翻译在美国出版,P. J. Flory在序中高度赞赏了该著作。后者的“另一本书”——Statistical Mechanics of Chain Molecules也于1969年出版,使得旋转异构态——计算真实聚合物链统计性质的一种近似思想——得到更加为人所知(尽管这本书仍然是少有人阅读的)。

M. Volkenstein原著封面

旋转异构态假设,使得描述真实链的化学键节复杂性——例如不对称以及各自不独立的键节旋转势能曲线——有了可写下的统一数学形式。从今天的角度看,这一假设造成的好处是数学描述的离散化。这很像由“随机过程”到“时间序列”的变化方式。

上世纪60年代恰好是电子计算机问世的时代。复杂的计算如果可以被以一种离散化的方式描述,就可以通过电子计算机来解决。基于矩阵运算的线性代数在这个过程中发挥了重要的作用。比如,以马尔可夫过程为模型的预测,其实是落实到转移矩阵的运算上。同理,基于旋转异构态假设对真实链进行离散化描述后,有望通过计算机,给定化学式,预测出链统计结果——这将进一步用于预测聚合物材料的许多性质。这无疑是令人兴奋的。但是作为一门科学,这一假设是否符合实际,需要实验验证。而实验的可验证性理论,是任何一项理论工作的“另外50%努力”。Volkenstein原书总结了大量可能用于验证这一理论的实验方法——包括偶极矩测量、光散射、Kerr效应等。但是这些实验方法与旋转异构态假设正确性的联系,依然藏在复杂而间接的数量关系以及更多实验假定(比如valence-optical scheme)之下。

从今天的角度看,高分子物理理论的发展与液体物理的发展若不能说是同时的,则前者甚至超前于后者。因此,成功的高分子物理学家,免不了要在液体物理问题上有先锋式的正确认识。这在Flory的Principles in Polymer Chemistry一书中是有所体现的。例如在溶液热力学的格子统计部分,Flory“啰嗦”了一段话(p. 497 sec. 1a的第2自然段),实际上道出了液体的径向分布函数概念!反之,Volkenstein的原书,反映了前苏联科学家在Валентин Алексеевич Каргин(V. A. Kargin)关于液态的落后认识的影响。在Kargin当领导的期间,这些观点是用来对抗来自美国同行的不同观点的。Илья́ Миха́йлович Ли́фшиц(I. M. Lifshitz)的更加正确的高分子物理观点(1968年)被推迟到斯大林时代之后才为人所知[1]。因此,今天再想了解这部分内容,应该直接看Flory的著作。Flory的著作包括了他本人和后期的几个同事和学生:J. Mark、A. Abe、R. Jernigan、A. Tonelli的后续工作;他们发表了同一物理量的理论计算和实验测量结果比较,十分完美的印证了Volkenstein链统计理论的成功,比如以下著名插图。

用Monte Carlo模拟生成的立体异构无规链特征比,与理论计算特征比的比较图

References

  1. A.Y. Grosberg, and A.R. Khokhlov, "After-Action of the Ideas of I.M. Lifshitz in Polymer and Biopolymer Physics", Advances in Polymer Science, pp. 189-210, . http://dx.doi.org/10.1007/12_055