Tag Archives: science history

中国和英国统计力学家在高分子溶液热力学的贡献

我们都知道Flory–Huggins溶液理论中的混合熵，就是把理想溶液的混合熵表达式中的摩尔分数改成了体积分数。以二元液态混合物为例，
$$\Delta_\text{mix}G^\text{id}=-T\Delta_\text{mix}S^\text{id}=RT\left[n_1\ln x_1+n_2\ln x_2\right]$$
而Flory–Huggins理论给出的小分子溶剂+线形高聚物溶质的结果是：
$$\Delta_\text{mix}S=-R\left[n_1\ln\varphi_1+n_2\ln\varphi_2\right]$$
以上讨论都假定$\Delta_\text{mix}H=0$，或者限于格子模型来说就是不同构形的内能相同。这被称为无热（athermal）溶液（是因为焓历史上被称为“heat”，其实这跟热容或熵不直接相关，反而是相互作用势能的体现）。如果按照惯例用相同条件下的理想混合物作为标准态，那么Flory–Huggins的结果体现的结论就是，仅因分子体积不同，也会制造出非零的超额混合自由能，且这个超额混合自由能是纯熵变。

早期认为，分子体积不同，是要通过它们造成了相互作用势的不对称，即非零的交换能$w\equiv w_{AB}-\left(1\middle/2\right)\left(w_{AA}+w_{BB}\right)$，毕竟分子大小首先就影响色散力。到了大概1930年中叶（在1936年的法拉第学会第65次一般讨论中），大家才接受不同分子尺寸的无热混合物有超额熵。R. Fowler提出大一点的分子可以考虑占两个格子。他和G. Rushbrook发表的这种计算结果[1]证实了这件事。仅仅作出这一小步的推广，数学推导的难度就大增。原文只讨论了$N_1\ll N_2$或$N_1\gg N_2$的情况。H. Bethe提出了一种方法[2]，现在称为Bethe–Peierls近似，可以方便地考虑二体相关性下的构形数，即可得到概率$p_{ij},\quad i,j=A,B$。这个方法迅速被张宗燧和A. Miller等用于考虑大分子溶质的格子模型，从二聚体、三聚体一直推广到一般的$r$聚体[3][4][5][6]。这两个人靠Bethe方法写下构形数，得到无热溶液的混合熵变部分。W. Orr进一步把Bethe近似下的混合焓也写出来了[7][8]。E. Guggenheim用另一种更优雅的方法，得出了跟用Bethe方法一样的结果，并证明两种方法是等价的。这些来自英国（和我国张宗燧在英国留学时）的贡献，基本系统性地终结了聚合物溶液热力学的格子理论工作。可以参考A. Miller和E. Guggenheim的两本书：

A. Miller (1948), The Theory of Solutions of High Polymers, Clarendon
E. Guggenheim (1952), Mixtures, Clarendon
也可以参考H. Tompa的书：
H. Tompa (1956), Polymer Solutions, Butterworths

这个H. Tompa也是值得一说的，但我可能要将在另一篇文章里讲。

我们今天所熟知的Flory–Huggins属于同时期美国人的工作。我之前的文章提到，是M. Huggins稍微比P. Flory早几个月开始推导高分子溶液的格子模型，似乎这种同时性是巧合，但其实Flory这个做法是受德国化学家K. Meyer的建议做的。K. Meyer和H. Mark合著了世界上第一本高分子科学的教科书。

值得强调的是，今天的Flory–Huggins形式，是Guggenheim一般形式中配位数$z\to\infty$的特殊结果，所以表达式中不显含$z$（交换熵变部分不含$z$，焓变对$z$的依赖性包在“相互作用参数” $\chi$ 的定义中了）。哪怕是限于导出Flory–Huggins的交换熵形式，也有不同的数格子方法。今天许多中文高分子物理教科书上的数法，就跟Flory在自己的书中的数法有点不同，但都用不同的近似主张凑出了相同的最后结果。其中一种写法需要说“假定 $z$ 与 $z-1$ 差别不大”。然而在3维空间中$z$的取值范围最高是12，一般考虑 $z$ 等于6到10。这样的取值怎么可能认为 $z$ 与 $z-1$ 差别不大？——除非取了$z\to\infty$ 极限。所以，其实一个严格的模型推导结果应该总是显含配位数的。Flory–Huggins这个不含配位数的更流行的形式仅仅是Guggenheim表达式的一个特殊性况。当然，分析表明，不同配位数的差别，在 $z=2,3,4$ 时十分巨大，但 $z>6$ 时差别比较小，那么Flory–Huggins的形式胜在简洁，所以这件事之后也就没人再追究了而已。

但是，一部分后来的人似乎认为配位数在物理上就不应该影响溶液热力学性质。这种看法不是来自物理直觉，而仅仅是Flory–Huggins模型长期教学误导。很多课堂讲解甚至教科书都会去强调这个结果中不含配位数这件事，好像本该如此。恰恰相反，物理直觉应该会告诉我们，配位数不同将严重影响热力学性质。从模型的角度，相同的溶剂（质）分子属性，仅配位数不同，对应于什么真实物理呢？它可能是分子的非球形或者分子的永久极性等影响堆砌的物理因素，而这当然是重要的热力学性质影响因素。

我曾经chair一个流变学会议的section，有一个演讲者介绍了他用格子模型来考虑过冷液体玻璃化转变的热力学理论。他直接使用的就是Flory–Huggins形式作理论预测，当然主要结果是通过MC计算机模拟来给出的。介绍完之后，场下没有人提问（可能话题太深了），于是我负责提了个问题，就是配位数在这里面起到什么作用。因为我当时的物理直觉告诉我，配位数就是堆砌情况，而这将在玻璃化转变中产生非常重要的影响。他用格子蒙特卡洛方法做，可以换不同的配位数来看。但是这个演讲者似乎觉得我的问题是不了解基本常识，具体就是“配位数仅仅是格子模型引入的概念，理应没有物理效应”这个“常识”。当然，这可能是我过度解读，实际上他只作了很隐晦的回复。

张宗燧的工作，后来被杨振宁和李荫远继续[9]。杨振宁还在论文的脚注强调了王竹溪的贡献[10]。诚然，“我对统计物理的兴趣即是受了竹溪师的影响。”（见：这里和这里）。只不过杨和李的工作更面向固溶体，而张宗燧和王竹溪作为Fowler的学生，则跟Fowler做溶液的动机更接近些。

张宗燧在文革期间不忍无尽的斗争和折磨，于1969年服安眠药自杀（见这里）。

References

R.H. Fowler, and G.S. Rushbrooke, "An attempt to extend the statistical theory of perfect solutions", Transactions of the Faraday Society, vol. 33, pp. 1272, 1937. http://dx.doi.org/10.1039/TF9373301272
"Statistical theory of superlattices", Proceedings of the Royal Society of London. Series A - Mathematical and Physical Sciences, vol. 150, pp. 552-575, 1935. http://dx.doi.org/10.1098/rspa.1935.0122
"Statistical theory of the adsorption of double molecules", Proceedings of the Royal Society of London. Series A. Mathematical and Physical Sciences, vol. 169, pp. 512-531, 1939. http://dx.doi.org/10.1098/rspa.1939.0014
T.S. Chang, "The number of configurations in an assembly and cooperative phenomena", Mathematical Proceedings of the Cambridge Philosophical Society, vol. 35, pp. 265-292, 1939. http://dx.doi.org/10.1017/S030500410002096X
A.R. Miller, "The number of configurations of a cooperative assembly", Mathematical Proceedings of the Cambridge Philosophical Society, vol. 38, pp. 109-124, 1942. http://dx.doi.org/10.1017/S030500410002226X
A.R. Miller, "The Vapour-Pressure Equations of Solutions and the Osmotic Pressure of Rubber", Mathematical Proceedings of the Cambridge Philosophical Society, vol. 39, pp. 54-67, 1943. http://dx.doi.org/10.1017/S0305004100017680
W.J.C. Orr, "On the calculation of certain higher-order Bethe approximations", Transactions of the Faraday Society, vol. 40, pp. 306, 1944. http://dx.doi.org/10.1039/TF9444000306
W.J.C. Orr, "The free energies of solutions of single and multiple molecules", Transactions of the Faraday Society, vol. 40, pp. 320, 1944. http://dx.doi.org/10.1039/TF9444000320
. C. N. Yang, . Y. Y. Li, and . , "GENERAL THEORY OF THE QUASI-GHEMICAL METHOD IN THE STATISTICAL THEORY OF SUPERLATTIGES", Acta Physica Sinica, vol. 7, pp. 59, 1947. http://dx.doi.org/10.7498/aps.7.59
C.N. Yang, "A Generalization of the Quasi-Chemical Method in the Statistical Theory of Superlattices", The Journal of Chemical Physics, vol. 13, pp. 66-76, 1945. http://dx.doi.org/10.1063/1.1724001

P. Flory自述对M. Huggins工作的首次关注

聚合物溶液的Flory–Huggins理论是高分子物理经典理论体系中的基石。它哪怕十分不准确，也被当作“标准模型”，作为更真实理论的参照。之所以使用这两个名字，是因为这两个人几乎同时做了同样的工作。更准确地说，是Maurice L. Huggins先做的。从发表的时间来看，Huggins发表于1941年5月[1]，Flory发表于同年8月[2]，并且已经引用了Huggins的工作了。实际上这两篇论文都提到了，在同年的6月份的一个会议——Wilder D. Bancroft Colloid Symposium上，Huggins报告了他的工作。多年之后的1985年，Flory的后一篇1942年的论文[3]被美国科学信息研究所（Institutide of Scientific Information，ISI）的期刊Current Contents选为“本周经典引用”（1985年5月6日，第18期），这个栏目会邀请论文作者写点故事。Flory在这里亲自回忆了他在Wilder D. Bancroft Colloid Symposium首次得知Huggins做了跟他重复的工作的很多细节。Huggins是Lewis的学生，是Flory的前辈。以下是Flory回忆的一段原文的中文译文。

我们的研究是独立进行的。我第一次了解到Huggins的工作，是在1941年6月于康奈尔大学举行的胶体研讨会上，当时他展示了他的研究成果。在那次研讨会上，我发表了一篇关于非线形聚合物凝胶化和网络形成理论的论文，这个主题与上述内容无关，但像它一样，也获得了广泛的认可。从Huggins的演讲中，我惊讶地得知他所进行的工作与我当时正准备发表的关于聚合物溶液热力学的研究非常相似。演讲结束后，我走近他，指出我也在进行类似的研究。他非常和蔼，鼓励我这个当时还只是个无名小卒的人发表我的工作，并与他交流。这是我们的第一次会面，也开启了我们一生的友谊。后来，我们就各种主题和发展进行了许多科学讨论,虽然并不总是完全一致，但总是相互尊重，关系融洽。正如我常说的，以我们名字命名的这个理论，我们的名字顺序应该颠倒过来，因为他的第一篇论文比我的早了一两个月。他最初的贡献更详细地阐述了晶格理论，而我的可能在某些方面更全面。

References

M.L. Huggins, "Solutions of Long Chain Compounds", The Journal of Chemical Physics, vol. 9, pp. 440-440, 1941. http://dx.doi.org/10.1063/1.1750930
P.J. Flory, "Thermodynamics of High Polymer Solutions", The Journal of Chemical Physics, vol. 9, pp. 660-660, 1941. http://dx.doi.org/10.1063/1.1750971
P.J. Flory, "Thermodynamics of High Polymer Solutions", The Journal of Chemical Physics, vol. 10, pp. 51-61, 1942. http://dx.doi.org/10.1063/1.1723621

传统教学内容数学语言的近世化

[latexpage]

很多经典物理范畴的小题，可能19世纪末的人勉强懂做，20世纪初或者中叶的人也懂做，很难说需要用到什么近世物理学成果，但是今天的人做这些题目所使用的数学语言照样是十分近世化的。这也许是理论物理的非经典部分在二十世纪碰到的难题所催生的数学语言革新照进了经典物理领域的一种效应。经典范围由于数学语言和思想的近世化，在二十世纪也诞生出很多新物理，所以也不能说这是“杀鸡用牛刀”，但当然也免不了很多没经过“奥卡姆剃刀”修剪的边边角角。充斥于大量令人摸不着头脑的“高观点本科讲义”中。

经典物理知识很早就已经是大学本科教学的常驻内容。只不过，就算这些内容的数学语言或体系形式在二十世纪已经“近世化”了不止一轮了，但本科教学所采取的数学语言和体系很可能仍然是19世纪的。在中国的普通高校尤为如此。但凡我们听说，哪所大学哪个系的哪门课讲义，胆敢从某种近世数学的较高观点去讲某门经典课，都会引起同行们“很update、很赶得上潮流、很不过时”的评价，同时引起学生“很地狱”的评价。因为本科普通数学教学本身迟迟没有完成近世化革命。而且越是进入到二十一世纪，越看不到这样的可能性。学生在数学课学的仍是19世纪的体系，因此也只能教用这个数学语言写就的物理版本。所有学生都免不了要在研究生阶段重新作近世化学习。这也使得一些近世物理成果，迟迟无法写进本科教产书当中，因为它们从一开始就用近世数学语言来write down的。

P. J. Flory在1951年的闻名著作 Principles of Polymer Chemistry 中显示出的热力学的统计力学方法，基本上还是这两个学科1950年之前的形态。当他离开康奈尔大学之后（1960s ~ 70s），无论是热力学还是统计力学的工作都吸收了这两个学科的近世化成果。但都只体现在他后来发表的论文当中。而再没有总结成一本像1951年这本书那样对学科本科教学影响深远的新书。现在的高分子物理本科教材，基本没有六、七十年代的东西，完全是Flory1951年这本书的复刻，甚至还丢失了Flory原书中很多充满物理洞见的叙述（因为译者看不懂）。

格子模型用于液体

虽然Kirkwood，Onsager的工作可以追溯到30年代，但这些工作无论是对非平衡的热力学/统计力学，还是对液体物理的影响，都要到60年代左右才被公认。而且Flory关心的问题也主要从平衡态切入。在这方面在50年代已经形成十分成熟的理论工具。其中热力学当时的表现形式就跟今天本科《物理化学》中的差不多。而统计力学的表现形式可以用Fowler & Guggenheim (1949), Statistical Thermodynamics, CUP来代表。这本书首印是1939年，1949年有一个修订版，之后就只有重印，没有新版。这本书在当时是十分流行的参考书。该书的一个特点是有好几个关注今天所谓的软凝聚态体系的应用章节——液体纯物质和混合物和界面问题。至少，液体的长程无序特点以“径向分布函数”这种图像已被熟知。

Flory原书在刚一抛出“格子模型”的时候，就插入了一段评述：

The molecules in the pure liquids and in their solution are considered to be arranged with enough regularity to justify approximate representation by a lattice, as is indicated schematically in Fig. 109. In a simple liquid consisting of nearly spherical molecules, the first neighbors of a given molecule in the liquid will occur at a distance from its center which is fairly well defined, although not as precisely as in a crystal. The tier of second neighbors will occur at less accurately specified distances, and so forth. Since we shall be concerned only with the first coordination sphere about a given molecule (or polymer segment, see below), the rapid deterioration of the lattice as a valid representation with increasing distance from the reference point is unimportant. The adoption of a lattice scheme is not in itself, therefore, a necessarily hazardous idealization. The succeeding postulate, namely, that the same lattice may be used to describe the configurations of both pure components and of the solution, is a much more serious one from the standpoint of application to real solution. It requires (among other things) that the geometry of the two molecular species be virtually identical.

这段解释，是面向当时就已经熟知的液体的长程无序性，解释为什么一个格子模型仍然是对液体的一种足够的近似：它仅适用于仅存在短程相互作用的情况。

使用格子模型来描述溶液，不是Flory或Huggins首先做的，而应该是更早的van Laar和Hilderbrand的做法，是1920s时候的事情。后者采用格子模型来描述溶液，也跟固体物理中的Lenz–Ising模型纯属巧合。但是，在具体处理时的“平均场假定”则是明显与固体物理相通的。Bragg–Williams近似被Fowler和Bethe立刻用于液体的统计当中，这是1930s年的事情。这些都已见于Fowler & Guggenheim (1949)那本书里，因此到Flory做聚合物溶液热力学的时候是为人所熟知的。但唯独Flory在写1951年的书的时候，注意对格子模型的简化带来的问题作预见性的批判。

学会作这种预见性的批判，才是教给学生如何独立建模解决新理论问题的素质。现在的教科书重点似乎放在让学生学懂旧理论讲什么，而不是学懂旧理论当时是怎么想的。这就是“高分子专业教不出高分子理论研究者”的原因。

我在给学生讲这部分内容的时候，先给学生介绍了液体的分子图像，以及分子间相互作用势的计算任务的截断简化（类似分子动力学的一些知识），为此突出了两种常见相互作用势——范德华势和静电势。它们的差别就在于截断距离。范德华势不到一个分子大小之后就可以截断了，而静电势大概作用距离到7个分子大小。当大家对这个简单结论了然于心之后，再了解格子模型只考虑相邻两分子之间的作用势时，就可以直接明确——我们的理论不适用于电解质溶液。我想这是溶液热力学这一章内容的一个最有价值的take home message。

橡胶弹性的超弹性模型

50年代的固体力学和流体力学也基本习惯直接写出坐标的描述方法。理性力学家对连续介质力学的公理化建设，到1960年才造成比较广泛的影响（以Truesdell & Toupin的Classical Field Theory为标志）。由于统一采用集合映射语言，所以坐标无关的向量空间和算符的语言变得更重要，因为它们能够道出物理定律的客观性。当然，这对具体力学问题没有根本性的影响，但重塑了数学语言和概念。比如，旧的形变的描述常常从拉伸比$\lambda_i$出发，但新的描述常考虑形变梯度张量$\mathbf{F}$、柯西-格林应变张量$\mathbf{C}$及其主不变量。另一方面，超弹性理论的一般化，是Rivlin在1950年代开始推进的。超弹性这个词也是Truesdell不可逆热力学的基本框架，也是de Groot在1950年代总结的。这两者与连续介质力学的张量化语言的合流，才形成今天我们教科书所展示的有限弹性的不可逆热力学基础。这些都应该要到60年代之后了。例如，各向同性函数的表示定理的证明是Gurtin在1974做的。

Flory在1951年的书出版之前，就已经确立了$G\left(I-3-\ln J\right)$的应变能形式。虽然Flory的橡胶弹性理论是分子理论，与力学研究不可混为一谈，但毕竟终需应用于解力学问题，跟使用现象学力学模型同样需要面对具体形变问题的计算。Flory在这些工作中表现出来的数学工具是传统的以标量为中心、依赖坐标的传统微积分语言。这跟上一段介绍的历史进程相比，是可以理解的。

进入60年代，离开康奈尔大学后，Flory的发表的工作体现出明显的数学语言的近世化。

60年代“旋转异构态”理论开始流行（其背景是一维Ising模型的灵感以及电子计算机的问世，详见本博客的上一篇文章），用到大量高阶的矩阵代数（其实仍然是抽象代数的显坐标形式）。Flory与同事的工作，总结在1969年出版的Statistical Mechanics of Chain Molecules一书中。书的前言特别强调矩阵直积（克劳内克积）运算少见于当时的科书中，而这在今天即是算符间的张量积的一种坐标表示。

60年代Flory和同事的另一方面工作是橡胶弹性问题的一些后续研究。在当时橡胶力学模型无论是现象学的超弹性模型还是第一原理性的网络统计，都在溶胀态的热机械行为中显示出不足。其中一个具体的现象溶胀网络力学响应中的少量的内能贡献。当时笃信的是力学主要由网络贡献，因此这个内能贡献也应该是网络形变的效应，从而急于修改纯熵弹性基础的橡胶网络模型。Flory当时强调，实际实验是在恒温恒压条件下做的，用相同的方法求得的是焓贡献而非内能贡献，其中相差的是材料的体积压缩性。虽然这一因素并非当时争论的唯一焦点，但明确这个体积压缩性，实验上并非易事，必须求助于既有理论，因而涉及到橡胶弹性理论的可压缩性。

在1961年的这篇论文[1]当中，Flory具体讨论了可压缩性的问题，他把超出之前的应变能形式预测的额外可压缩性归到一个新的自由能项中，解释为普适于所有液体的一般分子间力。这篇文章完全使用了连续介质力学的非坐标表示，只不过所使用的字母跟今天的惯例不一样。而且他用到了应力与自由能的关系——这在今天常通过不可逆热力学的基本不等式加上Coleman–Noll procedure得到，在当时则按照实际等价的“虚功原理”得到。这虽然在物理上与Treloar时代的$F=\partial A/\partial L$没什么不同，但连续介质力学的一般严格证明在1960年若不说是新的，至少也是高阶的。Flory在当时可能的参考书是F. Murnaghan (1951), Finite Deformation Of An Elastic Solid, Wiley。但就算这本书也仍是用矩阵语言的。

题外话：Flory在这篇1961年的论文给连续介质力学界作出了至仍归到他名下的贡献，那就是主张把形变分解成纯等容（isochoric）和纯膨胀（volumetric）：$\mathbf{F}=\mathbf{F}_\text{vol}\mathbf{F}_\text{isoc}$。这在今天被称为“轻微可压缩”（slightly compressible）或“近不可压缩”（nearly incompressible）问题下的假定。事实上，从Rivlin早期的工作一开始就注意到，并非所有不可压缩形变都是可控的。但一直到Ericksen在1960年代才数学上严格地列举了几种不可压缩体的可控形变。所以，如果一个材料实际发生了可压缩形变，那么把从它的总形变中分出一个等容形变来，似乎它能单独发生，就常常会违反物理实际；或者说这种分解造成了一个不真实的“中间状态”。因此只有当体积变化小到好像“微扰”那般时，才可近似采用这种分解来分析。但无论如何，这个分解已经被称为“弗洛里分解”（Flory decomposition）了。

尽管在60年代之后，Flory逐渐扮演一种“领军”角色，只负责提出想法，由很多有才能的后辈帮他做具体的理论和实验工作，但实际上他对这些新工作采用的新数学方法十分熟悉，甚至仍然比这些后辈或学生更熟悉。今天我们对Flory和他的共事者在60年代之后的贡献的认知多来自他们共同署名的论文，但少数Flory单独署名的论文反而更加突出地体现了他本人的理论认识深度和与时俱进。

References

P.J. Flory, "Thermodynamic relations for high elastic materials", Transactions of the Faraday Society, vol. 57, pp. 829, 1961. http://dx.doi.org/10.1039/TF9615700829

万物皆流

Anything goes

Tag Archives: science history

中国和英国统计力学家在高分子溶液热力学的贡献

References

P. Flory自述对M. Huggins工作的首次关注

References

传统教学内容数学语言的近世化

格子模型用于液体

橡胶弹性的超弹性模型

References