Category Archives: 关于科研的文章

传统教学内容数学语言的近世化

[latexpage]

很多经典物理范畴的小题,可能19世纪末的人勉强懂做,20世纪初或者中叶的人也懂做,很难说需要用到什么近世物理学成果,但是今天的人做这些题目所使用的数学语言照样是十分近世化的。这也许是理论物理的非经典部分在二十世纪碰到的难题所催生的数学语言革新照进了经典物理领域的一种效应。经典范围由于数学语言和思想的近世化,在二十世纪也诞生出很多新物理,所以也不能说这是“杀鸡用牛刀”,但当然也免不了很多没经过“奥卡姆剃刀”修剪的边边角角。充斥于大量令人摸不着头脑的“高观点本科讲义”中。

经典物理知识很早就已经是大学本科教学的常驻内容。只不过,就算这些内容的数学语言或体系形式在二十世纪已经“近世化”了不止一轮了,但本科教学所采取的数学语言和体系很可能仍然是19世纪的。在中国的普通高校尤为如此。但凡我们听说,哪所大学哪个系的哪门课讲义,胆敢从某种近世数学的较高观点去讲某门经典课,都会引起同行们“很update、很赶得上潮流、很不过时”的评价,同时引起学生“很地狱”的评价。因为本科普通数学教学本身迟迟没有完成近世化革命。而且越是进入到二十一世纪,越看不到这样的可能性。学生在数学课学的仍是19世纪的体系,因此也只能教用这个数学语言写就的物理版本。所有学生都免不了要在研究生阶段重新作近世化学习。这也使得一些近世物理成果,迟迟无法写进本科教产书当中,因为它们从一开始就用近世数学语言来write down的。

P. J. Flory在1951年的闻名著作 Principles of Polymer Chemistry 中显示出的热力学的统计力学方法,基本上还是这两个学科1950年之前的形态。当他离开康奈尔大学之后(1960s ~ 70s),无论是热力学还是统计力学的工作都吸收了这两个学科的近世化成果。但都只体现在他后来发表的论文当中。而再没有总结成一本像1951年这本书那样对学科本科教学影响深远的新书。现在的高分子物理本科教材,基本没有六、七十年代的东西,完全是Flory1951年这本书的复刻,甚至还丢失了Flory原书中很多充满物理洞见的叙述(因为译者看不懂)。

格子模型用于液体

虽然Kirkwood,Onsager的工作可以追溯到30年代,但这些工作无论是对非平衡的热力学/统计力学,还是对液体物理的影响,都要到60年代左右才被公认。而且Flory关心的问题也主要从平衡态切入。在这方面在50年代已经形成十分成熟的理论工具。其中热力学当时的表现形式就跟今天本科《物理化学》中的差不多。而统计力学的表现形式可以用Fowler & Guggenheim (1949), Statistical Thermodynamics, CUP来代表。这本书首印是1939年,1949年有一个修订版,之后就只有重印,没有新版。这本书在当时是十分流行的参考书。该书的一个特点是有好几个关注今天所谓的软凝聚态体系的应用章节——液体纯物质和混合物和界面问题。至少,液体的长程无序特点以“径向分布函数”这种图像已被熟知。

Flory原书在刚一抛出“格子模型”的时候,就插入了一段评述:

The molecules in the pure liquids and in their solution are considered to be arranged with enough regularity to justify approximate representation by a lattice, as is indicated schematically in Fig. 109. In a simple liquid consisting of nearly spherical molecules, the first neighbors of a given molecule in the liquid will occur at a distance from its center which is fairly well defined, although not as precisely as in a crystal. The tier of second neighbors will occur at less accurately specified distances, and so forth. Since we shall be concerned only with the first coordination sphere about a given molecule (or polymer segment, see below), the rapid deterioration of the lattice as a valid representation with increasing distance from the reference point is unimportant. The adoption of a lattice scheme is not in itself, therefore, a necessarily hazardous idealization. The succeeding postulate, namely, that the same lattice may be used to describe the configurations of both pure components and of the solution, is a much more serious one from the standpoint of application to real solution. It requires (among other things) that the geometry of the two molecular species be virtually identical.

这段解释,是面向当时就已经熟知的液体的长程无序性,解释为什么一个格子模型仍然是对液体的一种足够的近似:它仅适用于仅存在短程相互作用的情况。

使用格子模型来描述溶液,不是Flory或Huggins首先做的,而应该是更早的van Laar和Hilderbrand的做法,是1920s时候的事情。后者采用格子模型来描述溶液,也跟固体物理中的Lenz–Ising模型纯属巧合。但是,在具体处理时的“平均场假定”则是明显与固体物理相通的。Bragg–Williams近似被Fowler和Bethe立刻用于液体的统计当中,这是1930s年的事情。这些都已见于Fowler & Guggenheim (1949)那本书里,因此到Flory做聚合物溶液热力学的时候是为人所熟知的。但唯独Flory在写1951年的书的时候,注意对格子模型的简化带来的问题作预见性的批判。

学会作这种预见性的批判,才是教给学生如何独立建模解决新理论问题的素质。现在的教科书重点似乎放在让学生学懂旧理论讲什么,而不是学懂旧理论当时是怎么想的。这就是“高分子专业教不出高分子理论研究者”的原因。

我在给学生讲这部分内容的时候,先给学生介绍了液体的分子图像,以及分子间相互作用势的计算任务的截断简化(类似分子动力学的一些知识),为此突出了两种常见相互作用势——范德华势和静电势。它们的差别就在于截断距离。范德华势不到一个分子大小之后就可以截断了,而静电势大概作用距离到7个分子大小。当大家对这个简单结论了然于心之后,再了解格子模型只考虑相邻两分子之间的作用势时,就可以直接明确——我们的理论不适用于电解质溶液。我想这是溶液热力学这一章内容的一个最有价值的take home message。

橡胶弹性的超弹性模型

50年代的固体力学和流体力学也基本习惯直接写出坐标的描述方法。理性力学家对连续介质力学的公理化建设,到1960年才造成比较广泛的影响(以Truesdell & Toupin的Classical Field Theory为标志)。由于统一采用集合映射语言,所以坐标无关的向量空间和算符的语言变得更重要,因为它们能够道出物理定律的客观性。当然,这对具体力学问题没有根本性的影响,但重塑了数学语言和概念。比如,旧的形变的描述常常从拉伸比$\lambda_i$出发,但新的描述常考虑形变梯度张量$\mathbf{F}$、柯西-格林应变张量$\mathbf{C}$及其主不变量。另一方面,超弹性理论的一般化,是Rivlin在1950年代开始推进的。超弹性这个词也是Truesdell不可逆热力学的基本框架,也是de Groot在1950年代总结的。这两者与连续介质力学的张量化语言的合流,才形成今天我们教科书所展示的有限弹性的不可逆热力学基础。这些都应该要到60年代之后了。例如,各向同性函数的表示定理的证明是Gurtin在1974做的。

Flory在1951年的书出版之前,就已经确立了$G\left(I-3-\ln J\right)$的应变能形式。虽然Flory的橡胶弹性理论是分子理论,与力学研究不可混为一谈,但毕竟终需应用于解力学问题,跟使用现象学力学模型同样需要面对具体形变问题的计算。Flory在这些工作中表现出来的数学工具是传统的以标量为中心、依赖坐标的传统微积分语言。这跟上一段介绍的历史进程相比,是可以理解的。

进入60年代,离开康奈尔大学后,Flory的发表的工作体现出明显的数学语言的近世化。

60年代“旋转异构态”理论开始流行(其背景是一维Ising模型的灵感以及电子计算机的问世,详见本博客的上一篇文章),用到大量高阶的矩阵代数(其实仍然是抽象代数的显坐标形式)。Flory与同事的工作,总结在1969年出版的Statistical Mechanics of Chain Molecules一书中。书的前言特别强调矩阵直积(克劳内克积)运算少见于当时的科书中,而这在今天即是算符间的张量积的一种坐标表示。

60年代Flory和同事的另一方面工作是橡胶弹性问题的一些后续研究。在当时橡胶力学模型无论是现象学的超弹性模型还是第一原理性的网络统计,都在溶胀态的热机械行为中显示出不足。其中一个具体的现象溶胀网络力学响应中的少量的内能贡献。当时笃信的是力学主要由网络贡献,因此这个内能贡献也应该是网络形变的效应,从而急于修改纯熵弹性基础的橡胶网络模型。Flory当时强调,实际实验是在恒温恒压条件下做的,用相同的方法求得的是焓贡献而非内能贡献,其中相差的是材料的体积压缩性。虽然这一因素并非当时争论的唯一焦点,但明确这个体积压缩性,实验上并非易事,必须求助于既有理论,因而涉及到橡胶弹性理论的可压缩性。

在1961年的这篇论文[1]当中,Flory具体讨论了可压缩性的问题,他把超出之前的应变能形式预测的额外可压缩性归到一个新的自由能项中,解释为普适于所有液体的一般分子间力。这篇文章完全使用了连续介质力学的非坐标表示,只不过所使用的字母跟今天的惯例不一样。而且他用到了应力与自由能的关系——这在今天常通过不可逆热力学的基本不等式加上Coleman–Noll procedure得到,在当时则按照实际等价的“虚功原理”得到。这虽然在物理上与Treloar时代的$F=\partial A/\partial L$没什么不同,但连续介质力学的一般严格证明在1960年若不说是新的,至少也是高阶的。Flory在当时可能的参考书是F. Murnaghan (1951), Finite Deformation Of An Elastic Solid, Wiley。但就算这本书也仍是用矩阵语言的。

题外话:Flory在这篇1961年的论文给连续介质力学界作出了至仍归到他名下的贡献,那就是主张把形变分解成纯等容(isochoric)和纯膨胀(volumetric):$\mathbf{F}=\mathbf{F}_\text{vol}\mathbf{F}_\text{isoc}$。这在今天被称为“轻微可压缩”(slightly compressible)或“近不可压缩”(nearly incompressible)问题下的假定。事实上,从Rivlin早期的工作一开始就注意到,并非所有不可压缩形变都是可控的。但一直到Ericksen在1960年代才数学上严格地列举了几种不可压缩体的可控形变。所以,如果一个材料实际发生了可压缩形变,那么把从它的总形变中分出一个等容形变来,似乎它能单独发生,就常常会违反物理实际;或者说这种分解造成了一个不真实的“中间状态”。因此只有当体积变化小到好像“微扰”那般时,才可近似采用这种分解来分析。但无论如何,这个分解已经被称为“弗洛里分解”(Flory decomposition)了。

尽管在60年代之后,Flory逐渐扮演一种“领军”角色,只负责提出想法,由很多有才能的后辈帮他做具体的理论和实验工作,但实际上他对这些新工作采用的新数学方法十分熟悉,甚至仍然比这些后辈或学生更熟悉。今天我们对Flory和他的共事者在60年代之后的贡献的认知多来自他们共同署名的论文,但少数Flory单独署名的论文反而更加突出地体现了他本人的理论认识深度和与时俱进。

References

  1. P.J. Flory, "Thermodynamic relations for high elastic materials", Transactions of the Faraday Society, vol. 57, pp. 829, 1961. http://dx.doi.org/10.1039/TF9615700829

Flory的“另一本书”

某校《高分子物理》课期末考试的“英文名词解释”题中,考到“rotational isomeric state”(旋转异构态)这个术语。我感到很困惑。因为这个术语是比较深的。我们所采用的本科高分子物理教材,根本没有涉及到这个概念。这个概念甚至没有出现在P. J. Flory的“那本书”——Principles of Polymer Chemistry中(出版于1953年),因为这个概念是由Михаи́л Влади́мирович Волькенште́йн(M. V. Volkenstein)在1959年发表的著作Конфигурационная статистика полимерных цепей(聚合物链的构象统计)中正式提出的。1963年,该书的英文翻译在美国出版,P. J. Flory在序中高度赞赏了该著作。后者的“另一本书”——Statistical Mechanics of Chain Molecules也于1969年出版,使得旋转异构态——计算真实聚合物链统计性质的一种近似思想——得到更加为人所知(尽管这本书仍然是少有人阅读的)。

M. Volkenstein原著封面

旋转异构态假设,使得描述真实链的化学键节复杂性——例如不对称以及各自不独立的键节旋转势能曲线——有了可写下的统一数学形式。从今天的角度看,这一假设造成的好处是数学描述的离散化。这很像由“随机过程”到“时间序列”的变化方式。

上世纪60年代恰好是电子计算机问世的时代。复杂的计算如果可以被以一种离散化的方式描述,就可以通过电子计算机来解决。基于矩阵运算的线性代数在这个过程中发挥了重要的作用。比如,以马尔可夫过程为模型的预测,其实是落实到转移矩阵的运算上。同理,基于旋转异构态假设对真实链进行离散化描述后,有望通过计算机,给定化学式,预测出链统计结果——这将进一步用于预测聚合物材料的许多性质。这无疑是令人兴奋的。但是作为一门科学,这一假设是否符合实际,需要实验验证。而实验的可验证性理论,是任何一项理论工作的“另外50%努力”。Volkenstein原书总结了大量可能用于验证这一理论的实验方法——包括偶极矩测量、光散射、Kerr效应等。但是这些实验方法与旋转异构态假设正确性的联系,依然藏在复杂而间接的数量关系以及更多实验假定(比如valence-optical scheme)之下。

从今天的角度看,高分子物理理论的发展与液体物理的发展若不能说是同时的,则前者甚至超前于后者。因此,成功的高分子物理学家,免不了要在液体物理问题上有先锋式的正确认识。这在Flory的Principles in Polymer Chemistry一书中是有所体现的。例如在溶液热力学的格子统计部分,Flory“啰嗦”了一段话(p. 497 sec. 1a的第2自然段),实际上道出了液体的径向分布函数概念!反之,Volkenstein的原书,反映了前苏联科学家在Валентин Алексеевич Каргин(V. A. Kargin)关于液态的落后认识的影响。在Kargin当领导的期间,这些观点是用来对抗来自美国同行的不同观点的。Илья́ Миха́йлович Ли́фшиц(I. M. Lifshitz)的更加正确的高分子物理观点(1968年)被推迟到斯大林时代之后才为人所知[1]。因此,今天再想了解这部分内容,应该直接看Flory的著作。Flory的著作包括了他本人和后期的几个同事和学生:J. Mark、A. Abe、R. Jernigan、A. Tonelli的后续工作;他们发表了同一物理量的理论计算和实验测量结果比较,十分完美的印证了Volkenstein链统计理论的成功,比如以下著名插图。

用Monte Carlo模拟生成的立体异构无规链特征比,与理论计算特征比的比较图

References

  1. A.Y. Grosberg, and A.R. Khokhlov, "After-Action of the Ideas of I.M. Lifshitz in Polymer and Biopolymer Physics", Advances in Polymer Science, pp. 189-210, . http://dx.doi.org/10.1007/12_055

“流变测角仪”

卡尔·魏森伯格(Karl Weissenberg)研制的流变仪,当时称为流变测角仪(rheogoniometer)。魏森伯格的流变仪常带着他的姓一齐表述为Weissenberg rheogoniometer,我见过报道的型号从R16一直到R19。魏森伯格的学术贡献以晶体学研究领域为主。在晶体测量学中,测角仪用于精确得知试样被旋转了多少角度,以便得知不同晶面之间的夹角。他的流变仪也用这个词,首先可能是要强调这是一台(以今天的术语)旋转流变仪(rotational rheometer)。

刚刚,我偶然找到一本魏森伯格的连续介质力学讲座讲义(DTIC AD0408493)。在这个1963年的讲义中,我们能够看到魏森伯格本人对使用goniometer这个词的思想阐述。在运动学(kinematics)的章节中,作者提到了,如何实现对运动学的测量,使用的是goniometry一词,并作了很详细的解释。但是原文所采用的术语体系,跟今天的连续介质力学惯用体系差别很大,因此是不太好读的。下面我把他的意思翻译成现在熟悉的术语体系。

如果你有连续介质力学基础的话,应该记得应变的定义是局域的。我们使用形变梯度张量来表示局域形变,这个张量其实是位移场的空间导数。我们确实需要把应变理解为位移场的空间变化,但在做法上,我们通过局域化描述,使得这件事可以线性化(忽略“高阶无穷小”),只讨论那个张量(导数)就足够了。但是,一般而言,这个张量仍然是空间位置的函数,除非我们形成一个“均匀的形变场”。魏森伯格在这里其实就是在强调,理论上只讨论均匀形变,以及实验上去实现均匀形变,有很大的益处。那就是,局域上的表征参数,可以代表整体。魏森伯格描述这件事时的语言,特别像在说“晶体只需要讨论晶胞结构,再通过点阵就能能代表整体”。此外,魏森伯格跟一般的力学家的空间想象是不同的;他似乎天然采用的是球坐标系来阐述。每当需要讨论一个空间微元dV时,他似乎都直接用立体角(solid angle)一词。这就是为什么,他提及空间关系时都从“角”出发,称运动学为“测角学”(goniometry)。测角学一词在魏森伯格那里主要指“(在均匀的前提下)只讨论一点局域就可以代表全局”的做法。同样的方法也适用于应力张量的讨论。因此魏森伯格在动力学(dynamics)的章节也用了“动力学的测角学”(goniometry of dynamics)的说法。

在这个讲义中,魏森伯格也亲自介绍了他发明的流变仪的思想,并称之为一种goniometric design。魏森伯格的流变仪原则,就是至今的流变测量学原则。其中,关于需要测量完整的三维信息(张量值测量)这件事,他形容为“要测量完整的立体角”。我想,按照他的说法,一个仪器能被称之为rheogoniometer,就必须“能测整个立体角”。

总结而言,魏森伯格本人提及goniometry时,大概强调了两个方面,一是三维空间的位置变化,局域上用导数表示(也就是张量);均匀场前提下,可以用这个局域特称代替全体。而一台goniometer,则需要做到形成均匀形变和应力场以及测量完整的张量分量。从今天的角度看,魏森伯格的流变仪原始设计的创新性就在于法向应力差效应(魏森伯格效应)的同时测量。如果由魏森伯格自己来说,他可能还会强调,这个流变仪不仅动力学测量上能说清到底测的是应力张量的什么分量,其运动学也是清楚的,能够校准为严格意义上的应变张量的剪切分量。而所有这些理论基础,都是一种goniometry。

在K. Walters的流变测量学经典著作Rheometry中,旋转流变仪章节标题也仍用rheogoniometer。这个著作的出版时期是1975年,魏森伯格的流变仪已经商用多年且为人所知了,配用的测量几何也都包括了常用的三种。在这一章节的开头,作者讨论了这个词在当时的使用现状。他说,虽然词典把这个词定义为既测应力张量的剪切分量,又测其法向应力差的流变仪,但这个词主要强调旋转流变仪。也许也是这本书的标题用了rheometry一词来表示一个更广的概念(即能测完整本构关系,但未必通过旋转运动学),使得流变仪(rheometer)一词站得更前、走得更远。在今天我们都通过在“流变仪”一词前面加限定语来描述不同的具体设计,也包括用“旋转流变仪”(rotational rheometer)一词替代了“流变测角仪”(rheogoniometer)了。