Category Archives: 我的研究笔记

流变测试数据的XML格式问题

1. 背景

在当今科技迅速发展的时代,数据的收集、分析及交换在科研和工业领域中扮演着至关重要的角色。然而,测量设备与电子表格程序(如Microsoft Excel、Sigmaplot或Origin)之间的数据交换过程,经常因为非标准文件格式的问题而变得复杂和低效。由于不同制造商生产的设备输出的数据文件格式各不相同,且有时所需的信息并未直接包含在数据文件中,研究人员和工程师经常需要通过手工操作来传输所有必要的数据,这无疑浪费了大量宝贵的时间和资源。此外,不同实验室之间的测量文件交换也面临着类似的问题,缺乏一个广泛接受的标准使得直接使用其他来源的文件成为一项挑战。

鉴于这些问题,有必要开发一种新的文件格式,以简化数据的交换过程,使研究人员能够专注于文件的内容而非其结构。这种新的文件格式不仅应适用于流变学和力学数据(这是委员会成员们主要关注的领域),也应广泛适用于如热分析、凝胶渗透色谱等其他类型的数据。

考虑到不同测量方法的规范要求和数据类型的多样性,采用固定的行列表格格式显然不是一个合适的解决方案。相反,XML(可扩展标记语言)格式在过去几年中逐渐受到更多关注,它提供了更大的灵活性和可能性。XML是在1996年由世界广泛网络联盟(W3C)下的一个工作组开发的,旨在成为一种通用的数据格式标准。值得一提的是,互联网上的标准HTML语言只是XML可能应用的众多例子中的一个,而且是一个极为成功的应用。XML的基本优势在于它的系统独立性和软件独立性,这意味着它不受特定操作系统或软件应用程序的限制。从Microsoft等公司在其新版Office程序中实现XML支持的事实中,我们可以看出XML对IT世界的深远影响。此外,市场上也存在许多免费工具,可以帮助用户创建或编辑XML文件,进一步提高了其实用性和普及率。

总之,通过采用XML作为数据交换的标准格式,我们可以极大地简化不同测量设备和电子表格程序之间的数据交换过程,从而节省时间、提高效率,并促进不同领域和实验室之间的协作。随着更多组织和个人认识到XML格式的优势,并开始采用这一标准,我们有理由相信,这将是科研和工业数据管理的一个重大进步。

2. 现状

关于制订流变学数据文件的XML规范的项目的信息,可见此网页。这里只列出一些值得注意的内容。

IUPAC最终的版本是2008年的,叫做RheoML。除此之外,TA公司的版本是随着TRIOS软件提供的。TRIOS软件同时支持这两个版本。在这个页面可以下载相关的XSD文件。其中,TRIOS提供的压缩包当中,RheoML.XSD是IUPAC的版本的schema定义文件,而Iupac-Schema.v3.xsd则是TRIOS软件版本的schema定义文件(其文件名有误导性)。TA公司之所以要再做一个自己的schema,表面上看是为了包括热分析测试,因为TA公司的热分析也用TRIOS软件。就算不讨论热分析,IUPAC版本的schema支持的测试模式也仍然很有限。比如,在旋转流变仪上采用更多不同形状的转子,或者进行轴向拉伸/压缩测试的情况,都尚未被IUPAC支持。无论哪种版本,目前的schema仍然很粗糙。从网页来看,这个项目早就停摆了。

3. 现实需求

然而,本人认为该议题依旧颇具深远意义。在平时的工作中,本人频繁接触来自其他实验室寻求流变测试咨询的情况,他们所使用的则是不同制造商生产的设备,搭载不同的软件系统。有时,本人必须详尽指出,除了数据之外,实验期间必须记录哪些额外条件,比如是否执行了种种校准、实验前的仪器平衡或是预剪切处理等。尽管如此,仍旧经常出现学生遗漏记录,或是本人未能详尽说明的情况,导致最终无法确切地确定并解决对方所遇到的问题。即使仅是数据的讨论,本人常常需要对方提供更多的物理量数据,但对于某些物理量是否支持导出,以及其在相应仪器软件中的称呼和相关设置的位置却常常一无所知。为了熟悉对方所用的仪器软件,本人通常需要亲自造访至少一次(有时甚至多次),仅有现场确认了以上问题之后,方能在随后的交流中对他们所提供的数据进行分析,并提供必要的协助。

而在制定流变数据XML标准化的过程中,将包含强制性规定导出所有必要的实验信息,此外会根据不同测试类型强制导出所有必需的物理量。只要此标准是由经验丰富的流变测量专家主导制定,效果预期将能消除以上提及的诸多不便。标准化的XML格式化文件所带来的益处,远不止此。

考虑到一个更加现实的案例。我个人经常为了教学目的编写一些数据分析程序供学生们使用。这些程序预设学生将完成特定设计的实验,并根据指定的要求导出相关的物理测量数据。因此,除了向学生提供已编写好的程序,我还需不断重申实验设计和数据导出的具体要求。若依据XML标准,确定性的测试模式将无疑导出特定的物理量,由此至少在一定程度上,我可以减少对学生的反复提醒,亦即减轻了编写用于读取文件后的错误处理机制的负担。

4. 倡议

当前仅有TA公司遵循XML标准的原则进行响应。本人渴望更多的流变仪制造商能参与进来,将XML格式的文件导出功能集成到其软件中。不限于流变仪,理应所有现代科学测量仪器的测量结果都能支持厂商间的标准化XML文件格式。必须认识到,仪器测试记录的信息远远超出数据本身之外。因此,仅有的通用数据文件格式(如CSV格式)并不能完全满足科学研究的全面需求。

分享一些书(3)

虽然我远没有看完Paul Richard Halmos(1916~2006)的所有数学教材,但我确实看了几本话题比较大众化的——因而同类教材也比较多的——从而在比较的基础上可以支撑我对Halmos的偏爱。所以我仍然能够直接说,我特别喜欢Halmos的数学书。

我看过他写的集合论、测度论、有限维向量空间和希尔伯特空间。这些书除了测度论之外都是很薄的。

至少我还不完整地看过他的自传——I want to be a mathematician。这个自传的开头就先明确地反醒了作者的人格特质,读来发现与我本人十分贴近,这足以支持我偏爱他的著作。这段话对其他读者来说也可以说明Halmos很可能是总能写出好教材的数学家。

I like words more than numbers, and I always did.

Then why, you might well ask, am I a mathematician? I don’t know. I can see some of the reasons in the story of my life, and I can see that chance played a role at least as big as choice; I’ll try to tell about all that as we go along. I do know that I wasn’t always sure what I wanted to be.

The sentence I began with explains the way I feel about a lot of things, and how I got that way. It implies, for instance, or in any event I men for it to imply that in mathematics I like the conceptual more than the computational. To me the definition of a group is far clearer and more important and more beautiful than the Cauchy integral formula. Is it unfair to compare a concept with a fact? Very well, to me the infinite differentiability of a once differentiable complex function is far superior in beauty and depth to the celebrated Campbell–Baker–Hausdorff formula about non-commutative exponentiation.

The beginning sentence includes also the statement that I like to understand mathematics, and to clarify it for myself and for the world, more even than to discover it. The joy of suddenly learning a former secret and the joy of suddenly discovering a hitherto unknown truth are the same to me—both have the flash of enlightenment, the almost incredibly enhanced vision, and the ecstacy and euphoria of released tension. At the same time, discovering a new truth, similar in subjective pleasure to understanding an old one, is in one way quite different. The difference is the pride, the feeling of victory, the almost malicious satisfaction that comes from being first. “First” implies that someone is second; to want to be first is asking to be “graded on the curve”. I seem to be saying, almost, that clarifying old mathematics is more moral than finding new, and that’s obviously silly—but let me say instead that insight is better without an accompanying gloat than with. Or am I just saying that I am better at polishing than at hunting and I like more what I can do better?

P. Halmos (1985), I want to be a mathematician, Springer

从我读过的所有Halmos著作来看,他不愧于自传的第一句话。我常常能折服于他行文的文笔。看他的书,经常只是廖廖数行简单的句子,某种思想就能钻进你的脑袋里。

因此我推荐,上述我所读过的他的书,为相关话题的书的首选、必读。

我读很多数学书都不做习题,或者有限地选做一些习题。但是Halmos的书不光是必须完成每道习题,而且他正文中的每句断言,凡是你不太清楚理由的,都值得简单证明一遍。所幸的是他的书都很薄。

非平衡统计力学的发展概况与基本内容

注:本文作者不是我,而是一本佚名讲义的第一节。我本人对这段文字的comment是,虽年代有点过时,但是非常accurate,在那个年代的中文资料中是罕见的。搁现在也是非常高质量的historical review + perspectives。希望有人能帮我找出,它的作者是谁。

非平衡统计力学的发展始于1872年。在这一年Boltzmann提出了现在以他的名字命名的方程——Boltzmann方程。Boltzmann方程是描述稀薄气体非平衡现象的重要方程。由它导出的H定理给热力学第二定律以统计解释。Boltzmann方程自其提出之日起就受到了物理学家和数学家的攻击,说它在力学系统中引入了概率的概念,因而不能被认为是真正的物理理论。由于引入了概率的概念,Boltzmann方程的一些基本结论就与力学确定论的描述绝然相反。在这些攻击中的两个主要的异议是Loschmidt反论(1876年)与Zermelo反论(1896年)。这两个反论指出:Hamilton系统是时间反演不变的,且具有Poincare循环,而Boltzmann方程破坏了时间反演不变性,其解是单调变化且趋向平衡的。尽管Boltzmann方程受到了众多的攻击,它仍在解释稀薄气体非平衡性质方面取得了极大的成功。同它导出的有关输运过程的结论,不但在定性上,而且在定量上都与实验一致。因此,非平衡态统计力学基本上沿着两个方向发展,一方面是Boltzmann方程及其他动力学方程的求解与应用;另一方面是Boltzmann方程及非平衡态统计力学基础的研究。

为了使他的方程有坚实的理论基础,Boltzmann曾求助于遍历性理论。在厢当长的一段时间内,对遍历性理论的研究主要是数学家的工作,这些研究推动了动力系统理论的发展。只是在七十年代和八十年代,由于计算机的广泛应用以及孤子理论和混沌理论的发展,才使物理学家们重新对这个问题感到兴趣。同时物理学家们发现数学家已经在这个领域取得了不少重要的进展,这些重要进展对统计物理可能具有根本的意义。

在论证他的方程的基础时,Boltzmann曾引进了“分子混沌”的统计假设。Ehrenfest(1911)为了把H定理推广到任意系统,对相空间的分布引入了粗粒密度的概念。这个概念后来在量子统计中被引伸为宏观观测与宏观算符的概念。我们知道宏观系统与微观系统的发展规律在时间的方向性上是绝然不同的。这个差别正是Boltzmann方程与力学方程的差别,也是非平衡统计力学与Hamiltonian力学的差别。因此,企图在力学理论的基础上建立非平衡统计力学,一定要引入某种统计假设,问题时如何作更少的和只作必定需要的符合实际情况的假设。宏观观测的概念和粗粒密度的假设是非平衡统计力学中基本的必要的假设。

非平衡态统计力学是联系微观运动规律和宏观运动规律的桥梁。在对非平衡现象的研究中发现,利用局部平衡分布及对局部平衡作微小偏离的线性输运过程就能对绝大部分的宏观现象作出很好的解释,这种描述称作流体力学描述。非平衡统计力学在这种描述中的主要任务是导出宏观方程与研究线性输运过程。

1931年,Onsager在微观可逆导致的细致平衡原理的基础上证明了线性输运系数之间的倒易关系。这个关系是非平衡热力学的基础。1951年,Callen–Welton提出的涨落-耗散定理则进一步把耗散过程的特性与平衡态的涨落联系起来。这方面的研究由于Kubo在1957年发展的线性输运动程理论而臻于完善。时至今日,我们知道在趋向平衡理论、多体问题的Green函数方法等工具的基础上,只要系统具有趋向平衡的性质,我们就可以如计算平衡态性质(实际上就是平衡态的涨落)那样计算线性不可逆过程。也就是说,线性不可逆过程的理论几乎是与平衡态理论同样地完善。在平衡态理论的基础上,考虑到系统趋向平衡的性质,不须引入新的统计假设,就能得到线性不可逆过程的全部结果。当然,当我们这样说时,如何判断一个系统是否会趋向平衡仍是一个大问题。不过这个问题也是平衡统计的基本问题。

在Boltzmann方程的基础方面,Боголю́бов(1946年)作出了重要的贡献。他把体系随时间的变化分成三个阶段或三个标度。在力学标度上,分布函数随时间有急避暑的变化,系统须要有多粒子的分布函数来描述;在动力学标度上,系统的分布函数迅速地开始“同步”化,这时多粒子分布函数可表示为单粒子分布函数的泛函,只有单粒子分布函数就能描述系统的行为;最后在流体力学标度上,则只需要分布函数的若干个矩就可以描述系统的行为,这些矩量与局部守恒量有关。现今,因Born和Green、Kirkwood及Yvon的共同贡献,及所得方程的级联形式,沿上述思路所得的方程就被称为BBGKY级联(hierarchy)。在BBGKY级联中也须作类似分子混沌的假设。Зубаре进一步(1961~1965)发挥了Боголю́бов的标度思想,在流体力学标度上提出了建立在局部守恒律基础上的适用于任意系统的非平衡统计算符。非平衡态统计算符在流体力学阶段的理论基础与适用性和Gibbs密度算符对平衡态的理论基础与适用性相同,它对高密度与强作用系统与具有普遍性。

关于多体系统趋向平衡的认真讨论始于Van Hove(1955)。他把系统能够趋于平衡归结于系统本身的性质,即系统的自由度趋向无穷(N\to\inftyV\to\inftyN/V=constant),且矩阵元具有(对中间态求和引起的)对角奇异性。对这样的系统只要作初态与终态的粗粒化,就能获得趋向平衡的结果。这方面的工作因Prigogine学派的长期工作与Zwanzig(1960、1964)引入的投影算符方法,而日趋完善。根据这些研究,Prigogine学派提出了耗散条件,满足耗散条件的系统能够趋向平衡。

60年代末期以来,由于激光、流体不稳定性、催化反应等的研究及Prigogine学派和Haken学派的倡导与工作,对宏观系统的非平衡相变(或突变)开展了全面的研究。非平衡相变发生于对平衡偏离的非线性区域,因此属于远离平衡的情况。在这种情况下,系统可能会通过自组织形成新的非平衡结构。因此,这个领域的研究对生命的本质和社会的演化也具有重要的意义。非平衡相变在许多地方类似于平衡相变。在相变点的邻域,由于旧模式将变成不稳定与新模式将要产生,临界涨落是生重要的。这是另一类很有意思的不同于近平衡区输运过程的非平衡统计物理问题。

60年代以来,随着多体问题中Green函数方法的发展,同时也形成了处理非平衡系统的Green函数方法。其中具有代表性的是Kadanoff–Baym的时间延拓法与Schrringer–Keldysh–周–苏–郝–于的闭路Green函数方法。这些方法不便于讨论趋向平衡这样的根本问题,但有利于在所需的任意近似程度内讨论各种实际问题。

整个故事到这里似乎应该结束了,科学的发展却表明情况远不是那么简单的。Fermi–Pasta–Ulam在1950年通过数值实验发现非线性晶格并不会表现出趋向平衡的现象。现在人们认为这是由于存在孤子解的缘故。数学家们发现的KAM(Kolmogorov–Arnold–Moser)定理也表明:对于弱的非简谐作用,振子系统的运动仍相似于简谐系统。Toda晶格的研究表明,甚至对某些特殊类型的强非线性作用,晶格系统也不会趋向平衡。但是这样的系统如用微扰来处理,显然具有对角奇异性,因而用van Hove–Prigogine理论来讨论,它一定会趋向平衡。孤子解的存在与KAM定理表明,van Hove–Prigogine理论只是提供了某种形式,只利用这种形式不一定会得到正确的结果。于是部题又变得一团糟了。

“山穷水尽疑无路,柳暗花明又一村。”在这疑难的关头,60年代~70年代期间发展起来的动力学系统理论和混沌理论给我们提供了新的线索。分析与数值实验表明:即使对一个少自由度的Hamilton系统,由于非线性作用,它也会表现出某种程度的遍历性,甚至更强的混合性。孤子系统的非线性不同于混沌系统的非线性,孤子系统是完全可积的,而混沌系统是不可积的。混沌系统的特点是相空间轨道为高度不稳定的,长时间的行为具有混沌性,因而作粗粒描述时就具有趋向平衡的性质。它给我们提供的清晰的趋向平衡的图像,正是人们长期以来所预言与期望的。但是致今还没有人能够根据这种图像做出普适的趋向平衡的理论来。

历史的回顾使我们看到,一百多年以来的前扑后继的努力使非平衡统计力学得到很大的发展与广泛的应用。但是与期他学科不同,即使经过长时间的几代人的努力,它仍是不成熟的。主要原因当然在于其基本问题——趋向平衡问题没有得到解决。这个基本理论问题不是学院式的问题,而是关系到对所遇到的愈来愈多的实际问题是否能够与如何给出正确解答的问题。

由于非平衡统计力学作为一门学科所处的这种情况,这门课程不打算用一种理论形式作完美的讨论,而着重于介绍这门学科中的实质性进展。特别是其基本概念,以及在不同性质问题上的广泛应用。