学术出版物的格式(一)

0. 写在前面的话

科学研究的成果免不了要以某种出版物的形式展示。例如,比较系统和深入的工作要印成一本书。就算只是一门课的讲义,用来发给学生,也需要注意基本上像一本书那样排版。新的研究成果要发表成论文,它也将会印在杂志和期刊上。学术会议上的口头演讲要制做幻灯片,学术会议里还有海报。以上这些场合都涉及到排版的知识。攻读研究生的过程本身就大量碰到这些锻炼机会,这也是研究生培养的一部分。网上一搜,不管是中英文,都有大量针对学术需要的排版知识了。

但是我发现上述认识对学生真正获得相应的技能并没有太大的帮助。

首先是学生一开始并不意识到,这件事情需要花专门的时间去系统了解,总觉得边干边学就行了。但是俗话说万事开头难。小活儿小难,大活大难。对于研究生来说,科学研究的每个环节对他来说都是新活儿,如果都“边干边学”,那么所有的小难大难累加起来将会形成高耸的学习门槛。

排版知识需要花专门的时间系统地了解……
或者,花钱交给专业的人去做。

其次,就算学生希望专门了解一下这方面的知识,也会在大量的信息下无所适从。这里面有“排版”这个概念从纸媒时代、低分辨屏时代、再到高分辨屏时代的历史转换遗留下来的“审美原则模糊”。我们都知道,自媒体时代,网上的资料都是小编总结的,天下文章一大抄,真正的来自同一个人的,统一自洽的亲身体会是很少的。有的文章抄的是纸媒时代的,有则抄的是低分辨屏时代的,有些原则仍适用于当下,有些则不适用了。学生如果想要拥有这种分辨力,就不得不对每条说教都追究“知其然知然所以然”,以便能独立思考这些原则是否仍适用于自己。这将大大增加学习的工作量,令人望而却步。

再者,学术场合的排版面临的问题也不是简单排版问题。它涉及图、表、文字和数学公式的混排。数学推导有长有短,还有在行中(inline),还涉及中英混排。一些一般性的排版知识介绍,无法覆盖研究生直接面临的问题。

先从一个基本的矛盾出发:排版领域本身就因为上述的历史转换而处于激烈的变革当中,不可能要求科学研究者们都是排版学专家。那么现实的社会到底是怎么协调的呢?先了解这个,知道了解哪些知识属于自己义务,而哪些则没必要强求,能够先设定一个边界。

1. 《撰写规范》(style guides)

作为对上一段的问题的回答——《撰写规范》或者style guides代表着研究人员必须了解的排版学知识的最小范围。

每位研究生都至少经历过本科学位论文的锻炼。一般学校会发布一个“学位论文撰写规范”。用这个关键词在网上搜索,能够找到很多高校和科研院所发布的版本。

华南理工大学的《研究生学位论文撰写规范》。左边的导航视图展示了这类规范一般包括的部分内容。

这些“撰写规范”针对的是中文或中英混排的。英语论文方面,类似的资料叫style guide。投过稿的同学应该知道,每个期刊都会对稿件排版有相应的style guide或称guidelines。同学们应该有过照着这些style guide中的要求重复修改自己稿件的经历。

《撰写规范》或者style guides代表着研究人员必须了解的排版学知识的最小范围。

一些权威的出版社或出版期刊的学会的style guides已经成为经典,众所周知且被广泛采用。这些style guides的规定,也成了一种普适的规范。我们平时经常听到的一些来自学术前辈的关于排版上的说教,其实都可以追溯到这些style guides。但是,一般人口中说出的经典style guides,其实都各有侧重。例如,美联社的The Associated Press Stylebook (AP Stylebook)主要针对新闻媒体。源自芝加哥大学出版社的Chicago Manual of Style主要针对正式出版(为出版社所参考)。美国心理学会(American Psychological Association,APA)的出版手册(Publication Manual)主要在医学类论文的学术写作当中被大量参考。很多医学期刊并不为自己新订一个style guide,而是直接要求以某最新版的APA为准。微软发布的Microsoft Manual of Style,主要针对软件和网页的用户界面。

我所在的领域是物理学和化学交叉领域。更适用的是美国化学学会的ACS Style Guide和美国物理协会的APS Style Guide

这里提到的各种style guide,每套都是一本书,其中有一些的正版全文是需要收费的。既然我说这些style guides的内容代表着研究人员应该掌握的所有排版知识,那么就暗示着,了解排版需要花的时间无法也不该是碎片式的“边干边学”、“碰到再学”。

在这里插一句提醒。高校的针对中文论文的《撰写规范》,常常大量引用我国已有的国家标准。例如说,数字的规范“按国家语言文字工作委员会等七单位1987年发布的《关于出版物上数字用法的试行规定》”。凡是这种情况,读者理应去详细阅读所提到的规定;这些规定里的内容《撰写规范》里一般都不再复述。实际上绝大多数同学可能只按照《撰写规范》里讲了要求来进行修改,剩下的按照导师的要求改。更多情况可能交给打印店解决了。我比较赞同两个极端,一个极端是自己全面了解,包括《撰写规范》中引用到的国家标准;另一个极端就是交给打印店,按照“专业的事交给专业的人办”原则。所以,如果我指出了什么格式上的疑问,学生一问三不知,但能够确定说“这是打印店帮搞的”,我就不会纠结。未来的社会,只会分工越细;研究人员必须知道的专业外的排版知识,只会越来越少。

但我的当下建议仍然是,就算还不确定要投搞到哪个期刊,甚至根本不是在投稿,而是一般性地创建文档,我们也要养成重视排版的习惯。自己要有着一个“个人默认”的撰写规范,指导着自己创建出来的任何文本。你发给他人的任何非正式的东西,都是正式的、统一的、自洽的。一份“东西”在排版格式上的统一自洽,能增加对方对这份“东西”的信任和阅读的意愿。你的这种素养无形中增加你成功的机会。这个“个人默认”的撰写规范,就可以直接采用或继承上述的某一种,以减轻自己的负担。

由于上面介绍的任何一套style guide的内容都已经十分全面了。以下我只挂一漏万地提一些我想提的小要点。请各位首先做到详细学习上述的《撰写标准》和某一个style guide,不要懒惰地把你刷到的这篇或任何一篇“经验分享”当作主要学习资料。反过来,一篇只提几个具体问题的格式经验,对你的用处仍然是很大的。因为处理文本格式问题非常讲究“举一反三”。别人向你提了一个具体的问题,那么类似的方面的问题还包括哪些,你就都要列举过来,全文查改。如果没有“举一反三”的素质,那么论文格式的修改就会陷入“讲一个改一个”的无尽深渊当中。一个人能够从一个小问题“举一反三”的反应出其他类似问题的前提是,他已经首先了解“一共包括哪些方面”、“哪些问题属于哪些方面”。同学们更需要建立的是这个概念体系,而非死记硬背大量鸡毛蒜皮的“格式要求”。

如果没有“举一反三”的素质,那么论文格式的修改就会陷入“讲一个改一个”的无尽深渊当中。

学术出版物的格式(二)

2. 文字内容的风格

翻开任何一个《撰写规范》或style guide,都能看到大致相似的内容。我个人把这些内容大致分为两部分。第一部分是“文字内容的风格”(style),它包括论文的语言要求及文字书写的规范、物理量名称、符号与计量单位、数字、公式、……等等。第二部分是“排版”(typography),大到页面设置,小到字间距、行距等,所有涉及尺寸位置的方面。至于图和表,它们都有各自独立文字风格要求和排版要求,跟正文的两方面要求都会有些区别。本节主要讲正文的文字内容风格,如前面说过地,只讲一些零散的要点,不是系统全面的介绍。

2.1 语法

语言的风格,大部分是语文教育和英语教育的范畴。这也就是为什么理科专业的导师们经常会相互吐槽学生“语文没学好”。大部分学生犯的问题就是十分基本的语文问题,很难拥有在这里讲的必要。但是公道地说,我们的中小学语言在写作的训练上,对应用文的写作要求太浅了,重视也很不够,不像一个公民语文教育样子。英语教育就更加落后于研究生需要。大部分研究生英语写作能力远远无法胜任他们面临的写作任务,而且是全方位的,从词汇到语法,更遑论风格了。在此我只用一句总结——语言表述必须清晰、准确。至于具体如何做到,就属于语文或英语写作训练的范畴了,我没办法手把手地教。不过,按照“专业的事情交给专业的人去办”的原则,语言风格问题,可以用类似Grammarly这样的在线服务或者找专业论文润色机构去搞定。或者,这能反过来帮助你理解,到底哪些属于“语言的风格”问题而非“排版”的问题——论文润色机构负责的部分,就属于“语言风格”;他们不负责管你的排版。

语言表述必须清晰、准确。
Language presentation should be clear and accurate.

在这里我提几个方面:1. 单词拼写(spelling);2. 用词(diction);3. 标点(punctuation);4. 数量与单位。

2.2 单词拼写

大部分单词拼写的问题可以查字典或语法书解决。我在这里提两个问题。第一是名词的复形(plural forms)。下面是我总结的一些例子。

具有特殊复形拼写规则的单词

上图按规律性分了组。举一反三的话,还有很多常用词是需要注意的,比如analysis的复形是analyses,坐标轴axis的复形是axes。至于,如何正确使用复形,就属于基本语法问题,自己看语法书学习。这里只强调当你需要使用复形式,需要注意拼写。

第二个问题是所有格(possessives)。我们经常会讲到多作者的共同工作。例如Kanter and Marshall’s results,表示这两个人共同得到的一份结果(这时result一词仍使用复形则可能表示它们共同得到的结果不止一项),注意这时只有最后一个人的名字后需要加“'s”。如果每个人都各自做出了一份结果,那就要在每个人名后加“'s”。

以我提到的这两个问题为例,大家就应该明白“拼写问题”不光是查字典的问题。大家需要对类似的问题敏感起来。

2.3 用词

注意相近意义词(组)的准确选择和运用。例如:

  • about/approximate
  • between/among
  • comprise/compose/consist

至于这些词的使用上具体要注意什么,英语课上会讲,我就不在这里复述了。

注意避免偏见(bias)。例如性别中性(gender neutrality),“人类”不说mankind而说humans/human beings,“发言人”不说speakman也不说speakwoman而用speakperson,等等。此外还有种族的偏见、疾病或身体残缺的偏见等等。偏见问题主要都在社科或医学类的论文中碰到。

注意避免冗余(redundancy)。例如,It has been xxx that …可简化为As already xxx, …;a number of改成several;are known to be改成are。类似这些问题,很多软件自带的语言提示都会显示。

2.1.1和2.1.2两个小节涉及到的问题,主要是综合的英语素养。而关于如何提高英语,就需要另外开一个系列来分享了。

2.4 标点

英语有自己的标点符号规范,跟中文不同。中学理应掌握的,我就不复述了,但不代表学生不会犯。所以请你们注意复习。我在这里只提几个小方面

2.4.1 关于“横线”模样的符号

我们一共有以下这些“横线”模样的符号:

符号名称符号字符UNICODE
负号(minus)U+2212
连字暨减号(hyphen-minus)-U+002D
不间断连字符(non-breaking hyphen)U+2011
短划线(en dash)U+2013
长划线(em dash)U+2014
几种“横线”模样的符号

键盘上直接能打出来的那个,是连字号暨减号,它应仅作为连字号(hyphen)使用。之所以又“暨减号”,是早期打字机年代不得不作出的妥协。在正式出版物中,上表中五种符号具有截然不同的意义和功能。

两种字体下的四种横线符号区别。从左到右依次是:连字号暨减号,en dash,em dash,负号。

连字号(既连字号暨减号)用于在自动换行时断开行末长词。这在行宽词数较少,又想要保持两端对齐的时候可以起到帮助。

两端对齐时,使用连字号和不使用连字号的效果

功能完善的编辑器软件,都能设置是否叫软件自动断词。如果不允许软件自动断词,你就要手动添加连字号,才能实现上图右边的效果,否则就会看到左边的效果。这里啰嗦一下,一个多音节单词,到底能在哪两个字母之间加连字号,必须以词典为准。词典中的词条往往会写成“het·ero·ge·ne·i·ty”这种样子,其中的点号代表着你可以加连字号的地方,其他字母之间是不允许加连字号断词的。别乱加。

连字号还能用于用已有单词临时组成的新词的时候,例如temperature-dependent process、mother-in-law。也包括用前缀构造的词,如self-assembly。

有时你特别不希望某个单词被断开换行,又不想为了他关闭编辑器的自动断词功能,那你就可以在发现编辑器断开了某词时,在断开出添加不间断连字符。它不会被打印出来。

En dash和Em dash中的“en”和“em”是指英文字母N和M,用来代表着英语字母的两种字宽。所以En dash意思就是长度跟N一样的短画线。En dash用于把相连单词构成具有并列关系或相对关系的短语,相当于“and”、“to”的意思。最常见的是把两个人名并列,如Flory–Rehner模型、时温叠加time–temperature superposition。

Em dash是英语中的破折号。不要用中文全角的破折号。例:All three experimental parameters—temperature, time, and concentration—were strictly followed.

2.4.2 关于“全角”与“半角

中文正文中表补充说明时使用括号,应属于中文标点符号的一种使用行为,故应采用全角括号。例如:所采用的溶剂是N,N-二甲基甲酰胺(N,N-dimethylformamide,DMF)。在此例中,括号用于表补充,故为中文标点符号的使用,要用全角括号。括号中的内容是补充英文全称和缩写,中间的逗号也是中文文本的标点符号使用,应用全角逗号。用于表序号的括号不是行文中为了表示补充,而是序号的组成部分。由于序号本身是拉丁字母或阿拉伯数字,故应使用半角括号,例如:如图3(a)所示。由公式(3-8)可知。如果序号确为中文,则括号应用全角。例如(一)、(二)、(甲)、(乙)。数学公式中的括号用半角。

2.4.3 关于单引号

在物理量字母中表示prime、double-prime的符号是:U+2032)和U+2033)。使用时不加斜体。例如储能模量G和损耗模量G。不要用键盘直接输入的字符'U+0027),或者"U+0022)代替。键盘直接输入的叫apostrophe,在打字机时代由于键盘有限因而身兼数职。但它们本身不是表示prime和double prime的正确的字符。此外,在Word中键处这两个字符时,软件会根据上下文智能替换成单引号U+2018)和U+2019),双引号U+201C)和U+201D)。单引号和双引号是英文行文中表引用时使用的,也不是表示prime和double prime的字符。

另外prime和double prime也用于表示角分和角秒、时分和时秒,英尺和英寸。例如,角度为8°12′36″

2.4.4 关于术语

学科术语若需要补充其英语名语的,一定要先给出中文名词。例如,N,N-二甲基甲酰胺(N,N-dimethylformamide,DMF)。错误例子:满足橡胶的典型行为(Gough–Joule effect),严格来说此处表示的意思是“橡胶的典型行为”一词的英语是Gough–Joule effect。因此需改为,满足橡胶的典型行为,即Gough–Joule效应。或改为,满足橡胶的典型行为,即哥夫–焦尔效应(Gough–Joule effect)。

术语首次出现,一定要严格按照中文全称、英文全称、英文缩写的顺序完整给出。之后再次出现,一律采用英文缩写。这里举一个错误例子,在首次出现时这样给出:溶剂是DMF(N,N-二甲基甲酰胺)。何谓“首次出现”?术语“首次出现”的范围包括:摘要之内、章之内(学位论文)、结论之内。跨越上述范围,再次出现同一术语,重新属于“首次出现”。

最好编制一个全文术语中、英和缩写一览表。用Excel,按字母排序。

2.4.5 关于化学物质

化学名称的命名规则是有国际标准的。为方便和安全起见,一律在Wikipedia上的相应词条中确认正确的命名。这里提一些零星的要点。

表示基团位置原子的元素符号要斜体。例如N,N-dimethylformamide中的N是指甲基所在原子的位置,不是表示化学式中的原子本身(如NH2),要用斜体。表手性的RS要用斜体。表顺反的cistrans要用全小写斜体。

化合物名称中的短横线是连字符。其余标点符号均用半角(包括逗号、圆括号和方括号),逗号不加空格。例如:4-[4-(4-chlorophenyl)-4-hydroxypiperidinyl]-N,N-dimethyl-2,2-diphenylbutanamide。上述关于符号使用半角、不加空格等规定也适用于中文。例如N,N-二甲基甲酰胺。

长的化学名称处于行末时,英文版是可被断成两行的。断词规范尚处于讨论阶段。如果不希望在某连字符处被断开,应采用非中断连字符。

2.5 数量与单位

关于数字、数学表达式和数量单位的规定,ACS和APS的Style Guide已经足够齐全了。本来这是我觉得最没必要在这里重复的,却是每年学生中问题最集中的方面。我在这里列首先强调大家专门去看我推荐的style guide认真通读。

2.5.1 数学表达式

数学表达式分为“显示”(display)和“行中”(inline)两种模式。我课题组学生都习惯使用Word,建议Word用户习惯使用MathType来处理数学公式。因为Word自带的公式编辑器字体不支持Times New Roman,在正文字体有此要求时,会造成字体不统一。用MathType插件时要注意设置公式字号与论文正文字号相同。

如果不使用MathType插入行中公式,而是直接使用输入时,注意运算符和关系符前后要加空格。例如,x + y = 3。

物理公式列出后,一定要确保每一个变量的物理意义都被以文字进行了介绍。

2.5.2 物理量与数量

表示物理量的字母要用斜体。下标非变量表意义的要用正体。例如:平衡模量Geq,字母G表示模量用斜体,下标“eq”表平衡(equilibrium),不是变量,用正体。下标是变量的要用斜体。例如N个实数组成的数列xi, i = 1, 2, …, N

数的表示采用科学记数法时,乘号前后可不加空格。例如3.2×10−3。记得10的幂如果是负的,负号要使用正确的字符。含有不确定度的表示,用正负号(±U+00B1)。前后不加空格。例如:3.12±0.06。如果要结合科学记数法,需加括号(运算规则本身的要求),例如:(3.12±0.06)×10−3。正负号后的不确定度具体意义(标准差、95%置信度区间等)另用文字说明。

单位用正体(upright roman)。对于复合的单位,要统一到底是用除号“/”还是用负幂。例如,到底是按mol L−1表示,还是按mol/L表示,全文都要统一,不要一时采用mol L−1,一时又采用mg/ml。单位中如果表相乘的,用一个空格隔开,如kg m s−2。为了不被编辑器把这样的一个单位断成两行,这个空格要采用“不间断空格”(non-breaking space,U+00A0)。

还有很多方面,“全文统一”都是一条默认的要求。比如“升”用大写L还是小写l,虽无原则性要求,但至少要全文统一,最好在你个人这里绝对地统一,只要出自你手,都只有一种风格。类似问题不再一一列举。

摄氏度要用度符号(°U+00B0)和大写字母C组成°C,不要用U+2103)。因为包括Times News Roman在内的很多字体都没有这一字符,在软件中插入该字符,系统将自动改用宋体显示,造成字体样式不统一。另外,摄氏度单位与数值间要加空格,因为它不是一个角度。

在很多方面,“全文统一”都是一条默认的要求。

用百分号来表示浓度时,要尽可能避免使用wt%、%v/v等符号,因为这些符号的定义不普遍明确。所有百分数,一律表示成xx%,不再对百分号添加修饰。至于其不同的意义,就用文字说明。例如,每次都明确“质量分数为3%的溶液”、“粒子的体积分数为1%的悬浮液”(英语类似)。质量分数和体积分数是不同的变量,分别用不同的字母表示。例如x是摩尔分数、w是质量分数、φ是体积分数。好处在于,若这些分数的定义本身是明确的,则诸如“x = 3%”的表述意义就自然也是明确的,无需多作解释。同时有,x = 3% = 0.03,即无论用不用百分号,数量的意义也都是明确的。

理论上,所有测量结果,不管是本研究做的,还是其他研究报道的,都是同时具有不确定度的。测量结果的均值应含有多少个有效数字,由不确定度本身决定,不是任意取的。测量结果的加减乘除以及函数值的不确定度,要根据误差传递公式得出,于是这些计算结果的均值的有效数字个数也不是任意的。如果的确要只报道均值而不附带不确定度,至少有效数字的个数要合理。而且全文提到同一结果是有效数字个数要统一。例如,在提到同一个压强时,不要前面说“压强是9 MPa”,后面又采用“9.0 MPa”。高分子的分子量是平均分子量,但在惯例上,我们不将分子量分布视为“分子量测量的不确定度”,用正负号带上其“标准差”或“95置信区间”,而是将分子量分布本身视为一种关注对象。因此平均分子量本身的有效数字位数无法通过“不确定度”确定,仅可遵循惯例,即精确到100 Da。例如,PEG的重均分子量是35100 Da。标准原子质量单位(即用于表示分子量的单位),最好统一使用道尔顿,不要使用g mol−1。因为后者意义与前者是不同的。前者是质量的单位,它是碳-12原子质量的1/12,原则上可用于表示一切质量;后者不是质量,而是摩尔质量,即每摩尔某对象的质量。仅在公式推导过程中用到分子量这个物理量时,由于这个物理量本身的定义就是一个分子的质量,故而才隐含默认了1 Da = 1 g mol−1的换算关系作为附加条件;这个换算关系并不是单位道尔顿的定义,而是一个声明!再者,我们不会讲“量取多少摩尔的聚合物”,因此聚合物的平均分子量用摩尔质量表示是没有实际意义的。

测量结果的均值应含有多少个有效数字,由测量的不确定度本身决定,不是任意取的。

单位中表示10−6的前缀字母要用专用符——微符(µU+00B5),而不要用希腊字母μU+03BC)。例如,5 µL,而非5 μL

表示数量的范围,照理应使用波浪号运算符(U+223C),而不是键盘直接打出的颚化符(~U+007E)。顾名思义,后者是在西班牙语、葡萄牙语等语言中表重音的符号,因此该符号的位置是靠顶的。然而由于U+223C在Times New Roman、Arial等常用字体中都没有,因此只好用颚化符代替。由于波浪号运算符是作为关系符使用的,因此前、后要加空格。有单位的,需要前后都带单位。例如:3 cm ~ 5 cm,不能写成“3 ~ 5 cm”。就算使用文字“至”表示范围也一样,例如3 cm至5 cm。如果是科学记数法,也应严格写成:3.0×10−3 m ~ 5.8×10−3 m。于是,这种表示规范也兼容涉及不同量级的情况,例如3 cm ~ 5.08 m,3×10−2 m ~ 5.08 m等,意义也是明确的。表示一系列离散值时,在中文行文中用正确的标点符号——中文顿号隔开,且每个数都要加上单位。例如,在温度为10 °C、20 °C、30 °C和50 °C下分别进行测试。如果要用物理量等号的形式,则属于一个数学表达式整体,因此正确的标点符号是半角逗号,因为在英语和数学表达式中,表并列是用逗号的,而且要加空格。例如,在温度T = 10 °C, 20 °C, 30 °C, 50 °C下实验。这里不再使用中文“和”,由于是中文文本,也不应使用英文“and”,故什么都不用。

单位本身足以明确物理量种类的,可不再明确。例如,在80 °C下进行测量。但严格的做法应该明示!例如,在温度为80 °C下进行测量,或者在T = 80 °C进行测量。

所谓“工科的真相”

知道了社会经济中的极端不平等后,没哪个年轻人还会淡定地去投身一个注定为资本当燃料的专业。如果连带知道了,他拥有的年轻和学习机会,并非他原以为的改变命运,选择不当燃料的机会,那他甚至要去造反了。想让大部分普通人安安份份乖乖地去上班,这个社会必须哄着瞒着。

工科教学中充满了这种隐性的哄和瞒。工科知识的特点,暗示了一种“万事都成比例”的普遍规律,于是让学生也误以为“一分钱一分货”、“一分耕耘一分收获”、“难度越高的活儿,挣的钱越多”……等等。平均醒悟年龄要到38岁。

这个社会对于个人是如此地不公,以至于作为老师,或者一名成年人,你若想要在学生或者年轻人面前保持100%的坦诚的同时,又要输出“正能量”,你只能去宣扬一种超脱的人生追求。只能求助于,看能否不把人生看成与当下社会的一场交易,而是看成对死亡的一篇注解。明确了“与这社会的任何交易你都是输家”之后,做人还图什么,才是二十一世纪出生的每一个人早在青春期就应该思考的。我们80后是现代性的一代,我们的青春之问,是彻头彻尾的青春。但00后是后现代的一代,它们的青春之问就是清苦的修行。