学术出版物的格式(二)

2. 文字内容的风格

翻开任何一个《撰写规范》或style guide,都能看到大致相似的内容。我个人把这些内容大致分为两部分。第一部分是“文字内容的风格”(style),它包括论文的语言要求及文字书写的规范、物理量名称、符号与计量单位、数字、公式、……等等。第二部分是“排版”(typography),大到页面设置,小到字间距、行距等,所有涉及尺寸位置的方面。至于图和表,它们都有各自独立文字风格要求和排版要求,跟正文的两方面要求都会有些区别。本节主要讲正文的文字内容风格,如前面说过地,只讲一些零散的要点,不是系统全面的介绍。

2.1 语法

语言的风格,大部分是语文教育和英语教育的范畴。这也就是为什么理科专业的导师们经常会相互吐槽学生“语文没学好”。大部分学生犯的问题就是十分基本的语文问题,很难拥有在这里讲的必要。但是公道地说,我们的中小学语言在写作的训练上,对应用文的写作要求太浅了,重视也很不够,不像一个公民语文教育样子。英语教育就更加落后于研究生需要。大部分研究生英语写作能力远远无法胜任他们面临的写作任务,而且是全方位的,从词汇到语法,更遑论风格了。在此我只用一句总结——语言表述必须清晰、准确。至于具体如何做到,就属于语文或英语写作训练的范畴了,我没办法手把手地教。不过,按照“专业的事情交给专业的人去办”的原则,语言风格问题,可以用类似Grammarly这样的在线服务或者找专业论文润色机构去搞定。或者,这能反过来帮助你理解,到底哪些属于“语言的风格”问题而非“排版”的问题——论文润色机构负责的部分,就属于“语言风格”;他们不负责管你的排版。

语言表述必须清晰、准确。
Language presentation should be clear and accurate.

在这里我提几个方面:1. 单词拼写(spelling);2. 用词(diction);3. 标点(punctuation);4. 数量与单位。

2.2 单词拼写

大部分单词拼写的问题可以查字典或语法书解决。我在这里提两个问题。第一是名词的复形(plural forms)。下面是我总结的一些例子。

具有特殊复形拼写规则的单词

上图按规律性分了组。举一反三的话,还有很多常用词是需要注意的,比如analysis的复形是analyses,坐标轴axis的复形是axes。至于,如何正确使用复形,就属于基本语法问题,自己看语法书学习。这里只强调当你需要使用复形式,需要注意拼写。

第二个问题是所有格(possessives)。我们经常会讲到多作者的共同工作。例如Kanter and Marshall’s results,表示这两个人共同得到的一份结果(这时result一词仍使用复形则可能表示它们共同得到的结果不止一项),注意这时只有最后一个人的名字后需要加“'s”。如果每个人都各自做出了一份结果,那就要在每个人名后加“'s”。

以我提到的这两个问题为例,大家就应该明白“拼写问题”不光是查字典的问题。大家需要对类似的问题敏感起来。

2.3 用词

注意相近意义词(组)的准确选择和运用。例如:

  • about/approximate
  • between/among
  • comprise/compose/consist

至于这些词的使用上具体要注意什么,英语课上会讲,我就不在这里复述了。

注意避免偏见(bias)。例如性别中性(gender neutrality),“人类”不说mankind而说humans/human beings,“发言人”不说speakman也不说speakwoman而用speakperson,等等。此外还有种族的偏见、疾病或身体残缺的偏见等等。偏见问题主要都在社科或医学类的论文中碰到。

注意避免冗余(redundancy)。例如,It has been xxx that …可简化为As already xxx, …;a number of改成several;are known to be改成are。类似这些问题,很多软件自带的语言提示都会显示。

2.1.1和2.1.2两个小节涉及到的问题,主要是综合的英语素养。而关于如何提高英语,就需要另外开一个系列来分享了。

2.4 标点

英语有自己的标点符号规范,跟中文不同。中学理应掌握的,我就不复述了,但不代表学生不会犯。所以请你们注意复习1。我在这里只提几个小方面

2.4.1 关于“横线”模样的符号

我们一共有以下这些“横线”模样的符号:

符号名称符号字符UNICODE
负号(minus)U+2212
连字暨减号(hyphen-minus)-U+002D
不间断连字符(non-breaking hyphen)U+2011
短划线(en dash)U+2013
长划线(em dash)U+2014
几种“横线”模样的符号

键盘上直接能打出来的那个,是连字号暨减号,它应仅作为连字号(hyphen)使用。之所以又“暨减号”,是早期打字机年代不得不作出的妥协。在正式出版物中,上表中五种符号具有截然不同的意义和功能。

两种字体下的四种横线符号区别。从左到右依次是:连字号暨减号,en dash,em dash,负号。

连字号(既连字号暨减号)用于在自动换行时断开行末长词。这在行宽词数较少,又想要保持两端对齐的时候可以起到帮助。

两端对齐时,使用连字号和不使用连字号的效果

功能完善的编辑器软件,都能设置是否叫软件自动断词。如果不允许软件自动断词,你就要手动添加连字号,才能实现上图右边的效果,否则就会看到左边的效果。这里啰嗦一下,一个多音节单词,到底能在哪两个字母之间加连字号,必须以词典为准。词典中的词条往往会写成“het·ero·ge·ne·i·ty”这种样子,其中的点号代表着你可以加连字号的地方,其他字母之间是不允许加连字号断词的。别乱加。

连字号还能用于用已有单词临时组成的新词的时候,例如temperature-dependent process、mother-in-law。也包括用前缀构造的词,如self-assembly。

有时你特别不希望某个单词被断开换行,又不想为了他关闭编辑器的自动断词功能,那你就可以在发现编辑器断开了某词时,在断开出添加不间断连字符。它不会被打印出来。

En dash和Em dash中的“en”和“em”是指英文字母N和M,用来代表着英语字母的两种字宽。所以En dash意思就是长度跟N一样的短画线。En dash用于把相连单词构成具有并列关系或相对关系的短语,相当于“and”、“to”的意思。最常见的是把两个人名并列,如Flory–Rehner模型、时温叠加time–temperature superposition。

Em dash是英语中的破折号。不要用中文全角的破折号。例:All three experimental parameters—temperature, time, and concentration—were strictly followed.

2.4.2 关于“全角”与“半角

中文正文中表补充说明时使用括号,应属于中文标点符号的一种使用行为,故应采用全角括号。例如:所采用的溶剂是N,N-二甲基甲酰胺(N,N-dimethylformamide,DMF)。在此例中,括号用于表补充,故为中文标点符号的使用,要用全角括号。括号中的内容是补充英文全称和缩写,中间的逗号也是中文文本的标点符号使用,应用全角逗号。用于表序号的括号不是行文中为了表示补充,而是序号的组成部分。由于序号本身是拉丁字母或阿拉伯数字,故应使用半角括号,例如:如图3(a)所示。由公式(3-8)可知。如果序号确为中文,则括号应用全角。例如(一)、(二)、(甲)、(乙)。数学公式中的括号用半角。

2.4.3 关于单引号

在物理量字母中表示prime、double-prime的符号是:U+2032)和U+2033)。使用时不加斜体。例如储能模量G和损耗模量G。不要用键盘直接输入的字符'U+0027),或者"U+0022)代替。键盘直接输入的叫apostrophe,在打字机时代由于键盘有限因而身兼数职。但它们本身不是表示prime和double prime的正确的字符。此外,在Word中键处这两个字符时,软件会根据上下文智能替换成单引号U+2018)和U+2019),双引号U+201C)和U+201D)。单引号和双引号是英文行文中表引用时使用的,也不是表示prime和double prime的字符。

另外prime和double prime也用于表示角分和角秒、时分和时秒,英尺和英寸。例如,角度为8°12′36″

2.4.4 关于术语

学科术语若需要补充其英语名语的,一定要先给出中文名词。例如,N,N-二甲基甲酰胺(N,N-dimethylformamide,DMF)。错误例子:满足橡胶的典型行为(Gough–Joule effect),严格来说此处表示的意思是“橡胶的典型行为”一词的英语是Gough–Joule effect。因此需改为,满足橡胶的典型行为,即Gough–Joule效应。或改为,满足橡胶的典型行为,即哥夫–焦尔效应(Gough–Joule effect)。

术语首次出现,一定要严格按照中文全称、英文全称、英文缩写的顺序完整给出。之后再次出现,一律采用英文缩写。这里举一个错误例子,在首次出现时这样给出:溶剂是DMF(N,N-二甲基甲酰胺)。何谓“首次出现”?术语“首次出现”的范围包括:摘要之内、章之内(学位论文)、结论之内。跨越上述范围,再次出现同一术语,重新属于“首次出现”。

最好编制一个全文术语中、英和缩写一览表。用Excel,按字母排序。

2.4.5 关于化学物质

化学名称的命名规则是有国际标准的。为方便和安全起见,一律在Wikipedia上的相应词条中确认正确的命名。这里提一些零星的要点。

表示基团位置原子的元素符号要斜体。例如N,N-dimethylformamide中的N是指甲基所在原子的位置,不是表示化学式中的原子本身(如NH2),要用斜体。表手性的RS要用斜体。表顺反的cistrans要用全小写斜体。

化合物名称中的短横线是连字符。其余标点符号均用半角(包括逗号、圆括号和方括号),逗号不加空格。例如:4-[4-(4-chlorophenyl)-4-hydroxypiperidinyl]-N,N-dimethyl-2,2-diphenylbutanamide。上述关于符号使用半角、不加空格等规定也适用于中文。例如N,N-二甲基甲酰胺。

长的化学名称处于行末时,英文版是可被断成两行的。断词规范尚处于讨论阶段2。如果不希望在某连字符处被断开,应采用非中断连字符。

2.5 数量与单位

关于数字、数学表达式和数量单位的规定,ACS和APS的Style Guide已经足够齐全了。本来这是我觉得最没必要在这里重复的,却是每年学生中问题最集中的方面。我在这里列首先强调大家专门去看我推荐的style guide认真通读。

2.5.1 数学表达式

数学表达式分为“显示”(display)和“行中”(inline)两种模式。我课题组学生都习惯使用Word,建议Word用户习惯使用MathType来处理数学公式。因为Word自带的公式编辑器字体不支持Times New Roman,在正文字体有此要求时,会造成字体不统一3。用MathType插件时要注意设置公式字号与论文正文字号相同。

如果不使用MathType插入行中公式,而是直接使用输入时,注意运算符和关系符前后要加空格。例如,x + y = 3。

物理公式列出后,一定要确保每一个变量的物理意义都被以文字进行了介绍。

2.5.2 物理量与数量

表示物理量的字母要用斜体。下标非变量表意义的要用正体。例如:平衡模量Geq,字母G表示模量用斜体,下标“eq”表平衡(equilibrium),不是变量,用正体。下标是变量的要用斜体。例如N个实数组成的数列xi, i = 1, 2, …, N

数的表示采用科学记数法时,乘号前后可不加空格。例如3.2×10−3。记得10的幂如果是负的,负号要使用正确的字符。含有不确定度的表示,用正负号(±U+00B1)。前后不加空格。例如:3.12±0.06。如果要结合科学记数法,需加括号(运算规则本身的要求),例如:(3.12±0.06)×10−3。正负号后的不确定度具体意义(标准差、95%置信度区间等)另用文字说明。

单位用正体(upright roman)。对于复合的单位,要统一到底是用除号“/”还是用负幂。例如,到底是按mol L−1表示,还是按mol/L表示,全文都要统一,不要一时采用mol L−1,一时又采用mg/ml。单位中如果表相乘的,用一个空格隔开,如kg m s−2。为了不被编辑器把这样的一个单位断成两行,这个空格要采用“不间断空格”(non-breaking space,U+00A0)。

还有很多方面,“全文统一”都是一条默认的要求。比如“升”用大写L还是小写l,虽无原则性要求,但至少要全文统一,最好在你个人这里绝对地统一,只要出自你手,都只有一种风格。类似问题不再一一列举。

摄氏度要用度符号(°U+00B0)和大写字母C组成°C,不要用U+2103)。因为包括Times News Roman在内的很多字体都没有这一字符,在软件中插入该字符,系统将自动改用宋体显示,造成字体样式不统一。另外,摄氏度单位与数值间要加空格,因为它不是一个角度。

在很多方面,“全文统一”都是一条默认的要求。

用百分号来表示浓度时,要尽可能避免使用wt%、%v/v等符号,因为这些符号的定义不普遍明确。所有百分数,一律表示成xx%,不再对百分号添加修饰。至于其不同的意义,就用文字说明。例如,每次都明确“质量分数为3%的溶液”、“粒子的体积分数为1%的悬浮液”(英语类似)。质量分数和体积分数是不同的变量,分别用不同的字母表示。例如x是摩尔分数、w是质量分数、φ是体积分数。好处在于,若这些分数的定义本身是明确的,则诸如“x = 3%”的表述意义就自然也是明确的,无需多作解释。同时有,x = 3% = 0.03,即无论用不用百分号,数量的意义也都是明确的。

理论上,所有测量结果,不管是本研究做的,还是其他研究报道的,都是同时具有不确定度的。测量结果的均值应含有多少个有效数字,由不确定度本身决定,不是任意取的。测量结果的加减乘除以及函数值的不确定度,要根据误差传递公式得出,于是这些计算结果的均值的有效数字个数也不是任意的。如果的确要只报道均值而不附带不确定度,至少有效数字的个数要合理。而且全文提到同一结果是有效数字个数要统一。例如,在提到同一个压强时,不要前面说“压强是9 MPa”,后面又采用“9.0 MPa”。高分子的分子量是平均分子量,但在惯例上,我们不将分子量分布视为“分子量测量的不确定度”,用正负号带上其“标准差”或“95置信区间”,而是将分子量分布本身视为一种关注对象。因此平均分子量本身的有效数字位数无法通过“不确定度”确定,仅可遵循惯例,即精确到100 Da。例如,PEG的重均分子量是35100 Da。标准原子质量单位(即用于表示分子量的单位),最好统一使用道尔顿,不要使用g mol−1。因为后者意义与前者是不同的。前者是质量的单位,它是碳-12原子质量的1/12,原则上可用于表示一切质量;后者不是质量,而是摩尔质量,即每摩尔某对象的质量。仅在公式推导过程中用到分子量这个物理量时,由于这个物理量本身的定义就是一个分子的质量,故而才隐含默认了1 Da = 1 g mol−1的换算关系作为附加条件;这个换算关系并不是单位道尔顿的定义,而是一个声明!再者,我们不会讲“量取多少摩尔的聚合物”,因此聚合物的平均分子量用摩尔质量表示是没有实际意义的。

测量结果的均值应含有多少个有效数字,由测量的不确定度本身决定,不是任意取的。

单位中表示10−6的前缀字母要用专用符——微符(µU+00B5),而不要用希腊字母μU+03BC)。例如,5 µL,而非5 μL4

表示数量的范围,照理应使用波浪号运算符(U+223C),而不是键盘直接打出的颚化符(~U+007E)。顾名思义,后者是在西班牙语、葡萄牙语等语言中表重音的符号,因此该符号的位置是靠顶的。然而由于U+223C在Times New Roman、Arial等常用字体中都没有,因此只好用颚化符代替。由于波浪号运算符是作为关系符使用的,因此前、后要加空格。有单位的,需要前后都带单位。例如:3 cm ~ 5 cm,不能写成“3 ~ 5 cm”。就算使用文字“至”表示范围也一样,例如3 cm至5 cm。如果是科学记数法,也应严格写成:3.0×10−3 m ~ 5.8×10−3 m。于是,这种表示规范也兼容涉及不同量级的情况,例如3 cm ~ 5.08 m,3×10−2 m ~ 5.08 m等,意义也是明确的。表示一系列离散值时,在中文行文中用正确的标点符号——中文顿号隔开,且每个数都要加上单位。例如,在温度为10 °C、20 °C、30 °C和50 °C下分别进行测试。如果要用物理量等号的形式,则属于一个数学表达式整体,因此正确的标点符号是半角逗号,因为在英语和数学表达式中,表并列是用逗号的,而且要加空格。例如,在温度T = 10 °C, 20 °C, 30 °C, 50 °C下实验。这里不再使用中文“和”,由于是中文文本,也不应使用英文“and”,故什么都不用。

单位本身足以明确物理量种类的,可不再明确。例如,在80 °C下进行测量。但严格的做法应该明示!例如,在温度为80 °C下进行测量,或者在T = 80 °C进行测量。