当前位置 : 首页
>>史志研究 >>方志论坛

谈二轮修志中如何对统计数据进行校核、考证

发布日期:2013-06-19 10:05 访问次数: 信息来源:台州史志网

  内容提要:统计数据的真实、准确与否,是衡量一部志书质量优劣的一个重要方面。第二轮修志时期,是各地经济高度、快速发展时期,反映在志书中就是第二轮志书统计数据的使用远比第一轮志书复杂得多。为了使入志数据更加真实、准确,在编纂过程中需防犯六种常见错误。
  关键词:二轮修志  统计数据  校核  考证

  自民国起,随着统计学的广泛传播,修志开始重视定量记述问题。民国期间颁布《修志事例概要》和《地方志纂修办法》都有使用数据的明确规定。尤其是从第一轮修志开展以来,随着经济建设中心地位的逐步确立,定量记述问题已经被越来越多修志人所重视。①第二轮修志时期,是各地经济快速转型升级,市场经济高度发展时期,因而第二轮志书统计数据的使用远比第一轮志书复杂得多。要提高第二轮志书的质量,必须十分重视志书统计数据的使用。统计数据的使用必须遵循严谨科学、全面系统的原则,这一原则既关系到修志的态度,也关系到修志的方法。从统计数据的角度看,没有严谨科学的态度,就不能做到入志数据的“真实、准确”。本文以《台州市志》编纂为例,结合自身对《台州市志》初稿全文数据校对经过,粗浅地谈谈在二轮修志中,如何对统计数据进行校核、考证,使入志数据更加真实、准确。②
  一、志书编纂中涉及数据的几种常见错误
  1、数据前后不统一。前后不统一又可分为夹在志文中的数据前后不统一和文表之间数据不统一两种。
  夹在志文中的数据前后不统一。在入志数据中,有许多数据要重复出现,特别是某些基本数据,如人口数量、土地面积、耕地面积等数据,以及某些反映重大影响的数据,都往往在概述、大事记和相关分志中重复出现。如《台州市志》初稿中有三处记载了1997年11号台风对台州造成的影响。大事记中记载:“1997年8月18日,11号台风造成185人死亡。”卷2自然环境中的第三章第五节台风中又记载:“1997年8月18日,11号台风造成194人死亡。”卷9水利中又用了约500字篇幅,详细记载了1997年11号台风对台州造成的影响,其中写到:“共损坏房屋115530间、263.928万平方米,死194人,……。”三处写到死亡人数,其中二处一致,一处不同。
  文表数据不统一。如《台州市志》初稿卷3人口中有一张“人口发展情况”表,表中记录1982年总户数为116.89万户,总人口数为474.29万人;1990年总户数为149.29万户,总人口数为515.49万人。而内文中则写1982年第三次人口普查,113.30万户467.46万人;1990年第四次人口普查,140.23万户487.64万人。
  2、前后数据错位。笔者在《台州市志》初稿校核过程中发现很多数据发生错位现象。如“1991~2006年发电量”表中的1996年台州发电厂发电量为513999.06万千瓦时,经考证应是531999.06万千瓦时。卷24教育科技第四节中学教育中写到,1997年普通高中在校生39855人,笔者与《台州统计年鉴》核实后,应为39885人;还有一张“教育事业情况”表中记录1997年在园幼儿数97429人,经核实应为79429人。像这种数据错位现象,隐藏性很强,如不对每个数据进行一一核对,很难发现。
  3、数据多一位或少一位。如《台州市志》初稿电力章中写到2005年台州发电厂装机容量为146000千瓦,笔者对照相邻几年该厂装机容量都约是2005年的10倍,为何这一年会特别小?带着疑问,笔者查找了很多资料,最后找到应是1460000千瓦,少了一个0;还有一张1962~1993年台州专(地)区全额收入和财政收入决算表中记录1968年财政收入决算为22737.6万元,笔者按照常识并对照相邻几年数据,为何这一年的数据特别大?怀疑这个数据有问题,最后经核实、考证,应是2737.6万元,多了一个2,相差20000万元。
  4、小数点移位。对带有小数点的数据,应引起高度重视,必需进行认真校核。笔者在《台州市志》数据校对过程中,发现一些数据小数点位置不对,小数点前移一位或后移一位的现象出现好多处。
  5、表格中分数之和不等于合计数,文字中的分项之和不等于总项。如卷12渔业、盐业中有一张2006年渔业基本情况表,其中有一栏“渔业村”,分数之和为213个,合计数为233个,经考证,应为233个。文中常有各分项百分数之和不等于100。
  6、计量单位变化引起数据的变化。卷4城市建设中的市区道路表有好几张,都是承编单位提供,每张表中都有“道路总长度”一栏,其中有一张“路桥区城市道路”表中的“总长度”栏单位是米,这一栏中最大的数据是3.5米(路桥大道),难道路桥城区这么多主街道都这么短?这明显存在差错。笔者查找了原始资料,并与原单位进行核实,“总长度”栏单位应为“千米”。
  二、造成错误的原因及对策
  1、统计口径不同,造成数据前后不一致。以上列举的1属于这种错误。众手成志,志书资料来自各部门,各部门统计口径有所不同,故常会出现数据前后不一致。“一般而言,统计数据应首选政府统计局的统计数据,次选各部门、单位的统计数据。政府统计局的统计数据都是面对本行政区域全社会、全方位的统计数据,它的覆盖面和覆盖内容,比部门统计要广、要深、要大。它更适合反映本行政区域的宏观情况。但是政府统计局每年对外公布的统计数据往往局限于本地国民经济和社会发展的一些基本数据以及政府组织的一些普查、抽查数据,在许多方面都满足不了各行各业的实际需要,反映不了志书各门类(篇章)的数量关系。因此,在没有政府统计或政府统计缺项的情况下,只能运用各部门、各行业的宏观统计数据。如果涉及到用部门数据来替代全行政区域数据时,一是要与政府统计局及时衔接并获得认可,二是要注意部门与全行政区域的逻辑平衡,原则上部门的统计数据只能等于或小于全行政区域的统计数据,而不能大于其同指标统计数据,否则就有问题。”③
  因而当出现这种错误时,笔者首先求助台州统计部门,查阅《台州统计年鉴》,但年鉴中没有此项统计。这三个数据分别来自三个不同部门,该如何统一?笔者又分别查找了原始资料和咨询了这三个部门的撰稿人,让他们提供原始数据的出处和来源,并自查其他相关资料进行考证,最终确定194人比较准确,再进行前后统一。
  2、撰稿人粗心大意造成数据错误。以上列举的2、3、4、5都属于这种错误。当撰稿人粗心大意时,原始数据在摘抄、运用、打印、排版过程中就容易出错。当各部门撰稿人在编写部门篇时,都会先查找大量原始资料,包括历史资料或档案资料,再经过摘抄、运用、打印、排版等综合应用后,最后交到地方志部门的稿件是在原始资料的基础上经过深加工后的资料,有些原始数据可能会在深加工过程中由于粗心大意而出错。要想避免这种错误少发生,保留原始资料相当重要。因而方志办在布置各部门编写任务时,最好要求各部门在供稿的同时提供原始资料原件或复印件,目的是为对数据进行更好地校核、考证之用。特别是经济部类,表格比较多,百分比也比较多,应仔细核对。无论在表格还是文字中,碰到既有分数(分项)又有合计数(总项)时,不要怕麻烦,一定要再核实几遍。
  3、顾前不顾尾。以上列举的6就是这种错误。造成这种错误的原因可能是撰稿人在编写时考虑到计量单位用“米”,下面数据比较大,不便书写,改用“千米”后,数据比较简洁,但数据改了,计量单位忘了改,只顾到了前面而忘了修改后面。这种情况在《台州市志》初稿中出现比较多,在这里提出,希望各修志同仁引起重视。为避免这种错误少发生,编写人员在写好材料后要根据常识性知识或根据上下文内容再去校对一遍;编写之始就应对计量单位进行统一,如面积的计量单位用亩还是用公顷应事先作好规定,不要中途改来改去,计量单位改变数据相应跟着变,稍不注意就会出现单位变了,数据没变,或者数据变了,单位没变的错误。
  三、校核时如何快捷地找到问题并解决问题
  校核数据虽无捷径可走,但运用好以下三点可适当提高查找问题和解决问题的速度。
  1、地方志办参与志书编写人员校核数据优于聘用社会人员校核数据。地方志办自始至终参与志书编写的人员,对整本志书的内容安排非常清楚,对于重复出现且前后不一致的数据容易发现,若临时聘用社会人员参与数据校核,他们对整本书的内容安排不是很清楚。如《台州市志》全书共250万字,这些重复数据都是隐藏在不同卷章节中,如对整本志书没有一个大致了解,很难发现前后数据不一致的问题,这就是为什么很多志书出版后,常会出现相同内容的数据前后不一致的情况。造成这种错误的原因不是出书前他们没校核,而是志书包含的内容太丰富,没有一开始就参与志书编写的人,要在较短时间内很难找到前后不一致之处。
  2、用“怀疑”的态度去校对每一个数据。除常识性数据错误能一眼看出外,其他数据错误很难一眼就看出,需仔细核实、计算,因而对志书中的每一个数据都应用“怀疑”眼光去审核。特别是一些表格,以为其中数据都是《统计年鉴》中照搬过来,应该不会错,而错误最多的地方恰恰就在表格中。如文章一开始列举中的2、3、4、5、6主要的错误也是在表格中,因表格数据太多,很容易看花眼,上下行、左右列看错,所以就是照搬年鉴的数据,也应一个数据一个数据校对过去。怎么样能更快捷找到错误呢?拿到一张表格如有分项和总项,首先不要怕麻烦用计算器算一下分项之和是否等于总项,如果不等,说明其中一定有数据出错,再仔细校对每一个数据;如果这张表格是某一行业历年的情况,其中有一年的数据比相邻年份的数据大很多或少很多,就应引起重视,仔细核实。
  3、原始数据保存完整,分类规范至关重要。当修改数据过程中发现一些常识性、知识性错误时,一时又不知错在哪,这时对原始数据的依赖性就相当强,完整、规范地保存原始数据能为校核、考证数据节约大量时间。保存原始资料并不是把所有的资料收集后就胡乱堆在一起,这不但不能为查找资料提供方便,还会更加浪费查找的时间。正确的做法应是把收集到的原始资料根据志书内容安排,进行分篇分类有序保存,这样查找、考证起来可起到时半功倍的效果。
  笔者对《台州市志》初稿全文数据从头至尾进行了三次校核、考证,第一次用了约2个月时间,第二次约1个月,第三次约10天,共找出错误300多处。能有这么好的效果,一是因为从收集初稿—分篇编写—总纂—定稿,《台州市志》编写的每一个程序笔者都参与了。特别是收集初稿由笔者一人负责,所有的原始资料笔者都保存完整,分类规范,这为最后的修改数据打下了基础。二是《台州市志》稿件前后修改七次,每一次笔者都参与,对整本志书的内容安排非常清楚,因此对重复出现的数据找起来容易些,为校核、考证数据提供了有利条件。
  在志书编纂中,统计数据的重要性自不待言。所谓“失之毫厘,差之千里”,统计数据的真实、准确与否,是衡量一部志书质量优劣的一个重要方面。笔者把修志过程中校核、考证统计数据的一些做法和体会写出来,与方志同仁作一交流,意在抛砖引玉,更好地为二轮修志服务。
   
   
   注:
   ①韩章训:《方志写作学基础教程》第268页。
   ②《台州市志》,台州市地方志编纂委员会编,2010年8月出版。
   ③颜越虎:《第二轮志书使用统计数据的原则与方法》,《浙江方志》2010年第3期第16页。
   
                                      撰稿人:  周月芹