2001年中国公众科学素养调查数据点评


农民职业当下可以忽略不计:点评之二

刘华杰

(北京大学哲学系,100871)

2001-10-23


统计结论常常与直觉一致,但也常常与直觉相反。回头进一步看这次的统计结果,可以得到一个惊人的结论:在目前的情况下中国农民的科学素养数据可以忽略不计,这是反直觉的。

我在“点评之一”中提到科学素养与职业的关联,2001年有如下数据:学生及待升学者达到基本科学素养者占11.42%,为最高;专业技术人员6.29%,列第二;商业工作人员5.81%;办事人员.07%,国家机关、党群组织和企事业单位负责人员4.55%,列第五;服务性工作人员1.03%;离退休人员0.87%;个体劳动者0.55%;工交企业工作0.52%;城镇待业人员0.10%;农民0.04%;其他人员均接近零。[2,3]

众所周知,中国是农业大国,农民在总人口中占据了绝大多数,城乡差别极大。于是抽样调查的一个朴素的想法是,为了能够正确地反映中国的实际情况,样本要与各类职业的人口数成比例。但是仔细分析,这个想法是不对的。从抽样结果可看到,农民(作为职业看,农村的干部、学生等都另计)的科学素养相当低,低到了0.04%,特别是与其他职业人员的对比,如学生高达11.42%,专业人员达到了6.29%。此时没有考虑不同职业的人口比例。那么考虑了以后会如何?考虑了以后仍然影响不大。就算农民职业占50%,它乘以0.04%后得到的权重(指在全国平均的公众科学素养中的权重)仍然小得可怜:0.02%。0.02% 与平均值1.4%相比是很小的,这相当于说农民的科学素养状况不影响最终的全国平均值,尽管农民人口众多。2001年的抽样总体按职业分的情况为:专业技术人员5.1%;学生及等升学者2.4%;办事人员5.4%;单位负责人3.6%;商业人员2.7%;离退休人员7.2%;服务人员4.4%;个体劳动者8.1%;工交4.2%;其他1.3%;农民43.2%;城镇待业者3.1%;家务人员9.4%;丧失劳动者0.5%。这里农民为43.2%,占最多。此抽样比例与我国人口普查的数据比例基本相同。这次调查加权前城乡比例为:城市人口41.92%/农村人口58.07%。加权后城乡比例为:城市人口36.08%/农村人口63.91%。[1,2]

对于计算全国平均公众科学素养数值,要看各类职业人口的分别“贡献”,算法为“某一职业占全国人口的比例”乘以“此职业人口的科学素养分值”:学生及待升学者27.408(在此段中单位均为%%);专业技术人员32.079;商业工作人员11.62;办事人员25.38;国家机关、党群组织和企事业单位负责人员16.38;服务性工作人员4.532;离退休人员6.264;个体劳动者4.455;工交企业工作2.184;城镇待业人员0.31;农民1.728;其他2.21。这些加起来总计134.55(%%)=1.3%,这与全国平均值1.4%相差不多。考虑了抽样比例与实际人口比例的差别,较正后大概就与1.4%接近。

我们看到,即使农民的科学素养值由当前的0.04%提高10倍,达到0.4%,农民的科学素养数据对全国的平均值得仍然没有实质性的影响,全国的平均值则是1.50%。而在当前情况下,农民的科学素养不可能快速提高10倍。这也就是说,农民群体的数据对整体统计的贡献可以忽略(这绝对不等于说农民的科学素养水平不重要),不但如此,农民的科学素养数据的变化对全国平均值也没有实质影响。

就目前而论,有四个阶层(群体,职业)与中国科学素养的最终统计数值关系极大,按重要性它们依次为:1)专业科技人员;2)学生及待升学者;3)办事人员;4)国家机关、党群组织和企事业单位负责人;5)商业工作者。这意味着什么?意味着,要迅速提高中国公众的科学素养,关键要看这几类人员。一个重要推论是,当前中国公众科学素养总体水平较低,其中上述五种人贡献较大,他们是中国科技事业的先锋。短期内提高科学素养数值,要靠这五类人,但长期则不行,必须提高农民的科学素养,使得农民的数据能够占更大的比重。

就目前的统计和短期的未来的类似调查而言,另一个推论是,以后(10年内)调查,农民一类不必过多采样,甚至不采样都行,在这一类群众上过多地入户口调查对于计算全国平均的公众科学素养值几乎没有任何用处。相反,要提高调查的精度,要把重点放在上述5类群体上。甚至可以使上述五类占绝大部分样本,这样做只能提高精度而不会降低精度,同时可以节省大量调查费用和调查时间,总样本量也可缩小。还有一个推论,目前的问卷调查使得结果散布太宽,农民群体的细致结构无法得到有效显示,可以考虑针对中国国情,设计适合农村情况的特别问卷,做另一项不同于国际惯例、目标也非国际对比的科学素养调查。

当然,这些推论都有一个前提:即短时期内中国的社会结构不会有大的变化,即农民的科学素养在目前的低水平上不会有数量级上的剧烈变动。换算成时间,估计10年内,目前的格局不会根本性改变。如果今后每两年进行一次类似的调查,我觉得确实可以考虑大大减少农民职业的样本。还有,目前按人口比例抽样,还有其他方面的考虑,我只是就计算全国平均的科学素养值而言提出上述看法的。另外,我不懂统计,也许考虑不周到,请行家指正。


注:美国等发达国家各主要类别职业群体的差别不是特别大,他们设计的问卷因而更适合他们自己的国家,拿到中国就有一些问题,主要是农民问题。要进行国际对比,就要按人家的办法做,这是一个矛盾。此问题值得研究。

 

[补充]上举的例子可作如下解释,
比如某集团有100个人,其中有10人年平均收入为96元,90人年平均
收入只有2分钱(0.02元,只是为了说明而假设的),那么此集团
人口的平均收入是多少?显然为:(96X10+0.02X90)/100=(960+1.8)/100
=9.6018约等于9.6。

这意味着其中的10位高收入者让大家在平均值上“沾了光”,而90%
的低收入者的数据在计算中可忽略不计。所以,统计平均是个陷阱,
它夸大了少数人的支配作用。

目前学生、科技人员、干部、工商业人员、办事员五类人使得全国的
平均科学素养值“大幅提高”!甚至使广大农民职业群体在数值上可忽
略不计(不是不参与,它只作为背景,仍然是重要的)。

我的意思是说,此项调查有局限性,即没有真正反映农民的情况,
正如收入一例没有真正反映广大低收入者的实际收入情况。


参考文献:

1)中国科普研究所,《科普研究》1997年期;1998年6期。
2)中国科协中国公众科学素养调查领导小组,《2001中国公众科学素养调查频数
分布报告》,2001年9月7日。
3)中国科学技术协会,《2001年我国公众科学素养调查主要数据》,2001年10月。


回主页