中南财经大学
钱进
摘要:均匀设计是一种思想方法论,有广泛的普遍性;社会经济领域从来就是统计学应用的主要方向。本文试图从这一角度,针对我国当前行政管理人员遇事心中无数、计量分析方法使用不够充分的现实情况,说明均匀设计在社会、经济中应用有重大意义和广阔前景。
王元、方开泰教授创造的“均匀设计”法,首先在国防、科技大型系统工程中应用取得成功。
15年来,被用于国民经济众多领域,取得了巨大的经济、社会效益。同时,注意到此方法还没有用到社会经济领域,在(1)引用的61份文献和科学、科技两报的报道中,没有见到。我国的统计学界在传统上习惯将社会经济统计视为社会科学,而将数理统计归为应用数学。目前国际上比较流行的看法是:现代统计学正逐步成为一门通用的研究如何有效地获取数据和分析数据的独立的交叉性学科,是一种方法论(
2)。基于此,笔者认为均匀设计也是一种思想方法论,所以才有广泛的普适性。本文试图从思想方法论的角度来探讨均匀设计在社会、经济中应用的前景。一、统计学历史的召唤
均匀设计是一种优秀的试验设计方法,试验设计又是现代统计学的一个分支。
其实英文“统计学”一词
statistics源于法语”状态”一词Status,自中世纪以来逐渐演变成含政治意味的State。可见统计学原来包含的意义乃是指对国家的状态作调查研究。早在希腊
Aristotle的《国家论》一书中,详细记述了国家的政治、学问、宗教和风俗。17世纪,W.Petty(1623一1687)根据对人口、土地、财政、经济等方面的大量观察,完成了《政治算术》一书,提出了一套较为系统的方法,用于对社会经济现象进行数量性的描述和分析。将英国的国力和法、德、荷等国进行了比较研究。18世纪,G.Achenwall(1719一1772)把统计学(statistic)的性质、意义及范围明确定义为“把国家的显著事项全部记述下来的学科”,其主要著作为《近代欧洲各国国势学概论》。19世纪,A.Quetelet(1796一1874)把握住了德国记述学派和英国政治算术派两个统计学源流的本质,在应用数量观察分析方法于国势调查的同时,还学习数学、物理、天文诸学,和统计方法一道应用于社会生活的所有方面。其代表作《社会物理学》旨在“给政治科学和精神科学附加上一种以观察和计算为基础的方法,而支配着社会现象的法则和方法则是概率论。”由于他是将作为数学分支的法国古典概率论引入社会统计研究的第一人,常被认为是数理统计学的创始人。20世纪,W.S.Gorsset(笔名Student.1876一1937)为解决啤酒质量的检验问题,钻研出小样本的检验方法,后来,经剑桥大学教授R.A.Fisher(1890一1962)从数学上严格证明,从统计的意义上探明了推断、检验的含义,提出了估计理论和检验理论,创建了与昔日描述性统计学不同质的推断统计学。于是利用抽样调查的部分资料,由部分推断全部。由少量个体推断总体,形成了近代统计学的主要特征。事实上世界各国在经济、国势、社会调查、传媒受众研究、民意测验等领域进行了大量抽样调查研究,发展了许多抽样方法,其中正交设计得到广泛应用。科学技术革命、经济发展和社会进步,使我们当今的世界变化越来越迅速,越来越复杂。抽样方法虽多却难以适应社会经济领域的研究需求。均匀设计去掉正交设计的“整齐可比”性,发扬其”均匀分散”性,在抽样范围内布点有良好的均衡性,并有了抽样次数随水平级的增加量依同一数量级增加的连续性(
1),如把一项重大国防科研项目的961次试验降低到31次,展示了它应用于复杂大系统的巨大潜力。二、“心中无数”者的良方
无庸讳言,接二连三的重大失误,留给中国经济发展和社会进步造成了难以挽回的损失。
回想当年,谁要把统计学用到社会;经济领域;谁就会被扣上用自然科学解释社会现象的“资产阶级那一套”的帽子。比如反“马尔萨斯主义”否定了“人口统计”;回国的经济统计专家被安排到工科院校教数理统计;有数量分析的社会科学论文难以找到能发表的刊物;成人教育中“高等数学”成了众多行管、财经干部取得大专文凭的“拦路虎”…
其实,在极“左”思潮中兴风作浪的权威,正是数典忘祖的不孝子孙,殊不知他们开口闭口谈的“马克思”,正是用人类创造的全部精神财富来研究社会经济问题的典范。早在
1866年,马克思编写了《普遍的劳动统计大纲》其间包括有11个大项目;1988年,他曾根据法国工人的生活状况拟定了《工人调查表》提出了100个问题;他的《资本论》这一鸿篇巨作,就是运用统计方法研究社会、经济问题的典范。直到今天,西方仍然把马克思的经济著作作为“经济学”的一种学术流派在研究,并承认他是社会统计分析方法的创始人之一。长期以来忽略社会、经济问题的计量研究,造成了我国管理干部知识结构不合理;行政管理水平低下、穷于应付、缺乏预见性,遇事”心中无数”。当前,研究社会经济问题仍然是言论性务“虚”文章充斥报刊杂志,有数量分析的扎“实”文章较少。前者能一挥而就,与日俱增,却往往成过眼烟云;而后者穷经搜数,十易其稿,方能经得起岁月的推敲。尽管有些学财经、行管的学生数理知识不足,分配仍然抢手,工资居高不下,究其缘由难说和长官、经理不称职、需借用“头脑”或“笔杆”无关。
正因为不需要真实的数字,所以才轻视数字,或为私利谎报,或为偷懒胡编,造成定量分析困难,影响了人们用数字。
1994年4月,河北省领导人程维高提出“务必使党的各项事业的发展建立在真实可靠的基础上”,截止到1994年年底,全省应查58118个单位,实查56200家;核查、抽查9700多个单位,占16.7%,共查出虚报、瞒报、伪造、篡改统计数字930起,情节严重的116起,比率高达9.4%。但是,16.7%是一个很局限的数字,不能反映全省状况。如果利用“均匀设计”思想,分门别类,选因素,定水平,远远不需要16.7%的样本容量,却能在较高的可信度上推断全省的状况。宋健同志说:“在一个复杂的事物中,特别是社会问题中,对个别现象或事件的分析不能代替系统的、科学的数据分析和集约提炼”,“重大决策程序及贯彻执行的过程要符合系统科学原理。坚持历史的科学分析,准确的态势判断,足够的信息采集和提炼,弄清各系统的相互作用,在集中注意力于主要矛盾时尽可能预估寄生现象和减少副作用。”(
3)笔者想:比如财政、审计,是国家实施宏观调控的重要手段,可是长官意志随便开口子、批条子,曾愈演愈烈,使预算约束日趋软化。今年元旦起正式施行国家《预算法》和《审计法》。如果缺少和两法要求相适应的科学工作方法,难免不重蹈《统计法》出台后仍然有“拍脑袋”或“长官意志”数据之复辙。又如去年政府工作报告曾提出把1994年商品零售物价上涨幅度控制在10%以内,今年报告实际数是21.7%呢,原因之一是出台的调价项目和影响价格的改革措施较多,对其连带影响估计不够。如何使用均匀设计理论和方法,从复杂的宏观调控系统中,筛选出必不可少的最有代表性的少量信息,达到既容易操作又能恢法监督或科学决策的目的?这项应用基础研究对于改善我国现存常用的监督或决策方法,查错纠弊、减少失误或盲目性,保证财政资金真正流入财政渠道或达到政府工作目标,促进社会经济进步,无疑有着非同寻常的意义。从
20年代R.A.FlsHER把统计试验设计(SED)用于农业取得空前成功起,SED对微观经济及其管理作出了重大贡献。50年代美国戴明把SED传到日本,日本田口玄一用来减少产品性能异性以提高产品质量,影响整个日本工业界,后来发展成全面质量管理(TQC),大大提高了日本产品在国际上的声誉和竞争力。80年代,许多美国公司又引进田口玄一方法。从60年代始我国亦将TQC等统计方法推广到工、农业诸部门(4)。社会经济宏观调控是一个复杂的大系统,因素自然比工程技术问题更多,信息量庞大,结构化程度低,对规律的认识还有待深入探索、更需要以“均匀设计”法作一剂治病良方,以求取得类似于
TQC即在微观经济领域那样的成功,形成一种防微杜渐的规章制度。三、特性“数量化”的利器
把均匀设计从自然科学领域用到社会科学领域,又从微观活动用到宏观活动,最大的困难在于社会、经济活动是非试验性的:即系统的因素各水平是不能预定的或不可控制的。尽管如此,经过数百年的积累,现在用于社会科学的调查方法,即抽样方法,是有效的(
2)。因此,均匀设计能够对已有调查方法作改进,应是不容置疑的。抽样方案设计必须遵循三个重要原则:同一性、随机性和最佳化。均匀设计表,可以取代通常用的抽签法和随机数字表法,因为用数论方法确切计算出的一致分布点列,是在高维空间内的,保证了所有观测值都来自同一的社会经济过程,即行为模式的同一性;点列在高维空间中是尽量独立分散的,不仅实现了抽样方法的随机性,而且还满足了所收集的数据越分散越好、变化尽可能地大的愿望。至于在固定费用下,均匀设计是不是所选取的抽样误差最小的方案?或在所要求的精度下,调查费用最省?还需要用研究的结果证明。
抽样方案设计有如下内容:
明确使用目的和要考查的主要因素,如要想平抑物价,就要了解供给和需求的关系,而消费需求又和收入有关,物价又和流通环节有关调
明确总体和个体单元、如武汉市的“菜篮子工程”总体是武汉市的城区居民,最小个体为“户”;
提出主要因素参量的精度要求,如日用菜金以元为单位,精确到
(四)选择抽样方案的类型,如简单随机抽样、分层抽样、整群抽样、二阶段(级)或更多级抽样、系统抽样、多级混合型抽样;
(五)根据(三)和(四)确定样本大小
n,给出总体因素和抽样误差的估计式;在社会经济领域里的各类调查中,样本含量
n一般都比较大,总体均值u和样本与总体比例? 的置信度为1-? 的置信区间的计算公式,可查阅有关资料,如(2)。(六)拿出具体办法和安排实施日程。
上述的系统抽样,是将总体为
N个单元依某种顺序编号后,随机抽取一个编号作为样本的第一个单元,而后继单元按照某种确定的规则伴随抽取。如等距抽样就是最常用的系统抽样。实践证明,因为n《N时,当单元排列纲号是随机的,等距抽样的精度和简单随机抽样的精度十分相近。上述(四)的分层抽样,把总体经过了有规则的分类,再于各类中去抽取子样,组合成最终的样本,所得精度比简单随机抽样的精度还要高。而从均匀设计的原理我们可以看出,既可以看做是简单随机抽样,又可以看做是系统抽样,而最恰当的是看做多维的分层抽样,其精度显然比单一方向的分层抽样高得多。当然,其误差估计还有待从均匀设计表的“偏差”计算出来。对于没有现成参量的因素水平,一般用“打分”的方法,而
40年代美国兰德公司提出的De1phi专家调查法,由于其具有匿名性、反馈性和收敛性三大特点,得到广泛应用。但是,这一方法选择“专家”,是用的非随机方法,有点类似于便利抽样或判断抽样。如果在选择“专家”这一环节就能够使用均匀设计法,能够大大避免主观随意性,从而提高定性因素量化的质量。比如把所要选择的“专家”依大专业中的明细学科或方向、依在学校、科研机构、企业或管理岗位、依取得同类成果的时间…分出水平,在高维空间中定位。均匀设计“序贯方法”(5)、(1)还能够最好地满足抽样方法的“最佳化”原则。使社会经济工作者乐于多层次地使用;还可以做多组参照。

四、计量模型所需“粮食”的锄犁
如果你信奉马克思,总该承认马克思的论断:一种科学只有当它成功地运用数学时,才算是成熟的吧!我国社会、经济问题研究的手段已大大落后于国际,需要凭借数学走向成熟。
1969年设立的诺贝尔经济学奖,表彰了挪威R.Frisch和荷兰J.Tinbergen两位经济学家在计量经济学方面的开创性工作,说明了经济学由于其精度量化和精确化,已成为一门严格的科学,但是许多人还不了解。1981年当美国L.K1ein主要因构造计量经济模型获得诺贝尔经济学奖时,才使人们意识到计量经济学在经济工作中的重要性和必要性。我国从这时起才真正学习和借鉴传来的新方法(6)。
计量经济学是运用统计研究经济及经济领域中问题的一门经济学科,它对所观测到的经济现象或搜集到的统计资料进行分析、描述和制订政策,而且对经济理论进行检验、对经济政策进行评价,还要作经济预测。
《长江日报》今年三月,选择蔬菜这一特殊商品,作为庖剖析商品在流通环节的实际运作状况的突破口。派了
3名记者装扮成级菜贩,从地头收购鲜菜、经批发市场中转交易,再不渗“水份”地到集贸市场上接普通行市售出,获份100元收入。利用这一子材料,推出《记者贩菜记》的连续报道,引发了数百篇来稿寻求控制莱价“差率”有效途径的大讨论,为市长抓“菜篮子工程,献计献策。”《长江日报》的成功,却是用于受众接触传媒行为对态度改变影响规律或党报宣传贯彻党的中心工作绩效的研究范畴。作为经济工作者就不能泛泛概谈,而应该确定研究范围,力求精细准确。比如微观经济学由需求曲线和供给曲线组成的供求模型,就是经济学研究市场运作的最基本的工具。假定有了调查资料如下面两张表所示。
表一 某种蔬菜市场需求表 |
|||||
价格(元 /kg) |
消费者 1 |
消费者 2 |
… |
其他消费者 |
总需求量( kg/月) |
1.00 |
0 |
0 |
… |
0 |
0+… |
0.90 |
2 |
0 |
… |
80 |
82+… |
0.80 |
4 |
3 |
… |
160 |
167+… |
0.70 |
6 |
6 |
… |
240 |
252+… |
0.60 |
8 |
9 |
… |
320 |
337+… |
0.50 |
10 |
12 |
… |
400 |
422+… |
0.40 |
12 |
15 |
… |
480 |
507+… |
表二 某种蔬菜市场供给表 |
|||||
价格(元 /kg) |
菜农甲 |
菜农乙 |
… |
其他种菜者 |
总供给量( kg/月) |
1.00 |
80 |
120 |
… |
200 |
400+… |
0.90 |
70 |
110 |
… |
180 |
360+… |
0.80 |
60 |
100 |
… |
160 |
320+… |
0.70 |
50 |
90 |
… |
140 |
280+… |
0.60 |
40 |
80 |
… |
120 |
240+… |
0.50 |
30 |
70 |
… |
100 |
200+… |
0.40 |
20 |
60 |
… |
80 |
160+… |
不同时期对不同产品所作的类似研究,将验证一个供求法则:在(理想的)自由市场上,供给和需求的力量总会把价格推向均衡水平,使供给量和需求量相等。从而进一步阐明政府干预市场的机制,或解释计划价格大规模偏离市场均衡价格造成扭曲经济关系的恶果,或针对需求的价格弹性对不同商品采取不同调价政策获得了成功。
我国的市场发育还不完全,在继承经典模型的同时,要大量调研我国现实生活中的各种数据,作出适合国情的解释或对策。比如:除了收集价格上张收益(即市民生活消费的增量)在菜农、中间商、国家或其他人员间的分配数据外,还要调查蔬菜基地、批发市场吞吐量、经营成本和效益的分布情况,集贸市场网点和相关居民点的需求和消费水平…为合理规划流通半径,发展、扶持运输或经销大户规模经营,促使市场组织、监督经营过程等各项工商管理到位,制订交易规范…提供依据。这里又遇到多因素多级别的数据采集问题,如果用均匀设计思想指导调查分析,就可能把“中间环节”过多、”差率”过高的定性描述,转换成有数量可操作的“控制”手段,诸如高供需平衡点多远,降低流通成本可到多少元,在哪里建设多少个能调节市场需求的国营批发市场,最低保护价或最高限价定在哪里为好…
在宏观经济学中,有给出了在货物市场均衡情况下的利率
R与国民生产总值Y之间关系的直线方程,满足货物市场上投资恒等于储蓄的基本关系,被称为“IS曲线”;还有在金融市“场均衡且价格不变情况下的利率R与国民生产总值Y之间的线性关系,满足货币供应量L等于货币需求量M的基本关系,被称为“LM曲线”。而两条直线组成“1S一LM”模型,是分析种种经济政策的理论基础,其图形类似于徽观经济学中的“供需模型”。它们很好地揭示了政府通过财政政策或货币政策能实现宏观调控国家经济的机理。由于我国的经济、社会政治和历史环境与工业化国家存在着巨大差距,中国的经济学家和经济政策制订者无法直接引用国外现有的理论来制订中国的经济政策。一方面,经济学作为一门研究人类经济活动不变规律的科学,其基本原理应该是带有普遍性的,比如消费需求与可支配收入之间的正比关系、净出口与外币兑换率之间的反比关系等等,借鉴西方200多年总结出的知识,一定比自己从头摸索好。另一方面,数据被比喻为数量经济学的“粮食”;我国经济学家也要收集我国自己的经济数据,在数据分析上下大功夫,建立起能解决中国实际的经济模型,并用更多的真实数据去证实这些模型。

经济学家需要的数据来源有两方面:一方面是亲自调查收集,一方面是利用已发表的汇编材料。和自然科学等其他学科的研究工作者相比,经济学家较少收集原始数据,特别是在宏观经济问题的研究中,有关数据大多数来自政府机构所编辑出版的统计资料。我国经济学家的研究经费更是有限,既然有了政府有计划地阶段性地进行某种社会问题的调查,就宁可多做数据的分析工作而不亲自调查收集数据了。但是,任何已有数据都是为了某种特定目的而收集的,如果不是自己亲自收集的数据,就很难了解数据的质量。为了得到符合研究目的的高质量数据,或者检验已有数据的精确性,亲自收集数据有时是非常必要的。而均匀设计正好满足了以不高的代价获得高质量数据的需要,好像是生产其所需“粮食”的锄和犁。
五、计算机仿真的“佳侣”
现代统计学和计量经济模型都需要使用计算机求解,即使化难为易、化繁为简的均匀设计法安排的试验也需要计算机软件产生合适的均匀设计表和使用表;并对试验结果进行统计分析。笔者曾提出加速算法,用苹果机出现之前的微机,对照当年国防科委情报所
UN1VACll00大型机,计算过高维均匀点列,结果和理论上一致分布点列存在着高达20的20次幂的误差(7),曾引得方教授很振奋。最近读(1)才知,当年用的“均匀度”(8)偏差可能只是一个级数的主项。现在,朱尧辰等已给出了低维的精确的实用算法(9),且(1)中的计算都是据此编的程序获得。可见均匀设计自身的发展亦依仗计算技术的进步。现代经济学的文献浩如烟海,要消化并记住现代经济学中某些最重要的结论,洞悉市场机制解决社会经济问题的巨大能力和局限性;以此来指导经济学中每一个具体问题的计算机求解。计算机可以通过网络,从北京、上海,甚至美欧诸国,求索统计数据或经济信息。比如北京图书馆开辟电子阅览室,一位老教授通过目录索引发现自己需要的相关论文有数百篇,输入主题词后范围立即缩小到
30余篇,最终选出最有用的6篇,打印出来,前后只用了十几分钟;如果像往昔靠研究生人工查询,10个人两周也难把几百篇英文原文读完。网络的实时性比图书馆还好,计算机能够把现实运行过程中不断产生的新数据,及时地发送给研究人员。由于经济社会发展的快速和系统高度复杂性,我们不必要也不可能把各种时期产主的各种数据兼收并蓄,必须筛选,有所取亦有所不取。这时只有用均匀设计思想,才能进行最大比率的筛选。当前,国外应用“黑箱”方法,在称为“计算机试验设计”(
DCE)的方向,作了大量研究,但是由于将问题弄得很复杂,使DCE的结果失去了使用价值。所以采用“均匀设计”在“小样本”范围内进行计算机仿真(即形成DCE)探求用于社会经济宏观调控系统的可能性适逢其时。从“人”的角度来说,电脑进入千家万户,好像语文、数学扫文盲一样,扫了“机盲”,提高了计算机文化索质,同时,为计算机网络准备了终端用户。然而,学会了操作、打字、做算术,再该做什么呢?笔者认为,应该向他们推荐“均匀设计”法。
电脑的运用,有非结构化的应用和结构化的应用两种。非结构化的应用,只是把电脑当阅读器、打字机、计算器,节省人的体力和时间;而结构化的应用,是改造某-应用领域的结构、产生新的事物的智力再生过程。均匀设计试验法所需数据量不大,原理简明,有好的软件,养成习惯后,将在打开计算机时自自然然想到用它。特别是,社会经济现象是非试验性的、不可重复的,但是,我们可以在计算机上重现、在计算机上予以控制。计算机“仿真”,在已经知道的普遍规律指导下,用模拟数据产生试验表要求安排的参数大小,从有限个输入,产生需要的目标输出,而不管中间处理过程,把它看做一个“黑箱”,就能够做到在现实经济社会中不可能做到的事情。比如在化学实验中的“边界点”上,往往容易发生爆炸事件,而计算机仿真却不怕可以模拟出来的“爆炸”事件的发生。所以,均匀设计和计算机仿真结合成了一对经济社会问题研究的“佳侣”。
六、结语
总之,均匀设计是一种思想方法论,有广泛的普适性;从统计学的产生和发展可看出,社会经济领域从来就是统计学应用的主要方向,所以均匀设计必然要用到这一主要方向。均匀设计是“心中无数”的决策者的良方、特性“数量化”的利器、计量模型所需“粮食”的锄犁、计算机仿真的“佳侣”,在社会、经济中应用有重大意义和广阔前景。当然,均匀设计的这一应用还有待开拓,如误差估计和“最佳化”的论证…特别是还要用到其他的数学交叉来充实,如系统论和离散论等。
笔者想:如果没有整个数学的繁荣,均匀设计不可能一枝独秀。事实上,
30余位学部委员上书,强调数学的危机和重要性,呼吁必须优先发展,道出了一个震聋欲聋的论断:第一次世界大战打的是化学战(火药),第二次世界大战打的是物理战(火箭原子弹)。第三次海湾战争打的是数学战(仿真定位)(4)!笔者参加过巡航导弹原理的研究(7)。深深理解利用卫星四点精确定位的计算公式能节省多少自动导航所需的人力物力,怎能不为数学深藏的博大玄妙和蕴含的巨大能量而惊叹!正是在此背景下,才有今天均匀设计的盛会。话又说回来,均匀设计又为一个个的门类敞开了数学的大门。主要参考文献
(
1)方开泰(1994)《均匀设计与均匀设计表》科学出版社(
2)柯惠新等(1992),调查研究中的统计分析法 北京广播学院出版社(
3)宋健(1994).《中国软科学》蓝皮书 前言 华中理工大学出版社(
4)王梓坤等近30位学部委员(1993),《今日数学及其应用》咨询报告(
5)Fang.K.T.,Wang.Y.(1993). Number一Thcoretic methods in Statistics, Chapman and Ha1l, London。(
6)田国强、欧阳明等(1993),《大众市场经济学》《简明宏观经济学》等14本海外学人著作 上海人民出版社(
7)钱进(1983).均匀设计原理及自动实现HUST TERCOM No.020内部报告(
8)方开泰(1978)(1980).均匀设计(1)中参考文献(1)(2)(
9)Bundschuh.P and zhu.Y. C(朱尧辰)(1)中参考文献(17)