1978年~2002年中国失业多因素分析
(一)引言
在人的一生中失去工作可能是最悲惨的经济事件。大多数人依靠他们的劳动收入来维持生活水平,而且,许多人不仅从工作中得到收入,还得到个人的成就感。失去工作意味着生活水平降低,对未来的担忧及自尊心受到伤害。因此,毫不奇怪,政治家在竞选时往往谈到他们提出的政策将有助于创造工作岗位。
——N·曼昆
进入新世纪尤其是加入WTO以来,中国经济飞速发展。发展的同时,产生了诸多的问题。这些问题严重制约着中国经济和社会的进一步发展。失业即为其中之一。在我国,失业不仅是经济问题,更是社会问题。一方面,它影响着经济的增长;另一方面,它成为影响社会安定团结的隐忧。故在此,我们对1978年到2002年的失业进行多因素分析研究。
(二)基本阐述
失业人员是指在劳动年龄内有劳动能力,目前无工作,并以某种方式正在寻找工作的人员。包括就业转失业的人员和新生劳动力中未实现就业的人员。
《失业保险条例》所指失业人员只限定为就业转失业的人员。根据有关规定,我国目前的法定劳动年龄是16-60岁,体育、文艺和特种工艺单位按照国家规定履行审批程序后可以招用未满16周岁的未成年人。对企业中男年满60周岁、女年满50周岁的职工和机关事业单位中男年满60周岁、女年满55周岁的职工实行退休制度,对从事有毒、有害工作和符合条件的患病、因工致残职工可以降低退休年龄。按照上述规定,在法定劳动年龄内的人员都可以寻求职业,从事社会生产经营等活动,并取得合法收入。所谓有劳动能力,是指失业人员具有从事正常社会劳动的行为能力。在法定劳动年龄内的人员,若不具备相应的劳动能力,也不能视为失业人员,如精神病人、完全伤残不能从事任何社会性劳动的人员等。目前无工作并以某种方式寻找工作,是指失业人员有工作要求,但受客观因素的制约尚未实现就业。对那些目前虽无工作,但没有工作要求的人不能视为失业人员。
造成失业的原因是多方面的,具体到不同国家或一个国家的不同时期,其主导因素并不完全相同。国际上一般将失业原因分为非周期性失业和周期性失业两类。
其中非周期性失业包括:
*摩擦性失业,由于求职的劳动者与需要提供的岗位之间存在着时间上的差异而导致的失业,如新生劳动力找不到工作,工人想转换工作岗位时出现的工作中断等;
*季节性失业,由于某些行业生产条件或产品受气候条件、社会风俗或购买习惯的影响,使生产对劳动力的需求出现季节性变化而导致的失业;
*技术性失业,由于使用新机器设备和材料,采用新的生产工艺和新的生产管理方式,出现社会局部劳动力过剩而导致的失业;
*结构性失业,由于经济、产业结构变化以及生产形式、规模的变化,促使劳动力结构进行相应调整而导致的失业;
周期性失业,市场经济国家由于经济的周期性萎缩而导致的失业。
考虑到我国改革开放和市场经济建设时间较短,在这里,我们主要就非周期性失业进行研究。
(三)建立模型
其中,Y—全国失业总人数(万人) X1——净出口额(亿元) X2——第一产业产值(亿元)X3——第二产业产值(亿元) X4——第三产业产值(亿元) X5——全国总人口数(万人)
(注:假定各产业产值为该产业发展状况的标准)
数据说明:在选取影响因素时,通过以下两表对全国总人口数和全国经济活动人口数两个因素的分析,选取全国总人口数建立的模型较用全国经济活动人口数建立的模型对失业的影响更显著,故我们用全国总人口数建立模型。
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 20:27
Sample: 1978 2002
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C -381.7618 283.3334 -1.347394 0.1910
X5(全国总人口数) 0.007339 0.002489 2.948306 0.0072
R-squared 0.274276 Mean dependent var 450.2280
Adjusted R-squared 0.242723 S.D. dependent var 145.9440
S.E. of regression 127.0028 Akaike info criterion 12.60291
Sum squared resid 370983.6 Schwarz criterion 12.70042
Log likelihood -155.5364 F-statistic 8.692507
Durbin-Watson stat 0.168266 Prob(F-statistic) 0.007213
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 20:28
Sample: 1978 2002
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 84.33512 131.4987 0.641338 0.5276
X6(全国经济活动人口数) 0.006151 0.002168 2.837031 0.0093
R-squared 0.259229 Mean dependent var 450.2280
Adjusted R-squared 0.227022 S.D. dependent var 145.9440
S.E. of regression 128.3127 Akaike info criterion 12.62344
Sum squared resid 378675.5 Schwarz criterion 12.72095
Log likelihood -155.7930 F-statistic 8.048744
Durbin-Watson stat 0.176467 Prob(F-statistic) 0.009339
(四)模型的参数估计、检验及修正
模型的参数估计及其经济意义
用Eviews进行OLS估计得(见附表1)
Y= 3289.285-0.022757 X1 + 0.064077X2 -0.040653X3 +0.067632 X4 -0.029455X5
SE=849.7567 0.027917 0.035366 0.028096 0.035708 0.008695
t=3.870855 -0.815191 1.811828 -1.446936 1.894007 -3.387660
=0.814388 =0.765543 F=16.67282
可见,X1、X2、X3的t值都不显著,另外,修正可决系数为0.765543,F值为16.67282。故我们对上述模型进行计量经济学的检验,并进行修正,看是否能使模型方程得到改进。
计量经济学检验
(1)多重共线性检验及修正
用Eviews得相关系数矩阵表
X1 X2 X3 X4 X5
X1 1 0.868548443689 0.865263760672 0.853109875393 0.735277010146
X2 0.868548443689 1 0.984860483939 0.981281685729 0.940903856594
X3 0.865263760672 0.984860483939 1 0.997942133409 0.904329932875
X4 0.853109875393 0.981281685729 0.997942133409 1 0.916295325676
X5 0.735277010146 0.940903856594 0.904329932875 0.916295325676 1
有上表可以看出,各变量之间的相关系数均较大,说明模型存在较强的多重共线性。从经济意义上来看,进出口可能发生在各个产业中,并且各个产业间相互关联较大。
下面我们利用逐步回归法(变量剔除法)进行修正(见附表2,3,4)
因X1的t值最小,我们先将其剔除,得:
Y= 2999.091+ 0.051123X2-0.035967 X3 +0.062042X4 -0.026391X5
SE=765.0991 0.031328 0.027270 0.034749 0.007775
t=3.919872 1.631824 -1.318927 1.785453 -3.394557
= 0.807896 = 0.769475 F=21.02759
可见,X2,X3,X4的t值仍然很小,故将X3剔除继续作OLS估计得:
Y= 2147.867+0.015542X2+0.017020X4 -0.017662X5
SE=418.0825 0.016206 0.006612 0.004150
t=5.137423 0.958994 2.573946 -4.255825
=0.791187 = 0.761357 F=26.5228620
这时,X2的t值依然很小,故将X2剔除继续作OLS估计得
Y= 2147.867+0.022590X4 -0.015507X5
SE=362.1746 0.003155 0.003483
t=5.380492 7.159082 -4.452537
=0.782043 = 0.762228 F=39.46857
此时,修正可决系数开始下降,但所有参数的t值都已经比较显著,且F值也有了一定的增加,故不再删除变量,选择此模型为修正后的模型。
(2)异方差检验(见附表5、6)
用样本分段法进行检验。将样本分为两部分,对样本一(1978-1986)作估计得剩余平方和为14978.89,对样本二(1994-2002)作估计得剩余平方和为3763.823,两数值相除得F=3.9797<故不存在异方差性。
(3)自相关性检验及修正(见附表7,8,)
有附表4知DW=0.371489,在显著性水平α=0.01下,查表n=25,k’=2,dL=0.981 ,du=1.305
由于DW< dL=0.981,表明该模型中的误差序列存在一阶自相关.
下面用广义差分法进行修正,由DW=0.3715得=1-0.3715/2=0.81425,构造差分模型并估计,得:
DY=114.6561+0.017328DX4-0.003682DX5
SE=248.617 0.00719 0.012141
t= 0.461176 2.409974 -0.303271
=0.573740 =0.533144 F=14.13287 DW=1.00236
发现经过广义差分法修正后,DW值有所提高,但在不能判断的区域。故进一步用迭代法进行修正,得:
Y= 360.8702+0.016735X4-0.001531X5
SE=2151.529 0.008181 0.018534
t=0.167727 2.045622 -0.082626
=0.930446 =0.920013 F=89.18234 DW=1.018935
经迭代法修正后,DW值虽然又有所提高,但仍在不能判断的区域。当我们进一步做对数线性回归进行修正时,发现DW统计量反而变小,在现行知识水平下不能继续对其进行修正。
(五)模型的分析
我们进行了一系列检验和修正后的最终结果如下:
Y= 360.8702+0.016735X4-0.001531X5
SE=2151.529 0.008181 0.018534
t=0.167727 2.045622 -0.082626
=0.930446 =0.920013 F=89.18234 DW=1.018935
从模型中可看出:
(1)模型表明:失业与第三产业产值有明显的相关关系,与全国人口数无明显的相关关系。
(2)模型的修正可决系数及F值较高,说明模型总体是显著的,而且拟合优度很好。
(3)由于修正后不能确定是否存在自相关性,故模型在这一点上是不理想的。
(六)总结:
尽管影响失业的因素错综复杂,但经过我们的分析,第三产业产值同全国人口总数对失业具有较大影响。
我们的模型到最后仍不能解决自相关性的问题。经过分析,我们认为有以下几点原因:
在时间数列数据中,经济变量的运行往往存在着一种变化趋势,表现在随时间前后期相关关联上所形成的惯性。我国的经济发展从1978年走到2002年,其间经历了不同的经济、社会阶段。同时,我国的国情是:在这25年里,政府改革力度、市场开放程度、居民意识形态都是不断变革的。这样,许多制度和政策具用一定的惯性作用。
我们没有引入滞后变量,这可能会对模型产生一定影响。
一些随机偶然因素的干扰或影响也会造成该问题。许多社会经济变革难以量化其影响程度,例如98年的特大洪水、非典疫情、加入WTO、申奥成功等等。
我国的统计数据含有一定的水分,而导致了我们赖以进行参数估计的数字基础不具备可靠性,可能也是重要原因之一。
(七)附表
附表1
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 16:47
Sample: 1978 2002
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 3289.285 849.7567 3.870855 0.0010
X1 -0.022757 0.027917 -0.815191 0.4251
X2 0.064077 0.035366 1.811828 0.0858
X3 -0.040653 0.028096 -1.446936 0.1642
X4 0.067632 0.035708 1.894007 0.0736
X5 -0.029455 0.008695 0.0031
R-squared 0.814388 Mean dependent var 450.2280
Adjusted R-squared 0.765543 S.D. dependent var 145.9440
S.E. of regression 70.66720 Akaike info criterion 11.55940
Sum squared resid 94883.21 Schwarz criterion 11.85193
Log likelihood -138.4925 F-statistic 16.67282
Durbin-Watson stat 0.725028 Prob(F-statistic) 0.000002
附表2
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 18:14
Sample: 1978 2002
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 2999.091 765.0991 3.919872 0.0008
X2 0.051123 0.031328 1.631824 0.1184
X3 -0.035967 0.027270 -1.318927 0.2021
X4 0.062042 0.034749 1.785453 0.0894
X5 -0.026391 0.007775 -3.394557 0.0029
R-squared 0.807896 Mean dependent var 450.2280
Adjusted R-squared 0.769475 S.D. dependent var 145.9440
S.E. of regression 70.07204 Akaike info criterion 11.51378
Sum squared resid 98201.81 Schwarz criterion 11.75756
Log likelihood -138.9223 F-statistic 21.02759
Durbin-Watson stat 0.621812 Prob(F-statistic) 0.000001
附表3
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 18:17
Sample: 1978 2002
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 2147.867 418.0825 5.137423 0.0000
X2 0.015542 0.016206 0.958994 0.3485
X4 0.017020 0.006612 2.573946 0.0177
X5 -0.017662 0.004150 -4.255825 0.0004
R-squared 0.791187 Mean dependent var 450.2280
Adjusted R-squared 0.761357 S.D. dependent var 145.9440
S.E. of regression 71.29525 Akaike info criterion 11.51718
Sum squared resid 106743.3 Schwarz criterion 11.71220
Log likelihood -139.9648 F-statistic 26.5228620
Durbin-Watson stat 0.382176 Prob(F-statistic) 00000
附表4
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 18:17
Sample: 1978 2002
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C 1948.678 362.1746 5.380492 0.0000
X4 0.022590 0.003155 7.159082 0.0000
X5 -0.015507 0.003483 -4.452537 0.0002
R-squared 0.782043 Mean dependent var 450.2280
Adjusted R-squared 0.762228 S.D. dependent var 145.9440
S.E. of regression 71.16496 Akaike info criterion 11.48004
Sum squared resid 111417.9 Schwarz criterion 11.62631
Log likelihood -140.5006 F-statistic 39.46857
Durbin-Watson stat 0.371489 Prob(F-statistic) 0.000000
附表5
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 18:30
Sample: 1978 1986
Included observations: 9
Variable Coefficient Std. Error t-Statistic Prob.
C 5281.461 1107.651 4.768166 0.0031
X4 0.086872 0.058476 1.485594 0.1879
X5 -0.049443 0.011682 -4.232279 0.0055
R-squared 0.902139 Mean dependent var 385.3333
Adjusted R-squared 0.869518 S.D. dependent var 138.3215
S.E. of regression 49.96480 Akaike info criterion 10.92172
Sum squared resid 14978.89 Schwarz criterion 10.98746
Log likelihood -46.14772 F-statistic 27.65568
Durbin-Watson stat 1.424570 Prob(F-statistic) 0.000937
附表6
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 18:31
Sample: 1994 2002
Included observations: 9
Variable Coefficient Std. Error t-Statistic Prob.
C 10485.87 3528.489 2.971774 0.0249
X4 0.050572 0.013494 3.747685 0.0095
X5 -0.089728 0.031064 -2.888521 0.0277
R-squared 0.937998 Mean dependent var 590.8444
Adjusted R-squared 0.917331 S.D. dependent var 87.10969
S.E. of regression 25.04603 Akaike info criterion 9.540510
Sum squared resid 3763.823 Schwarz criterion 9.606251
Log likelihood -39.93229 F-statistic 45.38548
Durbin-Watson stat 1.691186 Prob(F-statistic) 0.000238
附表7
Dependent Variable: DY
Method: Least Squares
Date: 11/07/04 Time: 18:46
Sample(adjusted): 1979 2002
Included observations: 24 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 114.6561 248.6170 0.461176 0.6494
DX4 0.017328 0.007190 2.409974 0.0252
DX5 -0.003682 0.012141 -0.303271 0.7647
R-squared 0.573740 Mean dependent var 91.15495
Adjusted R-squared 0.533144 S.D. dependent var 59.86613
S.E. of regression 40.90465 Akaike info criterion 10.37683
Sum squared resid 35136.99 Schwarz criterion 10.52409
Log likelihood -121.5220 F-statistic 14.13287
Durbin-Watson stat 1.002360 Prob(F-statistic) 0.000129
附表8
Dependent Variable: Y
Method: Least Squares
Date: 11/07/04 Time: 18:48
Sample(adjusted): 1979 2002
Included observations: 24 after adjusting endpoints
Convergence achieved after 9 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C 360.8702 2151.529 0.167727 0.8685
X4 0.016735 0.008181 2.045622 0.0542
X5 -0.001531 0.018534 -0.082626 0.9350
AR(1) 0.837636 0.135228 6.194266 0.0000
R-squared 0.930446 Mean dependent var 446.9042
Adjusted R-squared 0.920013 S.D. dependent var 148.1131
S.E. of regression 41.88930 Akaike info criterion 10.45895
Sum squared resid 35094.27 Schwarz criterion 10.65529
Log likelihood -121.5074 F-statistic 89.18234
Durbin-Watson stat 1.018935 Prob(F-statistic) 0.000000
Inverted AR Roots .84
相关数据,其中,Y—全国失业总人数(万人) X1——净出口额(亿元) X2——第一产业产值(亿元)X3——第二产业产值(亿元) X4——第三产业产值(亿元) X5——全国总人口数(万人)
obs Y X1 X2 X3 X4 X5
1978 530 -19.8 1018.4 1745.2 860.5 96259
1979 567.6 -30.912 1258.9 1913.5 865.8 97542
1980 541.5 -27.6 1359.4 2192 966.4 98705
1981 439.5 -0.171 1545.6 2255.5 1061.3 100072
1982 379.4 57.346 1761.6 2383 1150.1 101654
1983 271.4 16.596 1960.8 2646.2 1327.5 103008
1984 235.7 -29.553 2295.5 3105.7 1769.8 104357
1985 238.5 -448.9 2541.6 3866.6 2556.2 105851
1986 264.4 -123.053 2763.9 4492.7 2945.6 107507
1987 276.6 -140.696 3204.3 5251.6 3506.6 109300
1988 296.2 -288.463 3831 6587.2 4510.1 111026
1989 377.9 -248.497 4228 7278 5403.2 112704
1990 383.2 411.5 5017 7717.4 5813.5 114333
1991 352.2 428.4 5288.6 9102.2 7227 115823
1992 363.9 233 5800 11699.5 9138.6 117171
1993 420.1 -701.4 6882.1 16428.5 11323.8 118517
1994 476.4 461.7 9457.2 22372.2 14930 119850
1995 519.6 1403.7 11993 28537.9 17947.2 121121
1996 552.8 1019 13844.2 33612.9 20427.5 122389
1997 576.8 3354.2 14211.2 37222.7 23028.7 123626
1998 571 3605.5 14552.4 38619.3 25173.5 124701
1999 575 2423.3 14472 40557.8 27037.7 125786
2000 595 1996.2 14628.2 44935.3 29904.6 126743
2001 681 1864.9 15411.8 48750 33153 127627
2002 770 2513.8 16117.3 53540.7 35132.6 128453
(八)参考文献
1李长风,《经济计量学》,上海财经大学出版社
2《中国统计年鉴》2003年
3中国国家统计局网站