影响农民收入的因素分析
内容摘要:
本文根据我国从1989年到2003年的农业相关数据和资料,采用计量经济学的原理和方法,对影响农民收入的因素作出分析和验证。依照经济学原理和我国的实际情况,选取农民人均年纯收入作为应变量,国家的农业税收,农业贷款等七大因素作为解释因素(不全为解释变量),做回归分析,得出一些结论,也发现一些问题。
由于水平有限,文中难免存在纰漏和难以解决的问题,敬请老师同学批评指导。
关键词:农民收入
对农民征收的农业税
农业贷款
农业人口比重
农业贷款农价指数
农业基本建设支出
导论:
经过农村改革20多年的发展,中国农业和农村经济发展进入了新阶段,农业和农村经济中的一些深层次的矛盾和问题也日益凸显出来。这些矛盾和问题集中起来,最突出的表现就是农产品价格持续低迷,农民收入增速减缓,缺乏新的增长点以及由此引发的农村有效需求不足、消费品市场疲软等。如何解决这些矛盾和问题将直接影响到我国经济的持续、稳定、健康地发展,将直接关系到全面建设农村小康社会的进程。因此,必须针对中国农业和农村经济已经进入一个新的发展阶段的特点,研究和确定在新的发展阶段实现农民收入稳步增长的政策措施。
一、模型设定
通过参考诸多相关文献,结合中国农业发展状况,选取农业税收,农业贷款,国家财政对农业基本建设的支出,农副产品收购价指数,农业人口比重作为影响农民收入的因素,考虑建立如下模型:Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+u
其中:Y代表农民收入(农村居民家庭平均每人纯收入)
X1代表对农民征收的农业税
X2代表农业人口比重
X3代表农业贷款
X4代表农价指数
X5代表农业基本建设支出
obs X1(亿元) X2(%) X3(亿元) X4(%) X5(亿元) Y(元)
1989 84.94000 79.24000 1037.000 115.0000 50.64000 601.5000
1990 87.86000 79.35000 1038.080 97.40000 66.71000 686.3100
1991 90.65000 79.33000 1568.600 98.00000 75.49000 710.0000
1992 119.1700 77.70000 1678.200 103.4000 85.00000 783.9900
1993 125.7400 75.14000 1720.230 113.4000 95.00000 921.6200
1994 231.4900 73.20000 1143.900 139.9000 107.0000 1220.980
1995 278.0900 71.79000 1554.800 119.9000 110.0000 1577.740
1996 369.4600 71.23000 1919.100 104.2000 141.5100 1926.070
1997 397.4800 70.57000 3314.600 95.50000 159.7800 2090.130
1998 398.8000 70.27000 4444.200 92.00000 460.7000 2161.980
1999 423.5000 70.18000 4792.400 87.80000 357.0000 2210.340
2000 465.3100 68.38000 4889.000 99.90000 414.4600 2253.420
2001 481.7000 67.29000 5711.500 100.8000 480.8100 2366.400
2002 717.8500 65.92000 6884.600 99.70000 423.8000 2475.630
2003 871.7700 63.83000 8411.400 104.4000 527.3600 2622.240
用e-views拟和,发现为满足农业税收的负效应,和农业贷款以及农副产品收购价指数的正效应,同时考虑到各个因素之间的相关性和替代效应,所以把X3,X4剔除了,模型重新设定为Y=β0+β1X1+β2X2+β5X5+u。值得指出的是,舍弃农业贷款和价格指数做为解释变量并不是否定它们对农民收入的影响作用,而是为使模型符合基本经济学意义而作出的权衡之举。更进一步的分析,详见后面的“经济意义解释和存在的问题”
序列的平稳性
我们分别对Y,X1 ,X2 ,X5数据做单位根检验,得出的结果是Y序列是零阶平稳的序列,X1序列是二阶平稳的序列,X2序列是零阶平稳的序列,而X5序列是一阶平稳的序列。
经济变量间的因果性
对此,我们利用了EVIEWS软件对Y与X1,Y与X2,Y与X5分别做了Granger因果关系检验,得出了X1,X2,X5都是引起Y变化的原因。
协整性检验
同样,我们分别对Y与X1,Y与X2,Y与X5做了协整性检验,构筑残差序列,所得的残差序列也是平稳的,因此我们得出了Y与X1,Y与X2,Y与X5之间都存在协整。但是由于Y,X1 ,X2 ,X5并不全是一阶差分的平稳数列,因此我们无法做出误差校正模型。
二、参数估计
对数据做回归估计得
Dependent Variable: Y
Method: Least Squares
Date: 06/12/05 Time: 15:52
Sample: 1989 2003
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C 11102.32 2737.717 4.055320 0.0019
X1 -0.238251 0.732425 -0.325291 0.7511
X2 -132.2165 3454.468 -3.827405 0.0028
X5 0.715865 0.589813 1.213717 0.2503
R-squared 0.947381 Mean dependent var 1640.557
Adjusted R-squared 0.933031 S.D. dependent var 743.0822
S.E. of regression 192.2982 Akaike info criterion 13.57915
Sum squared resid 406764.6 Schwarz criterion 13.76796
Log likelihood -97.84363 F-statistic 66.01685
Durbin-Watson stat 0.783004 Prob(F-statistic) 0.000000
Y=11102.32-0.238251X1-132.2165X2+0.715865X5+u
t=(4.055320)(-0.325291)(-3.827405)(1.213717)
R2=0.947381
三、模型检验及修正
1.经济意义检验
从上表中可以看出,各指标符号与先验信息相符,所估计结果没有与经济原理向悖,说明具有经济意义。
2.统计推断检验
从回归结果可以看出,模型的拟和优度还可以(R2=0.947381),F统计量的值在给定显著性水平α=0.05的情况下也较显著,但是X1、X5的t统计值均不显著(X1、X5的t统计量的值的绝对值均小于2),说明X1、X5这两个变量对Y的影响不显著,或者变量之间存在多重共线的影响使其t值不显著。
3.计量经济学检验
(1)多重共线性检验
由F=66.01685>F0.05 (3,12)=3.49(显著性水平α=0.05)表明模型从整体上看农民收入与解释变量间线形关系显著。
这里采用简单相关系数矩阵法对其进行检验
X1 X2 X5
X1 1.000000 -0.950992 0.864457
X2 -0.950992 1.000000 -0.865260
X5 0.864457 -0.865260 1.000000
可以看出X1 X2高度相关
修正:采用逐步回归法对其进行补救。
根据以上分析,由于X2的的值最大, =0.935745,线形关系强,拟合程度最好,因此把X2作为基本变量。然后将其余解释变量逐一代入X2的回归方程,重新回归。分析可得:
加入X5, 对方程回归之后得到对X5的t值不显著,统计检验t=1.215476,
但是=0.9380208大于原来的值,因此把X2 X5作为基本变量,再加入X1进行回归。
加入X1进行回归后,其t=-0.325291,同样不显著。且值并没有原来的大,但是我们不应该轻易的舍弃变量。
(2)异方差检验
根据赤池最小准则,许瓦兹最小准则选择滞后的阶数
先利用WHITE检验法检验模型是否存在异方差。
White Heteroskedasticity Test:
F-statistic 1.288952 Probability 0.359748
Obs*R-squared 7.373064 Probability 0.287719
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/14/05 Time: 14:23
Sample: 1989 2003
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C -8834542. 7011957. -1.259925 0.2432
X1 -333.1011 494.4552 -0.673673 0.5195
X1^2 0.500170 0.371184 1.347499 0.2147
X2 245692.2 183016.6 1.342458 0.2163
X2^2 -1690.522 1196.180 -1.413268 0.1953
X5 139.2546 685.4745 0.203151 0.8441
X5^2 -0.333421 1.170543 -0.284843 0.7830
R-squared 0.491538 Mean dependent var 27117.64
Adjusted R-squared 0.110191 S.D. dependent var 31433.64
S.E. of regression 29651.26 Akaike info criterion 23.73712
Sum squared resid 7.03E+09 Schwarz criterion 24.06754
Log likelihood -171.0284 F-statistic 1.288952
Durbin-Watson stat 2.668171 Prob(F-statistic) 0.359748
从检验结果来看,t值都小于2,并且,p值很大,因此应该接受原假设,即不存在异方差。
再用ARCH检验来对模型进行检验。
ARCH Test:
F-statistic 0.063771 Probability 0.804905
Obs*R-squared 0.074007 Probability 0.785590
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/14/05 Time: 14:25
Sample(adjusted): 1990 2003
Included observations: 14 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 27084.75 11478.97 2.359509 0.0361
RESID^2(-1) 0.071675 0.283828 0.252530 0.8049
R-squared 0.005286 Mean dependent var 28940.35
Adjusted R-squared -0.077607 S.D. dependent var 31786.98
S.E. of regression 32997.38 Akaike info criterion 23.77781
Sum squared resid 1.31E+10 Schwarz criterion 23.86910
Log likelihood -164.4447 F-statistic 0.063771
Durbin-Watson stat 2.016553 Prob(F-statistic) 0.804905
从检验结果来看,t值小于2,不显著,p值很大,因此应该接受原假设,即不存在异方差。
(3)自相关检验
检验
从模型设定来看,没有违背D-W检验的假设条件,因此可以用D-W检验来检验模型是否存在一阶自相关。根据估计的结果,
DW=0.783004 给定显著性水平α=0.05,查Durbin-Watson表,k’=3 n=15 dL=0.814 dU=1.750 ,存在一阶正的自相关。
修正
通过对模型逐一运用广义差分法,Cochrane-Crcutt迭代法,对数线形回归法,以及迭代法与对数线形回归法相结合的方法
最后发现,对数线形回归法能最好的修正一阶自相关。
Dependent Variable: LY
Method: Least Squares
Date: 06/15/05 Time: 08:48
Sample: 1989 2003
Included observations: 15
Variable Coefficient Std. Error t-Statistic Prob.
C -15.21582 10.79342 -1.409731 0.1863
LX1 0.911356 0.193177 4.717723 0.0006
LX2 3.937095 2.267030 1.736675 0.1103
LX5 0.110462 0.078607 1.405239 0.1876
R-squared 0.974195 Mean dependent var 7.281398
Adjusted R-squared 0.967157 S.D. dependent var 0.540289
S.E. of regression 0.097914 Akaike info criterion -1.586277
Sum squared resid 0.105459 Schwarz criterion -1.397464
Log likelihood 15.89708 F-statistic 138.4255
Durbin-Watson stat 1.801046 Prob(F-statistic) 0.000000
DW值=10801046,落在无一阶自相关的区域。故改进后的模型没有一阶自相关。
但是由于lx1的系数不符合先验信息,故保留原模型
Y=11102.32-0.238251X1-132.2165X2+0.715865X5+u
t=(4.055320)(-0.325291)(-3.827405)(1.213717)
R2=0.947381
四、模型的经济意义解释
(1)从模型的回归结果来看,农业人口的比重(x2)是影响农民收入的最显著的因素,而其符号为负,说明其反效应。这点与我国农业的现状非常吻合,即:务农人口随农业耕地面积不足而下降,城镇吸纳着大量的农民劳动力,他们的成为农民收入的重要来源。
(2)国家财政对农业基本建设的投入(x5)在模型中享有很高的正系数(0.715865),但是t值不显著。关于这一点,我们可以尝试从以下两个方面来解释:一方面,t的不显著说明,国家对农业的投入总体上转化成农民收入的效率不够。(造成现有投入效益不明显的原因可能是政府对农业的投入大多在基础设施,而基础设施具有社会性,资金没有最大化的流入农业部门,并且,农业基础设施投入滞后,造成资金运作效果欠佳。)另一方面,很高的正效应表明,农业人口中,有一部分人的收入与政府的投入有着很强的依赖性,确实存在着财政投入的收益者。
(3)农业税收在对农民收入的负效应不显著的原因也可以从两个方面理解,第一,在样本的时间范围内,国家对农业税收作出了很多调整,这有可能影响了数据的性质;第二,既然从x2的信息中我们得知,农民收入对务农的依赖性在降低,那么,农业税收对其的影响也势必降低。而相关的其他税收种类将影响着农民收入。
存在的问题
(1)样本的采集不够合理。体现在:样本数量不够大,样本的性质不够统一(这是受实际操作中的数据来源所制约的)
(2)模型没有异放方差,但是存在自相关,虽然可以修正,但是修正后的模型就不再满足基本的经济意义了。(x1的系数为正)
(3)解释变量的不充分利用。最初的模型包含着5个变量,但是舍弃了x3 (农业贷款)和(x4农价指数),虽然使模型具有了先验意义,但是剩下的变量只能解释x3 x4 一部分影响,而不是全部影响。x3x4的退出就使得x1系数有意义,x1与x3x4之间可能会有某种替代关系,具体什么,我们无从知道。
五、政策建议
农民收入问题是一个长期的综合性的问题,我们的工作只是从一个角度量化了这个问题的因果关系,一定程度上反映了我国农业上现状和问题
也形成了自己的改革方案:
(1)合理化农业结构与农村劳动力并行。非农人口的增长虽然在短期内给农民增加了收入,但是其带来的社会问题日益明显,并且,农村务农人口的过度减少会使农业的基础遭到破坏。所以必须加大农业的生产,吸纳正常比例的劳动力,这样才能从根本上稳定农民的收入
(2)减少农业税收和增加农业补贴并行。为了减轻农民负担,近年来,许多地区开始改革农村税费制度。从试点情况看,税费改革后,对农民减负确实有一定作用。但税费改革进一步削弱了地方政府的收入,堵死了地方政府通过非规范手段从农民身上征收收入的渠道,因而,这项改革在实践中遇到了强大的阻力。农村税费改革涉及到方方面面的配套改革,特别是需要完善财政转移支付制度,保证贫困地区基本公共需要。
(3)增加对农业的基建投入与完善金融支持并行。健全的金融体制可以提高资金的利用率,使的国家对农业的投入最的化的用在农业上。
附录:
ADF Test Statistic -2.041785 1% Critical Value* -2.9677
5% Critical Value -1.9890
10% Critical Value -1.6382
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X1,3)
Method: Least Squares
Date: 06/15/05 Time: 11:31
Sample(adjusted): 1996 2003
Included observations: 8 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
D(X1(-1),2) -3.952720 1.935913 -2.041785 0.1338
D(X1(-1),3) 2.332637 1.825397 1.277879 0.2912
D(X1(-2),3) 2.483238 1.524530 1.628855 0.2018
D(X1(-3),3) 2.716205 1.208655 2.247296 0.1102
D(X1(-4),3) 1.523530 0.688070 2.214208 0.1137
R-squared 0.904389 Mean dependent var -2.885000
Adjusted R-squared 0.776908 S.D. dependent var 160.1041
S.E. of regression 75.62137 Akaike info criterion 11.75853
Sum squared resid 17155.77 Schwarz criterion 11.80818
Log likelihood -42.03410 Durbin-Watson stat 1.549197
ADF Test Statistic -3.174707 1% Critical Value* -4.8870
5% Critical Value -3.8288
10% Critical Value -3.3588
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X2)
Method: Least Squares
Date: 06/15/05 Time: 11:32
Sample(adjusted): 1991 2003
Included observations: 13 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
X2(-1) -0.583030 0.183648 -3.174707 0.0113
D(X2(-1)) 0.731305 0.214746 3.405444 0.0078
C 46.82761 14.98021 3.125965 0.0122
@TREND(1989) -0.637363 0.204613 -3.114968 0.0124
R-squared 0.632937 Mean dependent var -1.193846
Adjusted R-squared 0.510583 S.D. dependent var 0.814172
S.E. of regression 0.569581 Akaike info criterion 1.959830
Sum squared resid 2.919806 Schwarz criterion 2.133660
Log likelihood -8.738892 F-statistic 5.172982
Durbin-Watson stat 2.457944 Prob(F-statistic) 0.023781
ADF Test Statistic -3.100689 1% Critical Value* -4.1366
5% Critical Value -3.1483
10% Critical Value -2.7180
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(X5,2)
Method: Least Squares
Date: 06/15/05 Time: 11:33
Sample(adjusted): 1992 2003
Included observations: 12 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
D(X5(-1)) -1.753011 0.565362 -3.100689 0.0127
D(X5(-1),2) 0.189985 0.340173 0.558494 0.5901
C 61.22057 33.07359 1.851041 0.0972
R-squared 0.740570 Mean dependent var 7.898333
Adjusted R-squared 0.682919 S.D. dependent var 168.1411
S.E. of regression 94.68015 Akaike info criterion 12.15120
Sum squared resid 80678.97 Schwarz criterion 12.27243
Log likelihood -69.90722 F-statistic 12.84573
Durbin-Watson stat 1.956846 Prob(F-statistic) 0.002307
ADF Test Statistic -4.136135 1% Critical Value* -5.1152
5% Critical Value -3.9271
10% Critical Value -3.4104
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(Y,2)
Method: Least Squares
Date: 06/15/05 Time: 11:34
Sample(adjusted): 1993 2003
Included observations: 11 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
D(Y(-1)) -0.896985 0.216866 -4.136135 0.0061
D(Y(-1),2) 0.461673 0.204438 2.258252 0.0647
D(Y(-2),2) 0.581961 0.276255 2.106606 0.0797
C 244.9544 73.74035 3.321850 0.0160
@TREND(1989) -11.05070 5.551833 -1.990460 0.0937
R-squared 0.820398 Mean dependent var 6.601818
Adjusted R-squared 0.700663 S.D. dependent var 90.78995
S.E. of regression 49.67271 Akaike info criterion 10.95174
Sum squared resid 14804.27 Schwarz criterion 11.13260
Log likelihood -55.23459 F-statistic 6.851797
Durbin-Watson stat 2.225803 Prob(F-statistic) 0.020052
Pairwise Granger Causality Tests
Date: 06/15/05 Time: 11:35
Sample: 1989 2003
Lags: 2
Null Hypothesis: Obs F-Statistic Probability
X1 does not Granger Cause Y 13 0.31809 0.73633
Y does not Granger Cause X1 3.20008 0.09526
Pairwise Granger Causality Tests
Date: 06/15/05 Time: 11:37
Sample: 1989 2003
Lags: 2
Null Hypothesis: Obs F-Statistic Probability
X2 does not Granger Cause Y 13 19.8361 0.00079
Y does not Granger Cause X2 1.40845 0.29919
Pairwise Granger Causality Tests
Date: 06/15/05 Time: 11:42
Sample: 1989 2003
Lags: 2
Null Hypothesis: Obs F-Statistic Probability
X1 does not Granger Cause Y 13 0.31809 0.02521
Y does not Granger Cause X1 3.20008 0.09526
Pairwise Granger Causality Tests
Date: 06/15/05 Time: 11:44
Sample: 1989 2003
Lags: 2
Null Hypothesis: Obs F-Statistic Probability
X5 does not Granger Cause Y 13 1.60492 0.00126
Y does not Granger Cause X5 15.5231 0.00176
ADF Test Statistic -4.136135 1% Critical Value* -5.1152
5% Critical Value -3.9271
10% Critical Value -3.4104
*MacKinnon critical values for rejection of hypothesis of a unit root.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(Y,2)
Method: Least Squares
Date: 06/15/05 Time: 11:46
Sample(adjusted): 1993 2003
Included observations: 11 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
D(Y(-1)) -0.896985 0.216866 -4.136135 0.0061
D(Y(-1),2) 0.461673 0.204438 2.258252 0.0647
D(Y(-2),2) 0.581961 0.276255 2.106606 0.0797
C 244.9544 73.74035 3.321850 0.0160
@TREND(1989) -11.05070 5.551833 -1.990460 0.0937
R-squared 0.820398 Mean dependent var 6.601818
Adjusted R-squared 0.700663 S.D. dependent var 90.78995
S.E. of regression 49.67271 Akaike info criterion 10.95174
Sum squared resid 14804.27 Schwarz criterion 11.13260
Log likelihood -55.23459 F-statistic 6.851797
Durbin-Watson stat 2.225803 Prob(F-statistic) 0.020052
滞后
Dependent Variable: Y
Method: Least Squares
Date: 06/15/05 Time: 11:28
Sample(adjusted): 1990 2003
Included observations: 14 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 4586.606 1177.515 3.895158 0.0036
X1 -0.238249 0.250937 -0.949439 0.3672
X2 -55.29199 14.58694 -3.790513 0.0043
X5 -0.707172 0.249441 -2.835026 0.0196
Y(-1) 0.864233 0.091855 9.408643 0.0000
R-squared 0.994319 Mean dependent var 1714.775
Adjusted R-squared 0.991795 S.D. dependent var 711.1011
S.E. of regression 64.41353 Akaike info criterion 11.44098
Sum squared resid 37341.92 Schwarz criterion 11.66921
Log likelihood -75.08684 F-statistic 393.8381
Durbin-Watson stat 2.131358 Prob(F-statistic) 0.000000
对解释变量Y,X1 ,X3 ,X5和Y滞后一阶进行回归,其结果显示,T检验值、F检验值和R² 都显著,除了解释变量X1的T值较小。它的T值为-0.949439,绝对值都小于2,不显著。
H =(1-d/2)*√¯[n/1-n*Var(ß1*)]
=(1-2.131358/2) *√¯[14/(1-14*0.091855²)]
=-0.065679*√¯[14/(1-0.11812277435)]
=-0.065679*√¯[14/0.88187722565]
=-0.2617
在显著性水平为a=0.05上,查标准正态分布表地临界值h(a/2)=1.96,由于|h |=0.2617<h(a/2),所以接受原假设p=0,说明自回归模型不存在一阶自相关。