农业总产值相关因素的分析
一、问题的提出
随着我国改革开放的深入,近几年我国经济一直有着快速稳定的发展,但对外贸易和出口不断扩大的同时,农业问题一直都是政府工作中的重中之重,能否解决我国的农业问题,对于我国经济的长远发展有着重要的战略意义。因此对于农业总产值的问题的研究,以及与农业总产值相关的因素的分析显示出重要的作用。
二、解释变量的确定
影响农业总产量的因素可分为生产要素对产量的影响以及生产要素之间的配合比例对产量的影响两个方面。第一方面又可分为农机机械总动力和农业劳动力数量两部分;第二方面又可分为单位面积产量和作物播种面积两部分。以上所述因素都是众多影响农业总产量因素中具有决定意义和有代表性的重要因素,将这些因素设定为解释变量将有助于对问题的分析,进一步保证模型以及由模型所分析的结果能够有效的说明农业总产量的影响因素,从而更具有实际意义,便于应用于实际,更好的农业的发展服务。
三、模型的设定
采用多元回归模型对农业总产量及其相关因素进行数量分析。模型设定如下:
Y=β1+β2X1+β3X2+β4X3+β5X4 +ui
其中:
Y——农业总产值(亿元)
β1——模型的截距项
X1——农机机械总动力(万千瓦)
X2——单位面积产量(公斤/公顷)
X3——作物播种面积(千公顷)
X4——农业劳动力数量(万人)
四、资料的收集
名 称 X1(万千瓦) X2(公斤/公顷) X3(千公顷) X4(万人) Y(亿元)
北京 395 5194 386.4 67.9 89.7
天津 603.3 4820 544.5 81 86.7
河北 2744.4 4025 8990.8 1665 899.4
山西 1767.5 2806 3672.3 658 191.3
内蒙古 1423.6 3854 5707.3 518.4 307.6
辽宁 1401.3 4891 3964.8 649 503.1
吉林 1096.5 5125 4890.1 514.3 405.9
黑龙江 1648.3 4512 9989.2 742.5 540.6
上海 133.9 7320 490.9 83.2 95.5
江苏 2957.9 6302 7777.4 1452.3 1142.7
浙江 2017.2 6082 3245.9 985.1 529.5
安徽 3165 4829 8733.1 1975.6 688
福建 888.8 5089 2713.1 760.4 433.2
江西 1002 5233 5534.7 977.4 405.9
山东 7689.6 5268 11266.1 2434.3 1401.3
河南 6078.7 4907 13127.7 3472.3 1331.6
湖北 1469.2 5885 7489 1143.7 658.3
湖南 2358 6015 7931.7 2058.7 665.7
广东 1760.2 5360 5193.1 1566.4 817.9
广西 1552.4 4656 6288.1 1555.1 439.9
海南 212.2 4169 871.7 179.9 141.3
重庆 628.1 4448 3555.9 884.6 250.4
四川 1735.1 4759 9571.5 2582.6 769.9
贵州 647.9 4236 4650.7 1368.3 279.9
云南 1397.8 3923 5929.6 1689.4 431.3
西藏 123.2 5044 230.9 88.8 27.6
陕西 1099.8 3095 4331.9 985.9 337.4
甘肃 1122 2905 3688.9 696.8 254
青海 264.7 3361 529 141.6 28.9
宁夏 407.6 4044 1007.6 151.7 49.4
新疆 880.9 5771 3404.1 321 348.8
(资料来源:中国统计信息网,2002年《中国统计年鉴》电子版)
五、模型估计及检验
一、初次回归分析
根据此图显示:
Y=-281.2500582+0.1001383488*X1+0.06753579048*X2+0.03802983617*X3+0.07042103951*X4
取显著性水平a=0.05,有ta/2(n-5)=t0.025(26)=2.056。可知,有|tβ5|=1.291434< t0.025(26),从来接受H0:β5=0,即X4的系数β5没有通过t检验。其余常数项β1、 X1的系数β2、X2的系数β3、X3的系数β4均通过t检验。
取显著性水平a=0.05,查F分布表可得F0.05(k-1,n-k)=F0.05(4,26)=2.74。回归方程的F统计量F=68.41460,大于2.74,从而拒绝H0,说明从整体上看解释变量与被解释变量之间的线性关系显著。
二、多重共线性检验
从上一步结果看,X4系数不显著。下面进行多重共线性检验:
1、采用简单相关系数矩阵法进行检验,结果如下图:
可见,X1与X4、X1与X3、X3与X4之间存在较严重的线性相关性。
2、对多重共线性进行修正
调整的基本思路大约为:
先用Y分别对各解释变量进行单独回归,找出其中调整可决系数最大的解释变量作为第一次调整保留的变量;以此变量为基础再分别对剩下的解释变量进行二元回归,找出一个比第一次调整可决系数大的变量作为要保留的解释变量(如有几个变量的调整可决系数比第一次保留解释变量的调整可决系数都大,那么就选择其中系数最大的那一个);以此类推,直到全部新的调整可决系数比上一次最大的要小,从而确定模型的基本解释变量。
通过Eviews3.1计算可得,第一次单独回归,结果如下表:
X1 X2 X3 X4
调整可决系数 0.787296 0.052643 0.766636 0.717077
于是,保留X1,再继续做二元回归:
X2 X3 X4
调整可决系数 0.813386 0.862852 0.844132
保留X3,接着是做三元回归:
X2 X4
调整可决系数 0.897410 0864426
应保留X2,从而已有X1、X2、X3。
但是,这个调整可决系数要小于最一开始的四元回归时的调整可决系数0.899886。但因为那种情况下X4始终无法通过t检验。因此,删去X4,保留X1、X2、X3是一个比较理想的组合。
剔除X4后,新模型的回归结果:
三、异方差性检验
以上资料均为截面资料,故没有使用ARCH检验的需要。White检验(无交叉项)检验如下:
a=0.05下,χ0.052(6)=12.5916。图中,Obs*R-squared=9.007823<12.5916。表明随机误差u不存在逆方差。
四、自相关性检验
已经当前模型的D-W值为2.666422,查表可得,在a=0.05水平下,dL=1.229,dU=1.650(n=31,k’=3),4- dU<D-W<4-dL,落入了无法确定的区域,需要修正。
使用Cochrane-Orcutt迭代法,Eviews 3.1中,计算结果如下图:
修正后D-W值为2.291942,落入(dU,4- dU)区域,表明一阶自相关不存在,情况有明显的改善。
五、确定结果
经过一番努力,最终确定的结果为
Y=-284.307529+0.1105181268*X1+0.07194175029*X2+0.046101934*X3+[AR (1)=-0.3584359171]
(82.2177) (0.01953) (0.017334) (0.009963) (0.189106)
t= (-3.457984) (5.658826) (4.150355) (4.627321) (-1.895419)
R2=0.916404 adj-R2=0.903029 F=68.51429 D-W=2.291942
R2=0.916404 adj-R2=0.903029,说明模型拟合程度较好。取a=0.05,则ta/2(n-5)=t0.025(25)=2.060,常数项、三解释变量系数均通过t检验。取a=0.05,F0.05(k-1,n-k)=F0.05(4,25)=2.74,模型F值为68.51429,显然大于2.74,从而可以说明整体上解释变量与被解释变量关系显著。并且从上面的分析中可知,模型通过多重共线性检验、异方差性检验以及自相关性检验。从实际上看,我国农村生产力不发达,生产力结构不完善,众多的农村劳动力得不到有力的开发,使得农业劳动力数量的因素对于农业总产量并没有体现出应有的解释能力,因此,才将这个因素从解释变量中剔除出去。
六、模型的经济意义
农业机械总动力代表农业中的技术因素,单位面积谷物产量代表劳动生产率,农作物播种面积的大小直接决定产出量,从而能够影响农业总产值,故最后采用剩下的这3个变量作为模型中的解释变量来构建回归方程。其经济意义如下:
在其它条件不变的条件下,X1的系数为0.1105181268,表示农机总动力每增加1个单位,农业总产值就增加0.1105181268个单位;x2的系数为0.07194175029,表示单位面积谷物产量每增加1个单位,农业总产值就增加0.07194175029个单位;x3的系数为0.046101934,表示农作物播种面积每增加1个单位,农业总产值就增加0.046101934个单位。在这三个因素中,单位面积谷物产量的影响对农业总产值的影响最大,农作物播种面积也是一个重要的影响因素。
因此,若要提高农业总产量,应该先从单位面积谷物产量入手,加强对科学技术的学习和应用,将影响单位面积的一些因素如单位面积施肥量和单位面积劳动力投入量等,同科学技术相结合,从而提高单位产量。其次,增加播种面积也应是提高单位产量的有效手段之一。