D0I:10.13374/h.issn1001-053x.2011.10.019 第33卷第10期 北京科技大学学报 Vol.33 No.10 2011年10月 Journal of University of Science and Technology Beijing 0ct.2011 基于主成分回归分析法预测中国铁矿石需求 牛京考12)☒ 1)北京科技大学土木与环境工程学院,北京1000832)中国钢铁工业协会治金科技发展中心,北京100711 ☒通信作者,E-mail:winneryzj(@126.com 摘要在论述铁矿石需求预测途径的基础上,选取影响我国铁矿石需求的8个基本因素,采用回归分析方法进行了铁矿石 需求的单因素分析.单因素分析结果表明,选取的8个基本因素与铁矿石需求的相关度基本都大于0.9.对8个基本影响因 素进行了主成分分析,最终降维为4个主成分·将主成分分析方法与回归分析方法相结合,建立了铁矿石的需求预测模型,并 对我国2015年和2020年铁矿石的需求量进行了预测,分别为29.76亿1和26.68亿t. 关键词铁矿石:需求预测:数学模型;主成分分析:回归分析 分类号TD98 Prediction of demand for iron ores in China based on principal component re- gression analysis NIU Jing-kao2☒ 1)School of Civil and Environmental Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)Development Center for Metallurgical Science Technology,China Association of Iron Steel Industry,Beijing 100711,China Corresponding author,E-mail:winneryzj@126.com ABSTRACT Based on predicted methods of demand for iron ores,eight basic factors influencing the demand for iron ores in China were selected for single factor regressing analysis.The results show that the degree of correlation between the eight basic factors and de- mand for iron ores is more than 0.9.The principal component analysis method was used to analyze the relationships among the eight basic factors and four principal components were determined among the eight basic factors.Combined the principal component analysis method with the regressing analysis method,a prediction model of demand for iron ores was established.Using the model,the demands for iron ores in 2015 and 2020 in China were predicted and their values are 29.76 billion tons and 26.68 billion tons,respectively. KEY WORDS iron ores:demand forecasting:mathematical model;principal component analysis:regression analysis 钢铁工业是国家工业化社会产业链中最重要的 求量,再通过钢铁行业的内部运行参数导出铁矿石 环节.作为钢铁工业原材料的铁矿石需求随着钢铁 的需求量.需求预测方法很多,定性预测方法有趋 产品消费的持续增长而保持强劲的增长态势习. 势外推法、专家经验预测法、国际强度比较法和市场 深入分析我国铁矿石供给现状和未来趋势,基于 调研法等:定量预测方法有时间序列回归模型法、回 需求预测提出我国铁矿石供给的最佳配置、保障 归分析法、规划法、神经网络法和灰色理论法等.由 战略和经济政策建议,实现铁矿资源开发和进口 于铁矿石需求的内在动力是经济发展,因此国际上 决策的科学化,具有重要的现实意义和深远的战 在资源需求预测领域应用最广泛的是经济模型法. 略意义日 影响铁矿石和粗钢需求的单因素是多方面的,但各 铁矿石需求量可以通过两个途径进行预测:一 因素相互间有一定的影响关系,因此必须首先确定 是直接对铁矿石的表观消费量进行分析,从而对未 诸多因素中哪些是主导因素,哪些是非主导因 来的需求量进行预测:另一个是先预测出粗钢的需 素).本文将采取主成分回归分析的方法来研究这 收稿日期:2010-1008 基金项目:“十一五”国家科技支撑计划资助项目(2006BAB02A16)
第 33 卷 第 10 期 2011 年 10 月 北京科技大学学报 Journal of University of Science and Technology Beijing Vol. 33 No. 10 Oct. 2011 基于主成分回归分析法预测中国铁矿石需求 牛京考1,2) 1) 北京科技大学土木与环境工程学院,北京 100083 2) 中国钢铁工业协会冶金科技发展中心,北京 100711 通信作者,E-mail: winneryzj@ 126. com 摘 要 在论述铁矿石需求预测途径的基础上,选取影响我国铁矿石需求的 8 个基本因素,采用回归分析方法进行了铁矿石 需求的单因素分析. 单因素分析结果表明,选取的 8 个基本因素与铁矿石需求的相关度基本都大于 0. 9. 对 8 个基本影响因 素进行了主成分分析,最终降维为 4 个主成分. 将主成分分析方法与回归分析方法相结合,建立了铁矿石的需求预测模型,并 对我国 2015 年和 2020 年铁矿石的需求量进行了预测,分别为 29. 76 亿 t 和 26. 68 亿 t. 关键词 铁矿石; 需求预测; 数学模型; 主成分分析; 回归分析 分类号 TD98 Prediction of demand for iron ores in China based on principal component regression analysis NIU Jing-kao 1,2) 1) School of Civil and Environmental Engineering,University of Science and Technology Beijing,Beijing 100083,China 2) Development Center for Metallurgical Science & Technology,China Association of Iron & Steel Industry,Beijing 100711,China Corresponding author,E-mail: winneryzj@ 126. com ABSTRACT Based on predicted methods of demand for iron ores,eight basic factors influencing the demand for iron ores in China were selected for single factor regressing analysis. The results show that the degree of correlation between the eight basic factors and demand for iron ores is more than 0. 9. The principal component analysis method was used to analyze the relationships among the eight basic factors and four principal components were determined among the eight basic factors. Combined the principal component analysis method with the regressing analysis method,a prediction model of demand for iron ores was established. Using the model,the demands for iron ores in 2015 and 2020 in China were predicted and their values are 29. 76 billion tons and 26. 68 billion tons,respectively. KEY WORDS iron ores; demand forecasting; mathematical model; principal component analysis; regression analysis 收稿日期: 2010--10--08 基金项目:“十一五”国家科技支撑计划资助项目( 2006BAB02A16) 钢铁工业是国家工业化社会产业链中最重要的 环节. 作为钢铁工业原材料的铁矿石需求随着钢铁 产品消费的持续增长而保持强劲的增长态势[1--3]. 深入分析我国铁矿石供给现状和未来趋势,基于 需求预测提出我国铁矿石供给的最佳配置、保障 战略和经济政策建议,实现铁矿资源开发和进口 决策的科学化,具有重要的现实意义和深远的战 略意义[4--6]. 铁矿石需求量可以通过两个途径进行预测: 一 是直接对铁矿石的表观消费量进行分析,从而对未 来的需求量进行预测; 另一个是先预测出粗钢的需 求量,再通过钢铁行业的内部运行参数导出铁矿石 的需求量. 需求预测方法很多,定性预测方法有趋 势外推法、专家经验预测法、国际强度比较法和市场 调研法等; 定量预测方法有时间序列回归模型法、回 归分析法、规划法、神经网络法和灰色理论法等. 由 于铁矿石需求的内在动力是经济发展,因此国际上 在资源需求预测领域应用最广泛的是经济模型法. 影响铁矿石和粗钢需求的单因素是多方面的,但各 因素相互间有一定的影响关系,因此必须首先确定 诸多因素中哪些是主导因素,哪些是非主导因 素[7]. 本文将采取主成分回归分析的方法来研究这 DOI:10.13374/j.issn1001-053x.2011.10.019
·1178 北京科技大学学报 第33卷 一问题. 单因素分析可以看出,影响铁矿资源需求的因素是 多方面的.虽然每个影响因素都提供了一定的信 1铁矿石需求影响的单因素分析 息,但其重要性有所不同.在很多情况下,变量间有 根据1978一2008年的统计数据,研究发现铁矿 一定的相关性,从而使得这些变量所提供的信息在 石的需求受GDP(国内生产总值)、工业产值、固定 “定程度上有所重叠.因而人们希望对这些变量加 资产投资、建筑业产值、居民消费、城市化率、出口额 以“改造”,用为数极少的互不相干的新变量来反映 和进口额等因素影响较大.现采用回归分析的方 原变量所提供的绝大部分信息,通过对新变量的分 法,研究了铁矿石需求量与上述因素的相关关系. 析达到解决问题的目的,其主要原理如下. 回归模型方程如下: 收集n年GDP、固定资产投资等8个经济指标, Y=11.7354e00464,R=0.9817 (1) 构成一个n×8阶的数据矩阵: Y=10.0069+1.8741x2,R=0.9636 (2) x11X12 3X18 Y=13.0471e0184,R=0.9642 (3) X21 X22 X28 Y=11.2531e.181✉,R=0.9868 (4) X= (9) Y=13.2079e0.06455,R=0.9149 (5) Xn8」 y=3.7617e6.0636,R=0.9324 (6) 记x1,2,…,xg为原经济指标,Z1,Z2,…, Y=16.0150e01310,R=0.9546 (7) Z.(m≤8)为原经济指标的第m个主成分,则有 Y=6.6859+8.3727xg,R=0.8423 (8) 下式: 式中:Y为铁矿石需求量,千万t;x,为GDP(国内生 [Z1=lx+2x2++lsxs 产总值),千亿元;2为工业产值,千亿元:3为固定 资产投资,千亿元;x为建筑业产值,千亿元:x为居 Z2=l21x1+l2x2+…+l28x8 (10) 民消费,千亿元:x。为城市化率;x,为进口额,千亿 元:xg为出口额,千亿元:R为相关系数.x1,x2,…, Zm=lmx+lm2x2++lmsx8 x这8个影响因素的值都是以1978年不变价格计 式中,l为第i主成分第j个指标的系数. 算出来的可比价值. 主成分的寻找就是确定原来变量x:(i=1,2, 以上模型中除出口额与铁矿石相关系数是 …,8)在主成分Z(i=1,2,…,m)上的载荷l(i= 0.8423外,其他模型的相关系数均大于0.9,表明铁 1,2,…,mj=1,2,,8).从数学分析上知道,它 矿石需求与这些因素存在密切的相关关系 们分别是x1,x2,…,xg的相关矩阵的m个较大的特 征值所对应的特征向量. 2铁矿石需求影响因素的主成分分析 2.1主成分分析计算步骤 主成分分析是一种处理高维数据的方法.通过 2001一2008年期间8个指标基本情况见表1. 表12001一2008年8个指标基本情况 Table 1 Details of eight basic factors in 2001-2008 GDP/ 工业产 固定资产 建筑业 居民消 城市 出口额/ 进口额/ 年份 亿元 值/亿元 投资/亿元 产值/亿元 费/亿元 化率/% 亿元 亿元 2001 30000.00 19528.26 10487.99 1179.26 7687.27 37.66 6566.61 6011.99 2002 32726.61 21475.95 12235.23 1282.91 7625.70 39.09 8215.82 7449.30 2003 36007.29 24214.28 15292.86 1437.83 7717.17 40.53 10814.45 10190.91 2004 39637.90 27000.81 18367.84 1554.75 8017.98 41.76 13792.29 16046.03 2005 43695.01 30126.43 19603.84 1750.86 8162.22 42.99 14856.30 14419.35 2006 48871.20 34005.71 21350.29 1989.92 8285.36 43.90 16616.21 16127.49 2007 55243.01 39074.21 23457.32 2244.64 8682.92 44.94 18782.62 18230.19 2008 60189.54 42796.02 2405.09 25111.20 9194.82 45.68 20464.44 19862.55
北 京 科 技 大 学 学 报 第 33 卷 一问题. 1 铁矿石需求影响的单因素分析 根据 1978—2008 年的统计数据,研究发现铁矿 石的需求受 GDP( 国内生产总值) 、工业产值、固定 资产投资、建筑业产值、居民消费、城市化率、出口额 和进口额等因素影响较大. 现采用回归分析的方 法,研究了铁矿石需求量与上述因素的相关关系. 回归模型方程如下: Y = 11. 735 4e 0. 046 4x1,R = 0. 981 7 ( 1) Y = 10. 006 9 + 1. 874 1x2,R = 0. 963 6 ( 2) Y = 13. 047 1e 0. 118 4x3,R = 0. 964 2 ( 3) Y = 11. 253 1e 1. 178 1x4,R = 0. 986 8 ( 4) Y = 13. 207 9e 0. 064 5x5,R = 0. 914 9 ( 5) Y = 3. 761 7e 6. 706 3x6,R = 0. 932 4 ( 6) Y = 16. 015 0e 0. 131 0x7,R = 0. 954 6 ( 7) Y = 6. 685 9 + 8. 372 7x8,R = 0. 842 3 ( 8) 式中: Y 为铁矿石需求量,千万 t; x1为 GDP( 国内生 产总值) ,千亿元; x2为工业产值,千亿元; x3为固定 资产投资,千亿元; x4为建筑业产值,千亿元; x5为居 民消费,千亿元; x6 为城市化率; x7 为进口额,千亿 元; x8为出口额,千亿元; R 为相关系数. x1,x2,…, x8这 8 个影响因素的值都是以 1978 年不变价格计 算出来的可比价值. 以上模型中除 出 口 额 与 铁 矿 石 相 关 系 数 是 0. 842 3 外,其他模型的相关系数均大于 0. 9,表明铁 矿石需求与这些因素存在密切的相关关系. 2 铁矿石需求影响因素的主成分分析 主成分分析是一种处理高维数据的方法. 通过 单因素分析可以看出,影响铁矿资源需求的因素是 多方面的. 虽然每个影响因素都提供了一定的信 息,但其重要性有所不同. 在很多情况下,变量间有 一定的相关性,从而使得这些变量所提供的信息在 一定程度上有所重叠. 因而人们希望对这些变量加 以“改造”,用为数极少的互不相干的新变量来反映 原变量所提供的绝大部分信息,通过对新变量的分 析达到解决问题的目的,其主要原理如下. 收集 n 年 GDP、固定资产投资等 8 个经济指标, 构成一个 n × 8 阶的数据矩阵: X = x11 x12 … x18 x21 x22 … x28 xn1 xn2 … xn 8 ( 9) 记 x1,x2,…,x8 为 原 经 济 指 标,Z1,Z2,…, Zm ( m≤8) 为原经济指标的第 m 个 主 成 分,则 有 下式: Z1 = l11 x1 + l12 x2 + … + l18 x8 Z2 = l21 x1 + l22 x2 + … + l28 x8 … Zm = lm1 x1 + lm2 x2 + … + lm8 x 8 ( 10) 式中,lij为第 i 主成分第 j 个指标的系数. 主成分的寻找就是确定原来变量 xi ( i = 1,2, …,8) 在主成分 Zi ( i = 1,2,…,m) 上的载荷 lij ( i = 1,2,…,m; j = 1,2,…,8) . 从数学分析上知道,它 们分别是 x1,x2,…,x8的相关矩阵的 m 个较大的特 征值所对应的特征向量. 2. 1 主成分分析计算步骤 2001—2008 年期间 8 个指标基本情况见表 1. 表 1 2001—2008 年 8 个指标基本情况 Table 1 Details of eight basic factors in 2001—2008 年份 GDP / 亿元 工业产 值/亿元 固定资产 投资/亿元 建筑业 产值/亿元 居民消 费/亿元 城市 化率/% 出口额/ 亿元 进口额/ 亿元 2001 30 000. 00 19 528. 26 10 487. 99 1 179. 26 7 687. 27 37. 66 6 566. 61 6 011. 99 2002 32 726. 61 21 475. 95 12 235. 23 1 282. 91 7 625. 70 39. 09 8 215. 82 7 449. 30 2003 36 007. 29 24 214. 28 15 292. 86 1 437. 83 7 717. 17 40. 53 10 814. 45 10 190. 91 2004 39 637. 90 27 000. 81 18 367. 84 1 554. 75 8 017. 98 41. 76 13 792. 29 16 046. 03 2005 43 695. 01 30 126. 43 19 603. 84 1 750. 86 8 162. 22 42. 99 14 856. 30 14 419. 35 2006 48 871. 20 34 005. 71 21 350. 29 1 989. 92 8 285. 36 43. 90 16 616. 21 16 127. 49 2007 55 243. 01 39 074. 21 23 457. 32 2 244. 64 8 682. 92 44. 94 18 782. 62 18 230. 19 2008 60 189. 54 42 796. 02 2 405. 09 25 111. 20 9 194. 82 45. 68 20 464. 44 19 862. 55 ·1178·
第10期 牛京考:基于主成分回归分析法预测中国铁矿石需求 ·1179· 考虑上述的8个与铁矿石产量相关的因素,即 与x之间的相关系数;i为样本数据个数,这里表示 GDP、工业产值、固定资产投资、建筑业产值、居民消 第i年的数据:j为样本具有的变量数,这里表示 费、城市化率、出口额和进口额,利用编制的主成分 GDP、固定资产投资等经济指标. 分析程序,按以下步骤进行主成分的分析计算. 原变量的x:与x之间相关系数的计算公式为 2.1.1计算相关系数矩阵 对于主成分分析时,首先要计算8个主因素与 ∑(x6-)(x与-) k= 铁矿石需求之间的相关关系.依据主成分分析理论 (12) 建立的相关系数矩阵见下式: -) (x与-)2 [ru T12 T18 式中,x:为第i个指标的数学期望,x:为第k年第i T21 T22 T28 R= (11) 个指标的值. 由于R是实对称矩阵(即=),所以只需计 算上三角元素或下三角元素即可.根据式(13)得到 式中:7(i=1,2,…,n,j=1,2,…,8)为原变量的x 8个因素的相关系数矩阵: 1.0000 0.2025 0.8856 0.2859 0.1946 0.0047 -0.4290 -0.0189 0.2025 1.0000 0.2042 0.6275 -0.0985 0.0292 -0.0433 -0.7426 0.8856 0.2042 1.0000 0.3458 0.3965 -0.0577 -0.3110 0.1604 0.2859 0.6275 0.3458 1.0000 0.0263 0.4096 0.2547 -0.1644 R= 0.1946 -0.0985 0.3965 0.0263 1.0000 -0.3754 0.3404 0.5145 0.0047 0.0292 -0.0577 0.4096 -0.3754 1.0000 -0.0279 -0.0628 -0.4290 -0.0433 -0.3110 0.2547 0.3404 -0.0279 1.0000 0.2742 -0.0189 -0.7426 0.1604-0.1644 0.5145-0.0268 0.2742 1.0000 2.1.2计算特征值与特征向量 大小顺序排列,即入1≥入2≥…≥入g≥0:然后分别求 由上边的相关系数矩阵计算特征值.首先解特 出对应于特征值入:的特征向量e,(i=1,2,…,8). 征方程IAI-RI=0,通常用雅可比法(Jacobi)求出 由Matlab计算得到的特征值(:])和特征向量矩 各经济指标的特征值入:(i=1,2,…,8),并使其按 阵(表2)如下: 0:,i=1,2,…,8]=2.4892,2.1678,1.5378,1.1758,0.2952,0.2209,0.0804,0.0329]. 表2特征向量矩阵 Table 2 Characteristic vector matrix eg 3 4 6 1 -0.4843 -0.4652 -0.4550 -0.4226 0.0294 -0.1336 0.2394 0.2956 2 0.3385 -0.2753 0.4425 -0.0745 0.5402 -0.2549 0.0328 0.5003 3 -0.2111 0.2279 =0.0790 0.5303 0.3003 0.1621 0.6948 0.1289 4 -0.1048 0.3942 -0.0687 -0.1745 0.2623 -0.7690 0.0973 -0.3589 5 0.2373 -0.1952 0.0948 0.2483 -0.6895 -0.4691 0.3333 0.1688 6 0.4698 -0.1713 0.0111 -0.4395 0.0437 0.2399 0.5445 -0.4480 7 0.4720 -0.2266 -0.6996 0.3586 0.2283 -0.1160 -0.1952 -0.0646 8 0.3092 0.6178 -0.2960 -0.3475 -0.1373 0.0924 0.0613 0.5322 2.1.3计算主成分贡献率及累计贡献率 累计贡献率为 主成分Z,的贡献率为 入: (i=1,2,…,8) (13) (i=1,2,…,8) (14) 宫
第 10 期 牛京考: 基于主成分回归分析法预测中国铁矿石需求 考虑上述的 8 个与铁矿石产量相关的因素,即 GDP、工业产值、固定资产投资、建筑业产值、居民消 费、城市化率、出口额和进口额,利用编制的主成分 分析程序,按以下步骤进行主成分的分析计算. 2. 1. 1 计算相关系数矩阵 对于主成分分析时,首先要计算 8 个主因素与 铁矿石需求之间的相关关系. 依据主成分分析理论 建立的相关系数矩阵见下式: R = r11 r12 … r18 r21 r22 … r28 rn1 rn2 … rn 8 ( 11) 式中: rij ( i = 1,2,…,n,j = 1,2,…,8) 为原变量的 xi 与 xj之间的相关系数; i 为样本数据个数,这里表示 第 i 年的数据; j 为样本具有的变量数,这里表示 GDP、固定资产投资等经济指标. 原变量的 xi与 xj之间相关系数的计算公式为 rij = ∑ n k = 1 ( xki - xi ) ( xkj - xj ) ∑ n k = 1 ( xki - xi ) 2 ∑ n k = 1 ( xkj - xj ) 槡 2 ( 12) 式中,xi 为第 i 个指标的数学期望,xki为第 k 年第 i 个指标的值. 由于 R 是实对称矩阵( 即 rij = rji ) ,所以只需计 算上三角元素或下三角元素即可. 根据式( 13) 得到 8 个因素的相关系数矩阵: R = 1. 000 0 0. 202 5 0. 885 6 0. 285 9 0. 194 6 0. 004 7 - 0. 429 0 - 0. 018 9 0. 202 5 1. 000 0 0. 204 2 0. 627 5 - 0. 098 5 0. 029 2 - 0. 043 3 - 0. 742 6 0. 885 6 0. 204 2 1. 000 0 0. 345 8 0. 396 5 - 0. 057 7 - 0. 311 0 0. 160 4 0. 285 9 0. 627 5 0. 345 8 1. 000 0 0. 026 3 0. 409 6 0. 254 7 - 0. 164 4 0. 194 6 - 0. 098 5 0. 396 5 0. 026 3 1. 000 0 - 0. 375 4 0. 340 4 0. 514 5 0. 004 7 0. 029 2 - 0. 057 7 0. 409 6 - 0. 375 4 1. 000 0 - 0. 027 9 - 0. 062 8 - 0. 429 0 - 0. 043 3 - 0. 311 0 0. 254 7 0. 340 4 - 0. 027 9 1. 000 0 0. 274 2 - 0. 018 9 - 0. 742 6 0. 160 4 - 0. 164 4 0. 514 5 - 0. 0 26 8 0. 274 2 1. 000 0 . 2. 1. 2 计算特征值与特征向量 由上边的相关系数矩阵计算特征值. 首先解特 征方程| λI - R | = 0,通常用雅可比法( Jacobi) 求出 各经济指标的特征值 λi ( i = 1,2,…,8) ,并使其按 大小顺序排列,即 λ1≥λ2≥…≥λ8≥0; 然后分别求 出对应于特征值 λi 的特征向量 ei ( i = 1,2,…,8) . 由 Matlab 计算得到的特征值( [λi]) 和特征向量矩 阵( 表 2) 如下: [λi,i = 1,2,…,8]=[2. 489 2,2. 167 8,1. 537 8,1. 175 8,0. 295 2,0. 220 9,0. 080 4,0. 032 9]. 表 2 特征向量矩阵 Table 2 Characteristic vector matrix eij 1 2 3 4 5 6 7 8 1 - 0. 484 3 - 0. 465 2 - 0. 455 0 - 0. 422 6 0. 029 4 - 0. 133 6 0. 239 4 0. 295 6 2 0. 338 5 - 0. 275 3 0. 442 5 - 0. 074 5 0. 540 2 - 0. 254 9 0. 032 8 0. 500 3 3 - 0. 211 1 0. 227 9 - 0. 079 0 0. 530 3 0. 300 3 0. 162 1 0. 694 8 0. 128 9 4 - 0. 104 8 0. 394 2 - 0. 068 7 - 0. 174 5 0. 262 3 - 0. 769 0 0. 097 3 - 0. 358 9 5 0. 237 3 - 0. 195 2 0. 094 8 0. 248 3 - 0. 689 5 - 0. 469 1 0. 333 3 0. 168 8 6 0. 469 8 - 0. 171 3 0. 011 1 - 0. 439 5 0. 043 7 0. 239 9 0. 544 5 - 0. 448 0 7 0. 472 0 - 0. 226 6 - 0. 699 6 0. 358 6 0. 228 3 - 0. 116 0 - 0. 195 2 - 0. 064 6 8 0. 309 2 0. 617 8 - 0. 296 0 - 0. 347 5 - 0. 137 3 0. 092 4 0. 061 3 0. 532 2 2. 1. 3 计算主成分贡献率及累计贡献率 主成分 Zi的贡献率为 λi ∑ 8 k = 1 λk ( i = 1,2,…,8) ( 13) 累计贡献率为 ∑ i k = 1 λk ∑ 8 k = 1 λk ( i = 1,2,…,8) ( 14) ·1179·
·1180 北京科技大学学报 第33卷 一般取累计贡献率达85%~95%的特征值入1, 通过计算主成分的贡献率和累计贡献率,得知 入2,…,入g所对应的第1,第2,…,第m(m≤8)个主 前4个主成分的累计贡献率已大于85%.因此,通 成分.8个主成分的特征值、贡献率和累计贡献率 过主成分分析,8个主成分可以降维为4个,故只需 如下(表3). 求出第1、第2、第3和第4主成分Z1,Z2,Z3,Z4 表3主成分贡献率 即可 Table 3 Contribution ratio of each main factor 2.1.4计算主成分载荷 主成分 特征值 贡献率/% 累计贡献率/% 对前4个主成分的特征值,分别求出其特征向 Z 2.4892 0.3111 31.11 量e1、e2e和e4,并计算各变量x1,x2,…,xg在各主 Z 2.1678 0.2710 58.21 成分上的载荷矩阵 Zs 1.5378 0.1922 77.43 Za 1.1758 0.1470 92.13 其计算公式为 Zs 0.2952 0.0369 95.82 lg=√e(i=1,2,3,4j=1,2,…,8)(15) Zo 0.2209 0.0276 98.58 Z 0.0804 0.0101 99.59 式中,e为向量e,的第j个分量 Zs 0.0329 0.0041 100.00 经过计算后,得到的主成分载荷矩阵见表4. 表4主成分荷载 Table 4 Loading of each main factor 主成分 XI x2 4 5 6 7 g Z 0.6943 -0.3173 0.1405 0.8520 0.4801 -0.5399 0.5299 0.6372 Z -0.4316 0.6205 0.4306 0.3122 0.3851 0.6795 0.4584 0.1712 -0.1231 -0.6109 0.8066 -0.0871 -0.5871 0.1251 0.2930 0.0731 0.3616 0.1613 -0.1899 -0.2157 -0.3299 -0.0959 0.5435 -0.6823 由此,Z1、Z2、Z3和Z,的计算公式为: 3 Z1=0.6943x1-0.3173x2+0.1405x3+0.852x4+ 2015年和2020年铁矿石需求预测 0.4801x-0.5399x6+0.5299x7+0.6372xg 为了完成对2015年、2020年我国铁矿石需求 (16) 量的预测,需要对相关经济变量的未来可能变化趋 Z2=-0.4316x1+0.6205x2+0.4306x3+ 势进行分析,并以此为依据来进行铁矿石需求量的 0.3122x4+0.3851x5+0.6795x6+ 预测圆.预测的宏观经济变量包括GDP、工业产值、 0.4584x7+0.1712xg (17) 固定资产投资、建筑业产值、居民消费、城市化率、出 Z3=-0.1231x1-0.6109x2+0.8066x3- 口额和进口额等,具体见表5.表中,各经济变量的 0.0871x4-0.5871x5+0.1251x6+ 取值依据如下. 0.293x7+0.0731xg (18) 表5预测宏观经济变量值 Z4=0.3616x1+0.1613x2-0.1899x3- Table 5 Establishment of forecasting situation 0.2157x4-0.3299x-0.0959x6+ 影响参数 2015年 2020年 0.5435x7-0.6823xg (19) GDP/亿元 103154 151567 2.2主成分回归分析 工业产值与GDP比值/% 41.5 39.0 分别将GDP、工业产值、固定资产投资、建筑业 固定资产投资与GDP比值/% 46 42 产值、居民消费、城市化率、出口额和进口额等数据 建筑业产值与GDP比值/% 5.5 4.0 标准化后代入方程(16)~(19),求得Z(i=1,2,3, 居民消费与GDP比值/% 15 15 4),然后将Z,当作自变量,将各年铁矿石需求量的 城市化率/% 60 数据作为因变量,得到铁矿石需求的回归方程: 进口额与GDP比值/% 33 33 Y=-811378+28.4134Z1+28.532Z2- 出口额与GDP比值/% 34 34 64.0198Z3-123.945Z (20) 式中:Y为铁矿石需求;Z:为各主成分的值,i=1,2, (1)可比价GDP.20O9年我国现价GDP为 3,4. 340507亿元,可比价GDP是65004.71亿元.若按
北 京 科 技 大 学 学 报 第 33 卷 一般取累计贡献率达 85% ~ 95% 的特征值 λ1, λ2,…,λ8 所对应的第 1,第 2,…,第 m( m≤8) 个主 成分. 8 个主成分的特征值、贡献率和累计贡献率 如下( 表 3) . 表 3 主成分贡献率 Table 3 Contribution ratio of each main factor 主成分 特征值 贡献率/% 累计贡献率/% Z1 2. 489 2 0. 311 1 31. 11 Z2 2. 167 8 0. 271 0 58. 21 Z3 1. 537 8 0. 192 2 77. 43 Z4 1. 175 8 0. 147 0 92. 13 Z5 0. 295 2 0. 036 9 95. 82 Z6 0. 220 9 0. 027 6 98. 58 Z7 0. 080 4 0. 010 1 99. 59 Z8 0. 032 9 0. 004 1 100. 00 通过计算主成分的贡献率和累计贡献率,得知 前 4 个主成分的累计贡献率已大于 85% . 因此,通 过主成分分析,8 个主成分可以降维为 4 个,故只需 求出第 1、第 2、第 3 和第 4 主成分 Z1,Z2,Z3,Z4 即可. 2. 1. 4 计算主成分载荷 对前 4 个主成分的特征值,分别求出其特征向 量 e1、e2、e3和 e4,并计算各变量 x1,x2,…,x8在各主 成分上的载荷矩阵. 其计算公式为 lij = 槡λieij ( i = 1,2,3,4; j = 1,2,…,8) ( 15) 式中,eij为向量 ei的第 j 个分量. 经过计算后,得到的主成分载荷矩阵见表 4. 表 4 主成分荷载 Table 4 Loading of each main factor 主成分 x1 x2 x3 x4 x5 x6 x7 x8 Z1 0. 694 3 - 0. 317 3 0. 140 5 0. 852 0 0. 480 1 - 0. 539 9 0. 529 9 0. 637 2 Z2 - 0. 431 6 0. 620 5 0. 430 6 0. 312 2 0. 385 1 0. 679 5 0. 458 4 0. 171 2 Z3 - 0. 123 1 - 0. 610 9 0. 806 6 - 0. 087 1 - 0. 587 1 0. 125 1 0. 293 0 0. 073 1 Z4 0. 361 6 0. 161 3 - 0. 189 9 - 0. 215 7 - 0. 329 9 - 0. 095 9 0. 543 5 - 0. 682 3 由此,Z1、Z2、Z3和 Z4的计算公式为: Z1 = 0. 694 3x1 - 0. 317 3x2 + 0. 140 5x3 + 0. 852x4 + 0. 480 1x5 - 0. 539 9x6 + 0. 529 9x7 + 0. 637 2x8 ( 16) Z2 = - 0. 431 6x1 + 0. 620 5x2 + 0. 430 6x3 + 0. 312 2x4 + 0. 385 1x5 + 0. 679 5x6 + 0. 458 4x7 + 0. 171 2x8 ( 17) Z3 = - 0. 123 1x1 - 0. 610 9x2 + 0. 806 6x3 - 0. 087 1x4 - 0. 587 1x5 + 0. 125 1x6 + 0. 293x7 + 0. 073 1x8 ( 18) Z4 = 0. 361 6x1 + 0. 161 3x2 - 0. 189 9x3 - 0. 215 7x4 - 0. 329 9x5 - 0. 095 9x6 + 0. 543 5x7 - 0. 682 3x8 ( 19) 2. 2 主成分回归分析 分别将 GDP、工业产值、固定资产投资、建筑业 产值、居民消费、城市化率、出口额和进口额等数据 标准化后代入方程( 16) ~ ( 19) ,求得 Zi ( i = 1,2,3, 4) ,然后将 Zi当作自变量,将各年铁矿石需求量的 数据作为因变量,得到铁矿石需求的回归方程: Y = - 811 378 + 28. 413 4Z1 + 28. 532Z2 - 64. 019 8Z3 - 123. 945Z4 ( 20) 式中: Y 为铁矿石需求; Zi为各主成分的值,i = 1,2, 3,4. 3 2015 年和 2020 年铁矿石需求预测 为了完成对 2015 年、2020 年我国铁矿石需求 量的预测,需要对相关经济变量的未来可能变化趋 势进行分析,并以此为依据来进行铁矿石需求量的 预测[8]. 预测的宏观经济变量包括 GDP、工业产值、 固定资产投资、建筑业产值、居民消费、城市化率、出 口额和进口额等,具体见表 5. 表中,各经济变量的 取值依据如下. 表 5 预测宏观经济变量值 Table 5 Establishment of forecasting situation 影响参数 2015 年 2020 年 GDP /亿元 103 154 151 567 工业产值与 GDP 比值/% 41. 5 39. 0 固定资产投资与 GDP 比值/% 46 42 建筑业产值与 GDP 比值/% 5. 5 4. 0 居民消费与 GDP 比值/% 15 15 城市化率/% 54 60 进口额与 GDP 比值/% 33 33 出口额与 GDP 比值/% 34 34 ( 1) 可 比 价 GDP. 2009 年 我 国 现 价 GDP 为 340 507亿元,可比价 GDP 是 65 004. 71 亿元. 若按 ·1180·
第10期 牛京考:基于主成分回归分析法预测中国铁矿石需求 ·1181· 照GDP增长率平均保持8%,测算2015年和2020 和废钢蓄积量的增加以及钢铁冶炼技术水平的提 年可比价GDP分别为103154亿元和151567亿元. 升,经过分析和计算,到2015年和2020年将分别有 (2)工业和建筑业.依据《国务院关于加快发 约7亿t和9亿t铁矿石原材料被废钢及其他二次 展服务业的若干意见》(国发2007]7号)等精神, 资源所替代.综合考虑各种因素,2015年和2020年 预测时2015年第二产业占GDP的比重取47%, 的铁矿石原矿需求量预测将分别为22.76亿t和 2020年取43%.按照建筑业贡献率换算,2000一 17.68亿t 2008年我国建筑业对GDP的贡献率为5.5%~ 5.6%,预测2020年开始降低,取4%.由此得到 参考文献 2015年、2020年工业占GDP的比重分别是41.5% [1]Jiao Y S,Niu J K,Cai H Q.Improvement and development of 和39% Chinese mining science and technology in the 60 years since the (3)城市化率.2009年我国城市化率为 foundation of new China.China Metall,2010,20 (2):1 (焦玉书,牛京考,蔡鸿起.建国60年中国采矿科学技术进 46.59%.2010年4月,中国社会科学院经济研究所 步与展望.中国治金,2010,20(2):1) 发布的首部《宏观经济蓝皮书》指出:“中国将在 [2] Niu J K,Cai M F.Situation of iron ore supply-demand and sus- 2013年左右(预计在2011一2016年之间)结束高速 tained development.Met Mine,2005(12):1 城市化过程,这一期间的城市化年增长率约为 (牛京考,蔡美峰.铁矿供需态势与持续发展.金属矿山, 1.09%,城市化率则为47.93%53.37%,此后中 2005(12):1) Jiao Y S.The new trends of rise and development at China iron 国的城市化率增长逐步放缓.”预测时2010一2020 mining.Met Mine,2009(Suppl 1):1 年城市化率按照年增加1.09%来估算,并考虑到最 (焦玉书.中国铁矿业崛起与发展的新态势.金属矿山,2009 近提出加快城市化进程的因素,2015年和2020年 (增刊1):1) 分别为54%和60%. [4 Ma Z G,Wang G S.Study on the security of China mineral re- (4)固定资产投资.2008年按照可比价计算, sources.Land Resour Inf,2009(3):2 (麻志国,王高尚.我国矿产资源保障问题的思考.国土资源 投资率为60%,设定2010年之后投资率有所降低, 情报,2009(3):2) 2015年投资率为44%,之后逐年下降,2020年投资 [5] Liu D.Status quo and analysis of China's iron ore import in recent 率为40%. years.Met Mine,2009(1):12 根据表5中的经济变量值,采用式(20)预测 (刘动.近年我国进口铁矿石的现状与分析.金属矿山,2009 2015年和2020年我国铁矿石需求量分别为29.76 (1):12) 6 Shan S H.To regulate import iron ore market and to establish mar- 亿t和26.68亿t ket order//Proceeding 9th China International Steel Raw Materi- 4结论 als Conference.Qingdao,2009:6 (单尚华.整顿进口铁矿石市场,规范市场秩序/2009年第九 本文选取GDP、工业产值、固定资产投资、建筑 届中国钢铁原材料国际研讨会论文集.青岛,2009:6) 业产值、居民消费、城市化率、出口额和进口额8个 [] Hu D B,Chen X H,Hu D B,et al.Study on guarantee extent of 因素作为铁矿石需求的基本影响因素,采用回归分 China metal mine resources and decision support system of devel- opment and utilization.Nonferrous Met Min,2004,56(3):2 析方法进行了单因素影响分析,并对这些影响因素 (胡东波,陈晓红,胡东滨,等。中国金属矿产资源保障程度与 进行了主成分分析,确定了由8种基本影响因素构 开发利用决策支持系统研究.有色金属:矿山部分,2004,56 成的4个影响主成分.通过回归分析建立了铁矿石 (3):2) 需求预测模型,采用该模型预测2015年、2020年我 [8]Li X B.Transforming development model and fostering internal im- 国铁矿石需求量分别为29.76亿t和26.68亿t petus:thinking about development strategies in the post-erisis era// Proceeding 6th China International Steel Congress.Beijing,2010:80 铁矿石资源也可以通过其替代资源来补充,其 (李晓波.转变发展方式增强内生动力:关于后危机时代钢铁 中主要是废钢.2009年中国粗钢生产中,已有约 工业发展的思考/1第六届中国国际钢铁大会论文集.北京, 15%的原材料来自废钢等.根据钢铁行业发展趋势 2010:80)
第 10 期 牛京考: 基于主成分回归分析法预测中国铁矿石需求 照 GDP 增长率平均保持 8% ,测算 2015 年和 2020 年可比价 GDP 分别为 103 154 亿元和 151 567 亿元. ( 2) 工业和建筑业. 依据《国务院关于加快发 展服务业的若干意见》( 国发[2007]7 号) 等精神, 预测时 2015 年第二产业占 GDP 的比重取 47% , 2020 年取 43% . 按照建筑业贡献率换算,2000— 2008 年我国建筑业对 GDP 的 贡 献 率 为 5. 5% ~ 5. 6% ,预测 2020 年开始降 低,取 4% . 由 此 得 到 2015 年、2020 年工业占 GDP 的比重分别是 41. 5% 和 39% . ( 3 ) 城 市 化 率. 2009 年我国城市化率为 46. 59% . 2010 年 4 月,中国社会科学院经济研究所 发布的首部《宏观经济蓝皮书》指出: “中国将在 2013 年左右( 预计在 2011—2016 年之间) 结束高速 城市 化 过 程,这一期间的城市化年增长率约为 1. 09% ,城市化率则为 47. 93 % ~ 53. 37% ,此后中 国的城市化率增长逐步放缓. ”预测时 2010—2020 年城市化率按照年增加 1. 09% 来估算,并考虑到最 近提出加快城市化进程的因素,2015 年和 2020 年 分别为 54% 和 60% . ( 4) 固定资产投资. 2008 年按照可比价计算, 投资率为 60% ,设定 2010 年之后投资率有所降低, 2015 年投资率为 44% ,之后逐年下降,2020 年投资 率为 40% . 根据表 5 中的经济变量值,采用式( 20) 预测 2015 年和 2020 年我国铁矿石需求量分别为 29. 76 亿 t 和 26. 68 亿 t. 4 结论 本文选取 GDP、工业产值、固定资产投资、建筑 业产值、居民消费、城市化率、出口额和进口额 8 个 因素作为铁矿石需求的基本影响因素,采用回归分 析方法进行了单因素影响分析,并对这些影响因素 进行了主成分分析,确定了由 8 种基本影响因素构 成的 4 个影响主成分. 通过回归分析建立了铁矿石 需求预测模型,采用该模型预测 2015 年、2020 年我 国铁矿石需求量分别为 29. 76 亿 t 和 26. 68 亿 t. 铁矿石资源也可以通过其替代资源来补充,其 中主要是废钢. 2009 年中国粗钢生产中,已有约 15% 的原材料来自废钢等. 根据钢铁行业发展趋势 和废钢蓄积量的增加以及钢铁冶炼技术水平的提 升,经过分析和计算,到 2015 年和 2020 年将分别有 约 7 亿 t 和 9 亿 t 铁矿石原材料被废钢及其他二次 资源所替代. 综合考虑各种因素,2015 年和 2020 年 的铁矿石原矿需求量预测将分别为 22. 76 亿 t 和 17. 68 亿 t. 参 考 文 献 [1] Jiao Y S,Niu J K,Cai H Q. Improvement and development of Chinese mining science and technology in the 60 years since the foundation of new China. China Metall,2010,20( 2) : 1 ( 焦玉书,牛京考,蔡鸿起. 建国 60 年中国采矿科学技术进 步与展望. 中国冶金,2010,20( 2) : 1) [2] Niu J K,Cai M F. Situation of iron ore supply-demand and sustained development. Met Mine,2005( 12) : 1 ( 牛京考,蔡美峰. 铁矿供需态势与持续发展. 金 属 矿 山, 2005( 12) : 1) [3] Jiao Y S. The new trends of rise and development at China iron mining. Met Mine,2009( Suppl 1) : 1 ( 焦玉书. 中国铁矿业崛起与发展的新态势. 金属矿山,2009 ( 增刊 1) : 1) [4] Ma Z G,Wang G S. Study on the security of China mineral resources. Land Resour Inf,2009( 3) : 2 ( 麻志国,王高尚. 我国矿产资源保障问题的思考. 国土资源 情报,2009( 3) : 2) [5] Liu D. Status quo and analysis of China's iron ore import in recent years. Met Mine,2009( 1) : 12 ( 刘动. 近年我国进口铁矿石的现状与分析. 金属矿山,2009 ( 1) : 12) [6] Shan S H. To regulate import iron ore market and to establish market order/ /Proceeding 9th China International Steel & Raw Materials Conference. Qingdao,2009: 6 ( 单尚华. 整顿进口铁矿石市场,规范市场秩序/ /2009 年第九 届中国钢铁原材料国际研讨会论文集. 青岛,2009: 6) [7] Hu D B,Chen X H,Hu D B,et al. Study on guarantee extent of China metal mine resources and decision support system of development and utilization. Nonferrous Met Min,2004,56( 3) : 2 ( 胡东波,陈晓红,胡东滨,等. 中国金属矿产资源保障程度与 开发利用决策支持系统研究. 有色金属: 矿山部分,2004,56 ( 3) : 2) [8] Li X B. Transforming development model and fostering internal impetus: thinking about development strategies in the post-crisis era / / Proceeding 6th China International Steel Congress. Beijing,2010: 80 ( 李晓波. 转变发展方式增强内生动力: 关于后危机时代钢铁 工业发展的思考/ /第六届中国国际钢铁大会论文集. 北京, 2010: 80) ·1181·