书签分享收藏举报版权申诉 / 13

立即下载加入VIP免费专享

当前位置：首页 > 工程管理 > [所有分类]本文运用多元统计分析中介绍的主成分分析方法和聚类分.pdf

[所有分类]本文运用多元统计分析中介绍的主成分分析方法和聚类分.pdf

上传人：哈尼dd

文档编号：5117298

上传时间：2020-02-04

格式：PDF

页数：13

大小：305.46KB

《[所有分类]本文运用多元统计分析中介绍的主成分分析方法和聚类分.pdf》由会员分享，可在线阅读，更多相关《[所有分类]本文运用多元统计分析中介绍的主成分分析方法和聚类分.pdf（13页珍藏版）》请在三一文库上搜索。

1、武汉理工大学多元统计分析课程设计 1 我国各省市的污染类型分析摘要本文运用多元统计分析中介绍的主成分分析方法和聚类分析方法，在 2006 年中国统计年鉴所提供的数据基础上，对所列出的 31 个省，市，自治区的环境指标进行主成分分析后再以所得到的因子进行聚类分析，从而确定每个城市所处的类别得出其环境污染类型。针对不同的污染类型，需要有侧重的进行治理，为环保部门提供一些依据。关键词关键词：主成分分析；因子分析；皮尔逊相关系数 The PollutionTypeAnalysis of Our CountrysEvery Province Abstract In this arti

2、cle the factor analysis method and clustering analysis method which are introduced in the Applied Multivariate Statistical Analysis are used. On the number supplied by the China Yearbook 2006 , we use the factor analysis method to analysis the 10 environment variances about the given 31 provinces in

3、 order to get the main factors . Then, we can cluster the provinces by the main factors, so we can know the pollution type after clustering .Todifferent pollution type, different method are needed.Wewant to give some advices to the Environment Protection Department by the result of this article. Key

4、words:Keywords:Keywords:Keywords: Main Component Analysis, Factor Analysis, Pearson Correlation 武汉理工大学多元统计分析课程设计 2 1. 引言由于人们对工业高度发达的负面影响预料不够，预防不利，导致了全球性的三大危机：资源短缺，环境污染，生态破坏。环境保护，随着现在时代的进步，人民生活水平的提高，这一字眼在人们的生活中出现的次数也越来越频繁。由于我国现在正处于迅速推进工业化和城市化的发展阶段，对自然资源的开发强度不断加大，加之粗放型的经济增长方式，技术水平和管理水平比较落后，污染物排放量

5、不断增加。从全国总的情况来看，我国环境污染仍在加剧，生态恶化积重难返，环境形势不容乐观。我国的环境污染现状已经到了非常严重的地步了，最近爆发的太湖水污染事件充分说明了事情的严重性。水污染事件的发生导致沐阳 20 多万人没有干净水喝，这还只是单一方面的污染事件。有专家预计，我国很多水域都有可能发生类似的大面积的污染事件。因此，充分认识各个地区的环境污染特点，有针对性的采取相应的措施，虽然环境污染并不是只影响单一区域，而具有全球性影响，但是各个地区将本地的污染最严重的方面进行治理后，将对治理全国范围内的污染有比较好的效果。 2理论部分 2.1 主成分分析主成分分析所关心的问题，是通

6、过一组变量的几个线形组合来解释这组变量的方差协方差结构。它的一般目的是：（1）数据的压缩；（2）数据的解释。虽要求 P 个成分可以再现全系统的变异性，但大部分变异性常常只用少数 K 个主成分就可说明。这时，这 K 个主成分所包含的信息和那 P 个原变量所包含的信息（几乎）一样多。主成分，在代数学上是 P 个随机变量的一些特殊的线形组合。而在几何学这些线形组合代表选取一 1,2P X XXL 个新坐标系，它是以为坐标轴的原坐标系旋转后得到的。设随机向量 12 , P XXXL 有协方差阵，其特征值。对应的特征向量为 12 , T P XXXX=L 12 0 P L 。则第i个主

7、成分由此时， 12 , p e eeL 1122 ,1,2. iiiipp Ye Xe Xe Xip=+=L ，.如某些相等，那么对应的( )ar,1,2. T iiii VYeeip=(),0, T ikik Cov Y Yeeik= i 系数向量的选取从而的选取，就都不是惟一的。 i e i Y 武汉理工大学多元统计分析课程设计 3 对于样本来说，其主成分的计算同总体的计算是一样的。但是在做样本的主成分时，需要考虑是以样本的协方差阵还是以样本的相关系数阵来计算其特征值与特征向量。对于这个问题我们采取以下原则：用于解释主成分时只用成分系数而不是用相关系数。虽说 i e 作为变量

8、对已知成分的重要性的测度，系数和相关可能导出不同的重要性等级，但是我们的经验表明，这种等级的差别常常不是大到很明显。在实践中，有较大（按绝对值）系数的变量，趋向于有较大的相关，故这两个重要性的测度（前者为多变量，后者为单变量）经常给出相似的结果。建议既考虑系数又考虑相关，这有助于解释主成分。另外，在确定主成分的个数时，也应该考虑我们所取的主成分是否能充分代表原有数据的信息。我们定义：第 j 个主成分的贡献率为：。当我们取 m 个主成分时，它所解释的贡献率为 1 j p p i = ，当由此式所算出的结果大于等于 80%时就可以认为所取的主成分的个数能很好的 1 1 m i i p j

9、 j = = 代表原有变量的信息，此时则可取 m 个主成分。 2.2 聚类分析聚类分析是从事物数量上的特征出发对事物进行分类，是事物分类学和多元统计技术结合的结果，是一种较为粗糙的，理论并非完善的分析方法，但是其使用简便，分类效果较好，其内容也在不断丰富中，是常用的数据探索性分析工具。聚类分析（Cluster Analysis）又称为集群分析，其分析的基本思想是依照事物的数值特征，来观察各样品之间的亲疏关系。而样品之间的亲疏关系则是由样品之间的距离来衡量的，一旦样品之间的距离定义之后，则把距离近的样品归为一类。传统的聚类分析要求聚类变量为数值变量。设为第 i 个样品的第 k 个指

10、标，每个样品测量了 p 个 ik X 变量，则样品和之间的距离（）定义为：（7-1）。 i X j X ij D( ) 1 1 pq q ijikjk k DqXX = = 式（7-1）称为闵可夫斯基（Minkovshi）距离。其中 q 为大雨 0 的正数。当 q=1 时，武汉理工大学多元统计分析课程设计 4 ，称为绝对值距离或曼哈顿（Manhanan）距离，SPSS 称为“block”；( ) 1 p ijikjk k DqXX = = 当 q=2 时，称为欧氏距离（Euclidean Distance）;也可以定义( ) 12 2 1 p ijikjk k Dqxx = = 变量之

11、间的距离，常用的两种定义方法是夹角余弦法和相关系数法。变量和的夹角 i x j x 余弦为；变量和的相关系数 ij C 1 12 22 11 n kikj k ij nn kikj kk x x C xx = = = i x j x 。和称为变量间的相似系数。变量间的距离 ()() ()() 1 12 2 2 11 n kiikjj k ij nn kiikjj kk xxxx r xxxx = = = ij C ij r ij D 由下式定义：或。聚类分析既可以对样品聚类，又可以对变 2 1 ijij DC= 2 1 ijij Dr= 量聚类，样品聚类也称为 Q 型聚类，变量聚类也称为 R

12、型聚类。根据样本量的大小，可以使用层次聚类或 K 中心聚类的方法。后者属于一种快速聚类方法。当样本量较大，数值变量和分类变量并存时，也可以使用二阶段聚类法。本文主要是采用层次聚类法。层次聚类法（也称为系统聚类法）是实际工作中使用最多的一种方法。层次聚类法的层次含义是：开始时每个样品各看成一类，将距离最近的两类合并；重新计算新类与其他类的距离，再将距离最近的两类合并；再计算新类与其他类的距离，这样一步LL 步地进行下去，每一步减少一类，直至所有的样品都合并成一类为止。整个聚类过程可绘成聚类图，类与类之间的距离有各种不同的定义方法，定义不同即产生不同的算法，而不同的算法可能得到不同的

13、结果。 3主成分分析和聚类分析的具体应用 3.1数据来源与指标变量选取本文所采用的数据全部来自 2006 年中国统计年鉴，其中所选取的指标来自年鉴第十二章环境保护目录中。，我们共选取了十个指标，选取的指标有：工业废水排放量（万吨）， 1 x 生活废水排放量（万吨），工业二氧化硫排放量（万吨），生活二氧化硫排放量（万 2 x 3 x 4 x 武汉理工大学多元统计分析课程设计 5 吨），工业烟尘排放量（万吨），生活烟尘排放量（万吨），工业粉尘排放量（万吨）， 5 x 6 x 7 x 生活垃圾排放量（万吨），等效声级，工业固体废物排放量（吨）。我们采用的数 8 x 9 x 10

14、x 据如表 1：表1 排放指标数据表工业废水排放量生活废水排放量工业二氧化排放量硫生活二氧化硫排放量工业烟尘排放量生活烟尘排放量工业粉尘排放量生活垃圾排放量等效噪声工业固体废物排放量 128138819610.58.51.843.3454.653.291403 300813028024.12.47.71.41.9144.854.944.4 12453383991128.121.45617.371.3680.154424148.8 320996299712031.69121.269.5619.753.86046901 24967312

15、74129.61660.417.545.632954.3624957.7 10507211363396.123.651.722.845.376854.193938 411895681630.87.532.78.613.7580.456.418642 451586888343.17.745.49.412.41125.856300 5109714861337.513.856.61.1622.357.31233 296318223107131.26.142.62.635.5834.85453 19242612077083.12.919.91.323.1762.555.756379.6 6348793

16、10451.55.625.34.546.2476.653.7450 1309398145343.92.211.81.319.330356.257681.8 539726934855.55.8231.635264.455.9102819.1 139071141306171.528.748.513.437.31046.553.51376 123476139088147.115.385.77.170.4756.755.736353.7 9243214493662.69.226.66.433.8885.255167033.6 12244013319875.516.445.38.676.94865456

17、7049.9 231568406835127.4227.10.832.11722.655.1138537.8 14560912524897.54.953.81.255.6204.7561104791 7428278462.2010.11.181.255.7367.7 848856033668.315.413.18.521.3237.654.71844955 122590139061114.115.963.415.738.4600.754.61157015 148504081865.969.920.515.919.1176.555.61312832 329284227442.99.317.15.

18、615.5205.753.8706602 99135640.10.10.200.244.5073000 42819405498012.229.210.234370.755.4348678.6 167982693051.74.612.43.816.6297.857.9406347.2 76191174111.50.95.729.354.452.127625.4 214111440630.2410.22.2996.453.341046.8 200524336734.817.1151217.3343.654.91094286 武汉理工大学多元统计分析课程设计 6 我们的主要思想是：由于所选取的指标量

19、太多，对聚类分析不是有利的，因此首先运用主成分分析的方法，将十个因子进行压缩得到几个主要因子，再利用这些主成分来对各个样本（也就是各个城市）在相应因子上的因子得分来进行聚类分析，将 31 个城市进行分类，最后分析分在一个类的城市在这几个主要因子上的得分有什么特点，从而可以知道相应城市的污染类型。现在将上述思想具体进行。 3.2 主成分分析先进行主成分分析。将这十个变量作为因子分析的变量进行分析，在因子分析过程中，提取公因子是采用主成分法，可以得到以下的结果：表 2 给出的是因子分析的总方差解释表2 总方差解释表 Extraction Method: Principal Compo

20、nent Analysis. 由上表及有关主成分的理论知：选取四个主成分是合适的，它所解释的比例占原方差的 85.219%，达到了 80%的要求，因而是合适的。因子数量的确定还可以直接取特征值大于 1 的个数，由上表知若仅取特征值大于 1 的个数，将只有两个因子，它所解释的比例只有 68.34%，效果并不是很好。由主成分的理论知道，经正交旋转（采用方差最大旋转）后各个因子对所有变量的解释均能有很好的效果，旋转后的因子成分矩阵见表 3： componentInitial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums

21、of Squared Loadings Total % of Variance Cumulative %Total % of Variance Cumulative %Total % of Variance Cumulative % 14.33343.32643.3264.33343.32643.3262.97029.69729.697 22.50125.01468.3402.50125.01468.3402.57825.78155.478 3.9349.34277.682.9349.34277.6821.95919.58875.066 4.7547.53685.219.7547.53685.

22、2191.01510.15285.219 5.5715.71290.931 6.4204.20495.135 7.1971.96997.104 8.1361.36298.465 98.815E-02.88199.347 106.532E-02.653100.000 武汉理工大学多元统计分析课程设计 7 表3 旋转后的主成分矩阵由上表可以发现：经旋转后因子 1（fac_1）在生活废水，生活垃圾，工业废水这三 2 x 8 x 1 x 个变量上有很大的比重，因而可以认为因子 1（fac_1）主要是一个反映因生活所产生的污染源；因子 2(fac_2)在工业粉尘，工业烟尘，工业二氧化硫排放量和工业固

23、体废物 7 x 5 x 3 x 排放量这四个指标上有很大的比重，因而可以认为因子2（fac_2）是一个反映工业废气 10 x 排放量的因子；因子 3(fac_3)在生活二氧化硫排放量，生活烟尘排放量这两个指标上 4 x 6 x 有很大的比重，因而可认为因子 3（fac_3）这是一个反映生活废气排放量的因子；而因子 4(fac_4)在等效噪声这个指标上的比重达到了 0.98，因而因子4（fac_4）是一个噪声因子。 9 x 经过这样的浓缩后，这十个因子可以变为四个指标，在以后的分析过程中，我们将直接采用这四个指标来进行分析，这样做的好处是可以比用原有变量进行聚类得到更好的结果，而且分析

24、上也会比较容易，减少了要分析的变量的数量，但是所包含的信息并不会减少多少。最后聚类后，可以结合各个样本在这四个因子上的因子得分大小来进行分析，从而得出聚为一类的城市的主要污染表现在哪一或哪几个方面。综上知道，这四个因子完全可以替代原来的十个指标。用这十个指标来表示经分析得到的四个主要因子，可以通过因子得分系数表来得到其具体的与这十个指标的线性关系。因子得分系数表见以表 4： Component 1234 生活废水.9357.726E-02-.0897.365E-02 生活垃圾.8968.627E-02.1517.898E-02 工业废水.836.285-.2357.960E-02 工业

25、粉尘.262.885.1219.619E-02 工业烟尘.269.860.2897.285E-02 工业二硫.602.658.265.102 工业固废-.265.563.432-.033 生活二硫-.007.139.9136.789E-02 生活烟尘-.005.426.8227.801E-02 等效噪声.1389.566E-029.261E-02.980 武汉理工大学多元统计分析课程设计 8 表4 主成分得分系数矩阵 Extraction Method: Principal Component Analysis. a4 components extracted. 由上表将因子表达为十个指标的线

26、性形式如下： 12345678910 _10.9290.8640.8210.6780.6080.5980.6350.3680.4350.366facxxxxxxxxxx=+ 22 12345678910 _ 25.719 100.2550.1600.5100.6940.6570.6550.6360.6304.123 10facxxxxxxxxxx = + 222 12345678910 _39.367 100.2070.2440.1033.643 100.1188.865 100.1520.2540.838facxxxxxxxxxx = + 22 12345678910 _41.704 100

27、.2140.3430.3300.2030.2443.439 100.1090.4560.400facxxxxxxxxxx = + 主成分分析的结果也将上述的四个因子保存的到了原有的数据库中，并且各个样本在这四个因子上的因子得分也显示了出来，完成这些以后就可以进行聚类分析了。 3.3聚类分析经过主成分分析得到了各个因子后，而且各个样本在因子上的载荷也已经求出来，则可以以这几个主要因子为变量进行对样本的聚类，也就是理论部分提到的Q型聚类。在这 component 1234 工业二硫 .929 -5.719E-02 -9.367E-02-1.704E-02 工业烟尘 .864 .255-.20

28、7-.214 工业粉尘 .821 .160-.244-.343 生活垃圾 .678 -.510.103.330 生活废水.608-.6943.643E-02.203 生活烟尘.598.657.118.244 工业废水 .635 -.655-8.865E-02-3.439E-02 工业固废 .368 .636-.152-.109 生活二硫.435.630.254.456 等效噪声 .366 -4.123E-02.838-.400 武汉理工大学多元统计分析课程设计 9 里我们进行聚类分析采用重心聚类法（CentriodClustering）,而进行聚类时所采用的测度方法是用皮尔逊相关系数（Pea

29、rson Correlation）。这里之所以选用这种聚类方法和测度方法，是经过了多次实验后的结果。采用其他的方法如近邻法（Nearest_neighbor）,远邻法（Furthest neighbor）,Wards法（WardsMethod）等计算方法和其他的测度方法如余弦测度（Cosine）, 欧氏距离（Euclidean Distance）,闵可夫斯基距离（Minkowski Distance）等测度方法来聚类时，其聚类效果并不是很好（有很多类都仅仅包含一个样本单元）。而采用上述方法即重心聚类法和皮尔逊相关系数来进行聚类时，得到的聚类效果是很好的。将31个样本聚为几类也

30、是一个需要讨论的问题，这里主要是先采用了一次K均值聚类法，根据分析得出的方差分析表可以知道该样本集合至少要分为4类，才能够基本上满足显著性要求。方差分析表见表5：表表5 5 5 5：单因素方差分析表：单因素方差分析表由上表可以知道fac-1,fac_2还有fac_4的显著性水平均小于0.05，因而可以认为是满足要求的，而fac _4的显著性水平大于0.05，有一些不满足要求，但为了分析方便，我们还是取为 4类。经过上述的分析之后，再采用系统聚类法（层次聚类法）来对样本进行具体的分类。另外，再进行聚类时，还要考虑到一个问题，即各个指标的量纲问题。因而在本问题中，要对各个样本在各个

31、因子上的载荷进行标准化。完成这些工作后，即可进行聚类分析。采用上述方法，进行聚类的结果如表6：表表6:6:6:6:聚类结果表聚类结果表 ClusterError FSig. Mean SquaredfMean Squaredf REGR factor score 1 for analysis1 5.8193.4652712.528.000 REGR factor score 2 for analysis1 4.0713.659276.179.002 REGR factor score 3 for analysis1 1.3823.958271.443.252 REGR factor sco

32、re 4 for analysis1 9.5243.05327180.157.000 样本类型样本类型样本类型样本类型 1:case1110:case1024:case432:case24 6:case6111:case1125:case5313:case134 武汉理工大学多元统计分析课程设计 10 上表是在原表的基础上制作的（原表由于太大不好编辑所以不在此粘贴）。由上表可以知道所有样本分为了4类，第一类包含的城市有北京，辽宁，吉林，黑龙江，上海，山东，贵州，新疆；第二类包含的地区有江苏，浙江，湖北，广东；第三类包含的地区有河北，山西，内蒙古，安徽，河南，湖南，广西，重庆，四川，西

33、藏，陕西；第四类所包含的地区有天津，福建，江西，海南，云南，甘肃，青海，宁夏。将这些聚为一类的城市在经过主成分分析得到的四个因子上的得分系数进行综合比较可以发现以下的一些现象：聚为第一类的城市在这四个因子中的第三个因子上的因子得分都为正值，而且与在其他因子上的得分相比，在此因子上的系数一般都比其他的要大。而第三个因子主要代表的是生活废气排放量，因而可以确定属于第一类的城市的主要污染物来自生活废气的排放；再看第二类，这些地区在第一个因子上的得分系数比在其他因子上的系数都要大，而且也全是正值。又第一个因子主要反映的是生活废水，工业废水，生活垃圾的排放量，因而可以判断江苏，浙江，湖北

34、，广东这四个地区的污染物主要来自于以上三个方面；聚为第三类的城市在第二个因子上的得分系数大部分都比其他的因子上的得分系数要大，而且也都是正的值，仅仅重庆，西藏，陕西这三个地区在因子2（fac_2）上的系数出现了一些异常，出现了负值。又知道因子二反映的是工业废气的排放量的大小，因而可以判断聚为第三类的地区的主要污染物在于工业废气的排放上。最后，聚为第四类的地区在第四个因子上的因子得分系数全是正值，而且它们在其他三个因子上的得分差不多全是负值，这是它们的共同特点。因子四反映的是噪声污染情况，因而可以判断这些地区的主要污染类型为噪声污染。 4.结果分析及应对措施针对以上分类的结果，我

35、们来对以上的四类地区在环境污染类型上进行定性分析。由聚类的结果可知第一类地区包括北京，辽宁，吉林，黑龙江，上海，山东，贵州，新疆。 7:case7117:case1723:case3314:case144 8:case8119:case19212:case12321:case214 9:case9116:case16325:case254 15:case15118:case18328:case284 24:case24120:case20329:case294 31:case31122:case22330:case304 23:case233 26:case263 27:case273 武汉

36、理工大学多元统计分析课程设计 11 它们在生活排放的污染物方面所占的比重是很大的，由因子三的意义知道这些城市的生活二氧化硫排放，生活烟尘的排放是她们的主要污染来源。这些废气的产生都来自于以下几个方面：1，能源的使用。随着我国经济的快速增长以及人民生活水平的提高，能源需求量不断上升。自1980年以来，中国原煤消耗量已增加了两倍以上。北京和上海作为比较现代化的城市，有能力开发新的能源，但是原煤作为其发展过程中的主要能源，对环境所造成的污染也就长期积累下来。而其他的几个地区正处于发展的过程中，原煤仍将是其主要能源。而以煤炭、生物能、石油产品为主的能源消耗是大气中颗粒物的主要来源。而这些

37、颗粒物主要来自于工业锅炉与居民煤炉的烟尘。另外，二氧化硫的排放也是增加的。我国已经成为世界头号二氧化硫排放大国。但对这几个城市来分析，北京，上海这两个城市的人口数都达到了1300万，而其地区面积与其他城市相比是比较小的，因而其人口密度会比较大。而且，这两个城市属于发达城市，其个人拥有的私家车数比例是很高的，而汽车的尾气是废气污染的主要来源，再看这一组的其他城市，其人口数都达到了2700万（新疆地区除外），且都处于发展的过程中因而其废气排放量是会比较大的。因而，这些地区在治理环境污染的过程中，应该把主要精力放在生活废气的治理方向上。第二类地区包括江苏，浙江，湖北，广东。由上面的聚

38、类分析知道，这四个地区的主要污染物来自于生活污水，生活垃圾和工业废水的排放量上。从统计年鉴的数据上可以发现，这四个城市在这三个指标上的排放量在全国范围内都是很大的，工业废水排放量至少都达到了10万万吨，生活污水排放量最少也有133198万吨，而生活垃圾的排放量最少也有 622.3万吨，这些数据在全国都是很大的，特别是生活污水和生活垃圾的排放量在全国都是差不多可以居首位了。据统计发现，近些年我国的工业废水的排放总量在减少，但是生活废水的排放量却在增加。1997年与1990年相比，城市生活污水排放量整整翻了一番，达到 189亿吨，而我国城市污水的集中处理率仅为13.6。属于第二类的上述四

39、个省份从2005 年的统计年鉴上可以知道它她们都是我国的人口大省，最少的浙江也有4898万人，因而这些省份的生活污染物是其主要污染物就不足为奇了。另外，工业废水的排放量大也是这几个省份的特点。一般来讲，工业污水主要来自造纸业、冶金工业、化学工业以及采矿业等，而在一些城市和农村水域周围的农产品加工和食品工业，如酿酒、制革、印染等也是水污染的主要来源。这些省份都有大的水流体系经过，很容易造成大的污染事件发生。综合上面的分析，江苏，浙江，湖北，湖南这四个省份在治理污染时应该将重点放在生活污水和生活垃圾的处理上。第三类地区包含有河北，山西，内蒙古，安徽，河南，湖南，广西，重庆，四川，西

40、武汉理工大学多元统计分析课程设计 12 藏，陕西。由聚类分析的结果我们可以看出这些地区的主要污染在于工业废气的排放量上。顾名思义，工业废气主要来自于工业企业的排放，而这个又主要来源于工业锅炉的使用，工业锅炉主要是燃烧原煤，因而这又归结于能源结构上来了。据统计，工业锅炉燃煤占我国煤炭消耗量的33，由于其燃烧效率低，加之低烟囱排放，它们在近地面大气污染中所占份额超过其在燃煤使用量中所占份额。虽然居民家庭燃煤使用量仅占消耗总量的15左右，然而其占大气污染的份额常常是30。我们来分析以上地区的能源消耗指标，根据统计年鉴上的数据显示可以发现在单位地区生产总值能耗，单位地区生产总值电耗

41、，单位工业增加值能耗这三个指标上的值都是很大的。因而这些地区的工业发展还是比较依靠能源消耗的，而且其能源利用率不高，能耗很大。这些地区应该采取措施，降低能耗指数，提高能源的利用效率，最终达到降低工业废气排放量的目标。第四类地区包含有天津，福建，江西，海南，云南，甘肃，青海，宁夏。由聚类的分析知道这些地区属于噪声污染比较严重的地区。根据资料统计，在影响城市环境噪声的主要来源中，工业噪声影响范围为8.3；施工噪声影响范围在5左右，因施工机械运行噪声较高，近年来扰民现象严重；交通噪声影响范围大约占城市的13，因其声级较高，影响范围较大，对声环境干扰最大；社会生活噪声影响范围逐年增加，

42、是影响城市声环境最广泛的噪声来源，其影响范围已达城市范围的47左右。据环境监测表明，全国有近三分之二的城市居民在噪声超标的环境中生活和工作。噪声污染给人类的社会生活也会有很大的影响，噪声使人烦恼、精神不易集中，影响工作效率，妨碍休息和睡眠等，而且噪声还可以引起耳聋和其他疾病，如头晕、头痛、神经衰弱、消化不良等症状，从而引发高血压和心血管病。可见噪声污染对人的影响是很大的。统计年鉴显示，上述城市的噪声等效声级普遍比较高，一般都是在56，57左右，比其他城市显得都要高一些，因而将其聚为一类是合理的。针对这种情况，这些省市应该将治污重点放在噪声污染治理方面。我国正处在社会主义现代化建

43、设的关键时期，各方面的工作都需要认真负责的完成。为确保我国和谐社会主义的真正实现，环境污染的治理问题需要尽早解决。只有解决了环境污染问题，才能达到人与自然的真正和谐统一。从各种媒体上的消息来看，现在环境保护部门治理环境污染的力度比以前明显有所加强，各种排放标准不达标的企业都被勒令停顿整改，并且国家有关部门也关闭了一些规模小，污染大，能耗比较严重的企业，这些措施将有效改善我国今后的环境问题。希望本文的一些结果对环境治理会有一些帮助。 5 5 5 5参考文献参考文献武汉理工大学多元统计分析课程设计 13 1 RichardA.Johnson ,DeanW.Wichern. 实用多元统计分析. 清华大学出版社.2004 2 李志辉，罗平. SPSS for Windows统计分析教程. 电子工业出版社.2004 3 薛薇. SPSS统计分析方法及其应用. 电子工业出版社.2003 4 国家统计局. 2006 年中国统计年鉴. 中国统计出版社.2006 5 国家环保总局. 中国环境保护白皮书.世界图书出版社.2005 6 方开泰.实用多元统计分析.华东师范大学出版社 1989。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

4 元

下载	加入VIP免费专享

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 所有分类所有分类本文运用多元统计分析介绍成分分析方法聚类分

三一文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：[所有分类]本文运用多元统计分析中介绍的主成分分析方法和聚类分.pdf
链接地址：https://www.31doc.com/p-5117298.html