Matlab统计工具箱.pdf
《Matlab统计工具箱.pdf》由会员分享,可在线阅读,更多相关《Matlab统计工具箱.pdf(35页珍藏版)》请在三一文库上搜索。
1、Matlab中的统计功能 Statistics Toolbox in Matlab Applied Statistics Topic List 1.Probability Distributions(概率分布) 2. Displaying Probability Distributions and Random Samples(描述性统计) 3. Statistical Plots(统计作图) 4. Hypothesis Tests(假设检验) 1.Probability Distributions(概率分布) 随机变量的统计行为取决于其概率分布,而分布函 数常用连续和离散型分布。Matlab
2、统计工具箱提供 20多种分布。每种分布有五类函数,分别为: 1: 概率密度(pdf) ; 2: 累积分布函数(cdf); 3: 逆累积分布函数(icdf); 4: 随机数产生器 ; 5: 均值和方差函数; 以正态分布为例说明这些函数在Matlab里的实现。 1.1 概率密度函数 ?一般概率密度函数 x=-3:0.5:3; f=normpdf(x,0,1); 其中normpdf为正态分布的Matlab分布实现函数,可由可选 分布的概率密度函数代替。 ?可选分布的概率密度函数 格式:Y=pdf(name,X,A1,A2,A3) 说明:name为特定分布的名称,如Normal,Gamma 等。X为分
3、布函数的自变量X的取值矩阵,而A1,A2,A3分别为 相应的分布参数值。Y给出结果,为概率密度值矩阵。 举例:p=pdf(Normal,-2:2,0,1)给出标准正态分布在-2到2的 分布函数值,而p=pdf(Poisson,0:4,1:5)给出Poisson分布函数。 1.2 累积分布函数与逆累积分布函数 同样地,累积分布和逆累积分布对每个分布都有特定的 Matlab实现函数,这里只介绍通用的cdf,icdf。 - cdf, icdf 功能:计算可选分布的累积分布函数和逆累积分布函数。 格式:P=cdf(name,X,A1,A2,A3) X=icdf(name,X,A1,A2,A3) 说明:
4、cdf和icdf中的参数使用和pdf中的相同,只是计算结果 不同。 举例:p=cdf(Normal,0:5,0,1) x=icdf(Normal,0.1:0.2:0.9,0,1) 1.3 随机数产生器 在Matlab里和pdf、cdf与icdf一样,随机数的产生也有通用函 数random。 功能:产生可选分布的随机数。 格式:y=random(name,A1,A2,A3,m,n) 说明:random函数产生统计工具箱中任一分布的随机数。 name为相应分布的名称。A1,A2,A3为分布参数,意义同 pdf参数。m,n确定了结果y的数量,如果分布参数A1,确A2, A3为矢量,则m,n是可选的,
5、但应注意,它们给出的长度或 矩阵行列数必须与分布参数的长度相匹配。 举例: rn=random(Normal,0,1,2,4) 1.4 均值和方差 和以上其他函数不同的是均值和方差的运算没有通用的函 数,只能用各个分布的函数计算。对应于正态分布的计算 函数为normstat()。 它返回两个参数的向量,分别为均值和方差。 举例:m,n=normstat(mu,sigma) Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, 如:设X?N(1,3) ,计算P(X 2) 如果计算P(2 X n
6、ormcdf(2, 1, 3) 可得计算结果 ans = 0.6306 normcdf(4, 1, 3) - normcdf(2, 1, 3) 可得计算结果 ans = 0.2108 Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, 2. Displaying Probability Distributions and Random Samples (描述性统计) 人们希望用少数样本来体现样本总体的规律。 描述性统计就是收集、整理、加工和分析统计数据, 使之系统化、条理化,以显示出数据资
7、料的趋势、特 征和数量关系。 根据统计量特征性质的不同,工具箱提供了位置度 量、散布度量、自助法以及在缺失数据情况下处理方 法等方面的描述性统计工具函数。 Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, 2.1 中心位置度量 数据样本中心度量的目的在于对数据样本的数据分布线上 分布的中心予以定位,即中心位置的度量。 均值是对位置的简单和通常的估计量。但野值的存在往往 影响位置的确定。而中位数和修正的均值则受野值的干扰很 小。中位数是样本的50%分位点。而修正的均值所蕴涵的思 想则是剔除
8、样本中最高值和最低值来确定样本的中心位置。 以下介绍位置度量几个常用的函数。 Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, 2.1.1 平均值(mean) 功能:样本数据的平均值。 说明:平均值定义为 举例: = = n i ijj x n x 1 1 x=normrnd(0,1,100,5); xbar=mean(x) Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, 2.1
9、.2 几何平均数(geomean) 功能:样本的几何均值。 格式:m=geomean(X) 说明:几何均值的定义为m= geomean 函数计算样本的几何均值 。X若为矢量,它返回 X中元素的几何均值;X若为矩阵,它的结果为一个行矢量, 每个元素为X对应列元素的几何均值。 举例: n n i i x 1 1 = x=exprnd(1,10,6); geometric=geomean(x) average=mean(x) Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, 2.1.3 中位数
10、(median) 功能:样本数据的中值。 说明:中值即数据样本的50%中位数。中位数对 野值出现的影响较小。 举例: xodd=1:4,8 modd1=median(xodd) modd2=mean(xodd) 结果结果? 3 3.6 Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, 2.2 散布度量 ?散布度量可以理解为样本中的数据偏离其数值中心的程度, 也称离差。 ?极差,定义为样本最大观测值与最小观测值之差。 ?标准差和方差为常用的散布度量,对正态分布的样本描述 是最优的。但抗野值
11、干扰能力较小。 ?平均绝对值偏差对野值也敏感。 ?四分位数间距为随机变量的上四分位数 和下四分位之差。 Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, Matlab里有关散布度量计算的函数 在Matlab里,有关散布度量计算的函数为: 1: 计算样本的内四分位数间距的 iqr(x)。 2: 求样本数据的平均绝对偏差的 mad(x)。 3: 计算样本极差的 range(x)。 4: 计算样本方差的 var(x,w)。 5: 求样本的标准差的 std(x)。 6: 求协方差矩阵的 cov(
12、x)。 这些函数的详细说明可以参见Matlab的帮助文档。 Zhisheng(James) Zhang, School of Mechanical Engineering, Southeast University, 2.3 中心矩 中心矩是关于数学期望的矩。对于任意的r ,称 为随机变量x的r阶中心矩。一阶中心矩为0,二阶中心矩 为方差: 函数moment计算任意阶中心矩。 格式:m=moment(x,order) 说明:order确定阶。 ()r r E xEx= DX= 2 Zhisheng(James) Zhang, School of Mechanical Engineering,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Matlab 统计 工具箱
链接地址:https://www.31doc.com/p-8599765.html