第10讲数据的统计分析与描述.ppt
《第10讲数据的统计分析与描述.ppt》由会员分享,可在线阅读,更多相关《第10讲数据的统计分析与描述.ppt(61页珍藏版)》请在三一文库上搜索。
1、数学建模与数学实验,数据的统计描述和分析,实验目的,实验内容,2掌握用数学软件包求解统计问题.,1直观了解统计基本内容.,1统计的基本理论.,3实验作业.,2用数学软件包求解统计问题.,统计的基本概念,参数估计,假设检验,数据的统计描述和分析,一、统计量,二、分布函数的近似求法,三、几个在统计中常用的概率分布,1,正态分布,密度函数:,分布函数:,其中,m,为均值,,为方差,,.,标准正态分布:,N,(0,1),密度函数,分布函数,返回,F(10,50)分布的密度函数曲线,参数估计,一、点估计的求法,(一)矩估计法,(二)极大似然估计法,二、区间估计的求法,1已知DX,求EX的置信区间,2 未
2、知方差DX,求EX的置信区间,(一)数学期望的置信区间,(二)方差的区间估计,返回,1.参数检验:如果观测的分布函数类型已知,这时构造出的 统计量依赖于总体的分布函数,这种检验称为参数检验. 参数检验的目的往往是对总体的参数及其有关性质作出明 确的判断.,对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设.,假设检验,2.非参数检验:如果所检验的假设并非是对某个参数作出明 确的判断,因而必须要求构造出的检验统计量的分布函数 不依赖于观测值的分布函数类型,这种检验叫非参数检验. 如:要求判断总体分布类型的检验就是非
3、参数检验.,假设检验的一般步骤,(一)单个正态总体均值的检验,一、参数检验,(二)单个正态总体方差的检验,(三)两个正态总体均值的检验,(四)两个正态总体方差的检验,二、非参数检验,(二)概率纸检验法,概率纸是一种判断总体分布的简便工具.使用他们,可以很快地判断总体分布的类型.概率纸的种类很多.,返回,统计工具箱中的基本统计命令,1. 数据的录入、保存和调用,2. 基本统计量,3. 常见的概率分布函数,4. 频 数 直 方 图 的 描 绘,5. 参数估计,6. 假设检验,7. 综合实例,返回,一、数据的录入、保存和调用,例1 上海市区社会商品零售总额和全民所有制职工工资总额的数据如下:,统计工
4、具箱中的基本统计命令,1年份数据以1为增量,用产生向量的方法输入. 命令格式: x=a:h:b t=78:87,2分别以x和y代表变量职工工资总额和商品零售总额. x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4 y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,3将变量t、x、y的数据保存在文件data中. save data t x y,4进行统计分析时,调用数据文件data中的数据. load data,To MATLAB(txy),方法1,1输入矩阵: data=78,79
5、,80,81,82,83,84,85,86,87; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,2将矩阵data的数据保存在文件data1中:save data1 data,3进行统计分析时,先用命令:load data1 调用数据文件data1中的数据,再用以下命令分别将矩阵data的第一、二、三行的数据赋给变量t、x、y: t=data(1,:) x=data(2,:) y=data(3,:) 若要调用矩阵data的第j列的数据
6、,可用命令: data(:,j),方法2,To MATLAB(data),返回,二、基本统计量,对随机变量x,计算其基本统计量的命令如下: 均值:mean(x) 中位数:median(x) 标准差:std(x) 方差:var(x) 偏度:skewness(x) 峰度:kurtosis(x),例 对例1中的职工工资总额x,可计算上述基本统计量.,To MATLAB(tjl),返回,三、常见概率分布的函数,MATLAB工具箱对每一种分布都提供5类函数,其命令字符为: 概率密度:pdf 概率分布:cdf 逆概率分布:inv 均值与方差:stat 随机数生成:rnd,(当需要一种分布的某一类函数时,将
7、以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.),2019/7/13,30,7.2 随机变量的概率密度计算,7.2.2常见分布的概率密度函数表,2019/7/13,31,7.2 随机变量的概率密度计算,7.2.2常见分布的概率密度函数表,2019/7/13,32,1.3随机变量(离散均匀分布),4.离散均匀分布 定义1.3.6 设X是一个随机变量,离散均匀分布是由如下概率函数所确定的概率分布. f(x)=1/N, x=1,2,N 若x服从离散均匀分布,则x 等概率取1至N中第个整数值.它的图象用柱形图表示如下(N=10时),2019/7/13,3
8、3,1.3随机变量(二项分布),5.二项分布 定义1.3.5 设X是一个随机变量,二项分布是由如下概率函数所确定的概率分布,其中n是正整数,0P1,q=1-p. 有时二项分布也可表示为,用于强调参数对(n,p),以便作图,二项分布的柱状图象如下页所示,2019/7/13,34,二项分布的概率函数图形,二项分布的概率函数的图形因受参数p的影响而呈偏对称阶梯形,若不断增大p的值,则最高点就会不断向右移动,图象整体就偏向右侧。,2019/7/13,35,1.2 二项分布的累积分布函数及图象,二项分布的累积分布函数定义为: 二项分布的累积分布函数的图形为阶梯形(如下):,2019/7/13,36,1.
9、3随机变量(超几何分布),例 某班有男生20名,女生28名,将15张电影票随机发给15名同学,求恰有10名男生得到电影票的概率,并画出概率分布的图象. 解: x(x=0,1,2,15)名男生得到电影票的概率分布是一个几何分布(如下页图形所示),由几何分布公式得X=10的概率为,6.超几何分布 定义1.3.7 设X是一个随机变量,超几何分布是由下面的概率函数所确定,表示为,2019/7/13,37,超几何分布的概率函数的图象,2019/7/13,38,超几何分布的分布函数图象,2019/7/13,39,1.3随机变量(Poisson分布),7 . 几何分布:若随机变量的分布列为 则称服从参数为p
10、的几何分布。几何分布亦来源于贝努里概型。 8普哇松(Poisson)分布。 若的分布列为: 其中 则称服从参数为的普哇松分布,记为,它的图形(n=10,lambda=0.8)如下图所示,2019/7/13,40,1.3随机变量(Poisson分布的概率函数图象),N=10,lamda=0.8时有普哇松分布,2019/7/13,41,1.3随机变量(Poisson分布的分布函数图象),N=10,lamda=0.8,在MATLAB中输入以下命令: x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2); plot(x,y,x,z),1密度函数:p=normpdf(x
11、,mu,sigma) (当mu=0,sigma=1时可缺省),To MATLAB(liti2),如对均值为mu、标准差为sigma的正态分布,举例如下:,2019/7/13,43,1.3 随机变量(分布函数),3.分布函数 定义1.3.4 对任意实数x,随机变量X的分布函数就是X取值不大于x的概率,通常记作F(x),对于离散型变量来说,就是,其中求和是对所有不超过x的t进行的.分布函数也称作累积分 布函数(简写为cdf),这一叫法在于强调分布函数的概率积累。,To MATLAB(liti3),3逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得PXx=P.此命令可用来求
12、分位数.,2概率分布:P=normcdf(x,mu,sigma),To MATLAB(liti4),To MATLAB(liti5),4均值与方差:m,v=normstat(mu,sigma),例5 求正态分布N(3,52)的均值与方差. 命令为:m,v=normstat(3,5) 结果为:m=3,v=25,5随机数生成:normrnd(mu,sigma,m,n).产生mn阶的正态分布随机数矩阵.,例6 命令:M=normrnd(1 2 3;4 5 6,0.1,2,3) 结果为:M=0.9567 2.0125 2.8854 3.8334 5.0288 6.1191,To MATLAB(liti
13、6),此命令产生了23的正态分布随机数矩阵,各数分别服从分布:N(1,0.12), N(2,22), N(3, 32), N(4,0.12), N(5, 22), N(6, 32).,返回,1给出数组data的频数表的命令为: N,X=hist(data,k) 此命令将区间min(data),max(data)分为k个小区间(缺省为10),返回数组data落在每一个小区间的频数N和每一个小区间的中点X.,2描绘数组data的频数直方图的命令为: hist(data,k),四、数 直 方 图 的 描 绘,返回,五、参数估计,1正态总体的参数估计,设总体服从正态分布,则其点估计和区间估计可同时由以
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 10 数据 统计分析 描述
链接地址:https://www.31doc.com/p-3122640.html