第八章 分析实验数据处理 8_1.pdf
《第八章 分析实验数据处理 8_1.pdf》由会员分享,可在线阅读,更多相关《第八章 分析实验数据处理 8_1.pdf(28页珍藏版)》请在三一文库上搜索。
1、 8-1 数据的特征及分布8-1 数据的特征及分布 一、数理统计的某些基本概念一、数理统计的某些基本概念 1、总体与样本1、总体与样本 总体 : 被研究对象某特性值的全体。 个体 : 组成总体的每个单元。 样本(子样): 自总体中随机抽取的一部分个体。 样 本 容 量 : 样本中所包含个体的数目,用 总体 : 被研究对象某特性值的全体。 个体 : 组成总体的每个单元。 样本(子样): 自总体中随机抽取的一部分个体。 样 本 容 量 : 样本中所包含个体的数目,用n n表示表示。 2、随机变量、随机变量 来自同一总体的无限多个测量值都是随机出现的, 叫随机变量。 多次重复测定的结果不能相同,也不
2、能事先知道。 测量值一经取定就是一个常量,不再有随机性 来自同一总体的无限多个测量值都是随机出现的, 叫随机变量。 多次重复测定的结果不能相同,也不能事先知道。 测量值一经取定就是一个常量,不再有随机性。 第八章分析实验数据处理第八章分析实验数据处理 二、二、随机变量的频数分布随机变量的频数分布 例 例 学 生 测 定学 生 测 定 BaCl22H2O 试 剂 中试 剂 中 Ba 含 量 ( 含 量 ( % ) , 共 有) , 共 有 190 个 数 据 , 区 间 为个 数 据 , 区 间 为 55.48%- 56.46%。将这些数据按组距。将这些数据按组距0.1来分成来分成10组。组。
3、频数:频数:每组中数据的个数每组中数据的个数 相对频数:相对频数:频数在总测定 次数中所占的分数 以各组区间为底相对频数 为高做成一排矩形的相对 频数分布直方图 频数在总测定 次数中所占的分数 以各组区间为底相对频数 为高做成一排矩形的相对 频数分布直方图 其特点:其特点: 1. 离散特性离散特性: 测定值在平均值周围波动, 波动的程度用总体标准偏差表示 测定值在平均值周围波动, 波动的程度用总体标准偏差表示 n x n i i = = 1 2 )( 2. 集中趋势:集中趋势:向平均值集中向平均值集中 = = n i i n x n 1 1 lim总体平均值 总体标准偏差 总体平均值 总体标准
4、偏差 在确认消除系统误差的前提下,总体平均值就是真 值。 在确认消除系统误差的前提下,总体平均值就是真 值。 三、 随机变量的正态分布三、 随机变量的正态分布 当数据无限多,组分的很细时,上述直方图 则变成一条圆滑的曲线,称为 当数据无限多,组分的很细时,上述直方图 则变成一条圆滑的曲线,称为正态分布正态分布。其数学 表达式称为 。其数学 表达式称为正态分布密度函数正态分布密度函数 2 2 2 )( e 2 1 )( = x xf 其两个重要参数 为其两个重要参数 为 、 , 记为, 记为 N( 、 2), 决定曲线在决定曲线在x轴的位置,轴的位置, 决定曲线的形状决定曲线的形状 小曲线高、陡
5、峭、 精密度好; 小曲线高、陡峭、 精密度好; 大曲线低、平坦、 精密度差。 大曲线低、平坦、 精密度差。 随机误差符合正态分布随机误差符合正态分布 1.大误差出现的几率小,小误差出现的几率大。 2.绝对值相等的正负误差出现的几率相等。 3.误差为零的测量值出现的几率最大。 1.大误差出现的几率小,小误差出现的几率大。 2.绝对值相等的正负误差出现的几率相等。 3.误差为零的测量值出现的几率最大。 所有测量值出现的概率总和应为1,即所有测量值出现的概率总和应为1,即 1de 2 1 ),( 2 2 2 )( = xP x 求变量在某区间出现的概率,即对该区间求积分求变量在某区间出现的概率,即对
6、该区间求积分 xbaP x b a de 2 1 ),( 2 2 2 )( = 对于不同的对于不同的、有不同的 曲线,积分比较麻烦,为 简化做数学上的变量转 换,令 有不同的 曲线,积分比较麻烦,为 简化做数学上的变量转 换,令 = x u 将上式两端微分得将上式两端微分得 du=dx uufuxxf u d )(de 2 1 d )( 2 2 = 此时正态分布转换为标准 正态分布,记为 此时正态分布转换为标准 正态分布,记为N(0,12)。 99.74 积分已被做成概率积分表积分已被做成概率积分表uP uu de 2 1 2 0 2 = u x - x P % u=1 - + P=6826.
7、 03413. 02=68.26% u=2 2 -2 +2 P=9546. 04773. 02=95.46% u= 3 3 -3 +3 P=9974. 04987. 02=99.74% 按照正态分布按照正态分布x在区间在区间( -0.5 , +1.5 )出现的概率 解: 根据 出现的概率 解: 根据 x u = 可将可将 -0.5 x +1.5 变换为变换为 -0.5u 1.5 查表查表 u=0.5 时 面积为时 面积为0.1915 u=1.5 时 面积为时 面积为0.4332 则则-0.5u 1.5的总面积即为的总面积即为x在区间在区间( - 0.5 , +1.5 )出现的概率出现的概率 P
8、 = 0.1915 + 0.4332=0.6247 8-2 总体平均值的估计8-2 总体平均值的估计 一、平均值的标准偏差一、平均值的标准偏差 多个样本有多个平均值多个样本有多个平均值 1 x 2 x n x、 . 也遵循正态分布 根据数学推导 也遵循正态分布 根据数学推导 n S S x = n x = 由此可见增加测定次数 可使平均值的标准偏差 减小,一般分析工作平 行测定 由此可见增加测定次数 可使平均值的标准偏差 减小,一般分析工作平 行测定4-6次即可。次即可。 二、置信区间与置信度二、置信区间与置信度 置信度:做某种判断的把握性,用置信度:做某种判断的把握性,用P表示。 置信区间:
9、在一定的概率下,以测量值为中心 包含总体平均值在内的区间。 表示。 置信区间:在一定的概率下,以测量值为中心 包含总体平均值在内的区间。 若若x落在以落在以 为中 心 为中 心1.96 为半长的区 间里,那么以这个 为半长的区 间里,那么以这个x 值为中心,值为中心,1.96 为 半长的区间必然将 为 半长的区间必然将 包含在内。一切可能 的区间里有 包含在内。一切可能 的区间里有95%的区 间包含有 的区 间包含有 。 P 90% u=1.64=x1.64 95% u=1.96 =x1.96 99% u=2.58=x2.58 置信度太高无意义,太低不可信,一般 定为 置信度太高无意义,太低不
10、可信,一般 定为90% 或或95%。 n次测定总体平均值的置信区间为次测定总体平均值的置信区间为 n ux= 置信区间表示如下:置信区间表示如下: ux= (u是由所定概率决定的)是由所定概率决定的) 三、显著性水平三、显著性水平 表示测定值落在置信 区间以外的概率, 用 表示测定值落在置信 区间以外的概率, 用 表示,表示, =1-P 已知测定已知测定NaCl试剂中试剂中Cl含量方法的标准偏差含量方法的标准偏差 =0.05%,若分析结果为,若分析结果为60.60%,计算,计算95%置信度 时总体平均值的置信区间,若( 置信度 时总体平均值的置信区间,若(a)此结果为单次 测定( )此结果为单
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八章 分析实验数据处理 8_1 第八 分析 实验 数据处理 _1
链接地址:https://www.31doc.com/p-4293485.html