数学建模复习资料.doc
《数学建模复习资料.doc》由会员分享,可在线阅读,更多相关《数学建模复习资料.doc(22页珍藏版)》请在三一文库上搜索。
1、关于2012数学建模的学习1、 数据收集数据的间接来源:如果与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把它们称为间接来源的数据。从搜集的范围看,这些数据可以取自系统外部,也可以取自系统内部。数据取自系统外部的主要渠道有;统计部门和各级政府部门公布的有关资料,如定期发布的统计公报,定期出版 各类统计年鉴;各类经济信息中心、信息咨询机构、专业调查机构、各行业协会和联合会提供的市场信息和行业发展的数据情报;各类专业期刊、报纸、书籍所提供的文献资料;各种会议,如博览会、展销会、交易会及专业性、学术研讨会上交流的有关资料;从互联网或图书
2、馆查阅到的相关资料等等。取自系统内部的资料,如果就经济活动而言,则主要包括业务资料,如与业务经营活动有关的各种单据、记录;经营活动过程中的各种统计报表,各种财务、会计核算和分析资料等。数据的直接来源:(1) 通过调查方法获得数据调查数据方法:随机抽样调查、分层抽样调查、系统抽样调查收集数据的方法:问卷、面访、电话、收集数据应考虑的几个问题:1、抽样框中的有关信息 2、目标总体的先后 3、调查问题的内容 4、有形辅助物的使用 5、实施调查的资源 6、管理与控制 7、质量要求(2) 通过实验方法获利数据实验方法获得数据要注意控制变量法的应用,实验过程中会遇到一些问题如人的意愿、心理问题、道德问题,
3、实验获得数据还要考虑采用好的统计方法2、 数据分析1、 图表展示分析数据,根据图表可以直观地看出数据分布情况及走势。(统计图:表格、条形统计图、拆线统计图、扇形统计图、频数分析直方图、频率分布直方图)2、 数学参数分析数据集中程度:平均数、中位数、众数(即出现次数最多的,在一定 程度上可以代表一组数据,异众比率()能够说明众数是否准确刻画整组数据,比率大则可以用众数代表整组数据)离散程度:异众比率、方差、标准差、极差分布形状:偏态SK(偏态是对数据分布对称性的测度:,如果一组数据的分布是对称的,则偏态系数等于0;如果偏态系数明显不等于0,表明分布是非对称的。若偏态系数大于1或小于-1,被称为高
4、度偏态分布;若偏态系数在0.51或-1-0.5之间,被认为 是中等偏态分布;偏态系数越接近0,偏斜程度就越低)、峰态K(峰态是刻画平峰或尖峰程度的测度峰态通常是与标准正态分布相比较而方的。如果一组数据服从标准正态分布,则峰态系数的值等于0;若峰态系数的值明显不等于0,则表明分布比正态分布更平或更尖,通常称为平峰分布或尖峰分布)数学期望3、 数据处理数据处理有是优化处理的内容好坏,即如何有效有利用、选择数据常见方法有分组取组中的平均数进而减少数据量分析数据所反应的信息。4、 线性回归一元线性回归模型; 在一元线性回归模型中,是的线性函数加上误差项,反映了由于的变化而引起的的线性变化;是被称为误差
5、项的随机变量,反映了除和之间的线性关系之外的随机因素对的影响,是不能由和之间的线性关系所解释的变异性。式中称为模型的参数上述模型的前提是(1) 因变量与自变量有线性关系(2) 在重复抽样中,自变量的取值是固定的,即自变量不是随机的(3) 误差项是一个期望值为0的随机变量,即(4) 对于所有的自变量,的方差都相同 (5) 误差项是一个服从正太分布的随机变量,且独立,即描述因变量的期望值如何中依赖于自变量的方程称为回归方程样本统计量和代替回归方程中的未知参数,得到估计的回归方程 (该方程用最小二乘法来实现,即用MATLAB程序来实现 PLOYFIT(X,Y,2) )利用回归方程进行预测预测是指通过
6、自变量的取值来预测因变量的取值用Excel时行回归分析的操作步骤;1、 选择工具下拉菜单,并选择数据分析选项2、 在分析工具中选择回归,然后单击确定3、 当对话框出现时;在Y值输入区域方框内输入数据区域($A$2:$a$26),在X值输入区域方框内输入数据区域($B$2:$B$26),在置信度选项中给出所需的数值,在输出选项中选择输出区域($c$30),在残差分析选项中选择所需的选项相关系数(Multiple R)反映两个变量之间线性关系强度的统计量不相关或相关程度极弱低度相差中度相关高度相关判定系数(R Square)是对估计的回归方程拟合优度(回归直线与各观测点的接近程度)的度量,其取值范
7、围【0,1】判定系数越接近于1则回归直线与各观测点越接近。反之,越接近于0则回归直线的拟合程度越差。调整的判定系数(Adjusted R Square)标准误差 观测值的个数显著性水平(Significance F)五、时间序列分析和预测第一部份、时间序列及其分解时间序列是同一现象在不同时间上的相继观察值排列而成的序列。它可以分平稳序列和非平稳序列两大类,平稳是基本上不存在趋势序列。非平稳序列是包含趋势、季节性或周期性的序列,它可能只含有其中的一部份,也可能是几种成分的组合。趋势是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动,也称为长期趋势。时间序列中的趋势可以是线性也可以非线性的
8、。季节性也称为季节变动,它是时间序列在一年内重复出现的周期性波动周期性也称循环波动,它是时间序列中呈现出 来的围绕长期趋势的一种波浪形或振荡式变动。时间序列中除去趋势、周期性和季节性之后的偶然性变动,称为随机性,也称为不规则波动综合上述时间序列可分为;传统时间序列分析的一一项主要内容就是把这些成分从时间序列中分离出来,并将它们之间的关系用数学关系予以表达,而后分别进行分析。按4种成分时间序列的影响方式不同,时间序列可分解为加法模型、乘法模型等。其中较为常用的是乘法模型,其表现形式第二部份、时间序列的描述分析1、 图形描述作图可以为选择预测模型提供基本依据2、 增长率分析增长率是对现象在不同时间
9、的变化状况所做的描述。由于对比的基期不同,增长率有不同的计算方法。增长率也称增长速度,它是时间序列中报告其观察值与基期观察值之比减1后的结果,用%表示。由于对比基期不同,增长率可以分为环比增长率和定基增长率。环比增长率是报告期观察值与前一时期观察值之比减1,说明现象逐期增长变化的程度;定基增长率是报告期观察值与某一固定时期观察值之比减1,说明现象在整个观察期内总的增长变化程度。设增长率为G,则环比增长率和定基增长率可表示为;平均增长率;也称平均增长速度,它是时间序列中逐期环比值的几何平均数减1后的结果,计算公式为;关于增长率分析中应注意以下两个问题1、 当时间序列中有观察值出现0或负数时,不宜
10、计算增长率2、 在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析。第三部份、时间序列预测的程序对时间序列进行预测包括以下步骤;1、 确定时间序列所包含的成分,也就是确定时间序列的类型第1、 确定趋势成分确定趋势成分是否存在,可以从绘制时间序列的线图入手。观察是否存在趋势,以及所存在的趋势是线性的还是非线性的。判断趋势成分是否存在的另一种方法是利用回归分析拟合一条趋势线,然后对回归系数进行检验。如果回归系数显著,就可以得出线性趋势显著的结论。第2、 确定季节成分确定季节成分至少需要两年的数据,而且数据需要按季度、月份、周或天等来记录。确定季节成份也可以从绘制时间序列的线图
11、入手,但这里需要一种特殊的时间序列图,即年度折叠时间序列图。绘制该图时,需要将每年的数据分开画在图上,也就是横轴只有一年的长度,每年的数据分别对应纵轴。如果时间序列只存在季节成分,年度折叠时间序列图中的折线将会有交叉;如果时间序列既含有季节成份又含有趋势,那么年度折叠时间序列图中的折线将不会交叉,而且如果趋势是上升的,后面年度的折线将会高于前面年度的折线,如果趋势是下降的,后面年度的折线将低于前面年度的折线。2、 找出适合此类时间序列的预测方法关于平稳序列折预测1、 简单平均法简单平均法适合对较为平稳的时间序列进行预测,即当时间序列没有趋势时,用该方法比较好。但如果时间序列有趋势或季节成份,该
12、方法预测不准确。此外简单平均法将远期的数值和近期的数值看做对未来对等重要。但从预测的角度看,近期的数值要比远期的数值对未来有更大的作用,因此简单平均法预测的结果不够准确。简单平均是根据过去已有的t期观察值通过简单平均来预测下一期的数值。设时间序列已有的t期观察值为则t+1期的预测值;2、 移动平均法移动平均法是通过对时间序列逐期递移求得平均数作为预测值的一种预测方法,其方法有简单移动平均法和加权移动平均法。这里只说简单平均移动平均法。移动平均法只使用最近k期的数据,在每次计算移动平均值时,移动的间隔都为k。该方法也主要适合对较为平稳的时间序列预测。应用时,关键是确定合理的移动间隔长度K。对于同
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 复习资料
链接地址:https://www.31doc.com/p-2741807.html