二数据管理.ppt
《二数据管理.ppt》由会员分享,可在线阅读,更多相关《二数据管理.ppt(91页珍藏版)》请在三一文库上搜索。
1、,数据管理,在数据文件建立好之后,还需要对数据进行必要的加工处理。对同一个数据往往需要从各种不同的侧面进行研究,采取多种统计方法进行分析,而不同的统计方法对数据文件结构的要求不尽相同,这就需要对数据文件的结构进行重新调整或转换,以便适合于相同的统计方法。,数据管理,文件级别的数据管理 变量级别的数据管理,文件级别的数据管理(1),SPSS中的Data菜单提供了文件级别的数据管理,可以对整个数据文件进行加工整理。,Insert Variable:插入变量 Insert Cases:插入记录 Go to Case:到达某条记录,简单命令(这些功能都可以用鼠标在数据表界面 直接完成,很少用菜单操作,
2、在此不详述),Sort Cases:记录排序 Split File:记录拆分 Select Cases:记录筛选 Weight Cases:记录加权,常用的简单过程(使用频繁,必须掌握),文件级别的数据管理(2),Define Variable Properties:定义数据字典 Copy Variable Properties :将预定义的数据 字典直接引入当前数据文件,即复制外部数据 文件属性到当前数据文件,变量与数据文件属性向导(对大型或连续性数据分析项目非常有用),Transpose:数据转置 Restructure:数据文件的重组,数据重构向导,文件级别的数据管理(3),Add Ca
3、ses:纵向合并 Add Variable :横向合并,文件合并过程(Merge Files),Define Dates:定义日期变量过程,用于时间序列数据 Aggregate:数据汇总过程 Identify Duplicate Cases:查找重复记录,其他过程,文件级别的数据管理(4),正交设计过程(Orthogonal Design),单变量排序:SPSS提供了一种简易操作方法, 即在数据表格的变量名处单击右键,弹出右图 多变量排序:使用Sort Cases过程来进行,查看详情,记录排序,记录排序,选中Responese ,选择升序选钮(默认),记录排序,注意: 在多重排序中,指定排序变
4、量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按第二个变量排序 排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,以免数据混乱,记录排序,记录拆分,也可以选择快捷方式,1.选中此框不拆分文件,2.按所选变量拆分文件,各组分析结果放在一起便于比较,3.按所选变量拆分文件,各组分析结果单独放置,4.用于选择拆分数据文件的变量,5.要求将数据按所用拆分变量排序,6.数据集很大,且拆分变量已排序,选此可节省运行时间,记录拆分,1,2,3,4,5,6,记录筛选,快捷方式,1.分析所有记录,2.分析满足条件的记录, 按I
5、f按钮设定筛选条件,3.从原数据中按某种条件抽样,按Sample进行设定,4.基于时间或记录序号选择记录,按Range进行设定,5.使用筛选指示变量选择记录,非0值的记录被选中,6.未选中的记录被隔离,7.选定的个案复制到新的数据集,8.未选中的记录被删除,记录筛选,1,2,3,4,5,6,7,8,记录筛选,划斜线的表示没有选中的个案被过滤了,记录加权,快捷方式,对于采用频数输入方式的数据应设置权重变量,如第三行表示treat单纯药物 outcome有效的人共48个,f是频数变量,应设为权重,记录加权,定义变量属性,变量名、测量尺度等,定义变量属性,变量列表,拷贝变量属性,数据转置,Trans
6、pose:该过程用于对数据进行行列转置,即原来的一条记录转成为一个变量,而变量则转成为一个记录,两次Transpose过程后数据集会恢复原样(点此见具体操作)。,数据转置,将变量VAR00001-VAR000010选入变量框,再点击确定键,转置前的数据集,数据转置,转置后的数据,数据文件重组,示例:,此例中不同性别的体重记录在单独的列中,如果你想要通过t检验, 来比较不同性别的体重,但没有t检验过程所需要的分组变量,这 时就需要重组数据,将一个变量组重组为一个weight变量,同时 创建一分组变量group。,原数据结构,重组后的数据结构,打开数据菜单,选择重组,数据文件重新排列,选择变量重组
7、为个案,数据文件重新排列,此例选择一个变量组,将原数据集中的需 重组的变量组放入 目标变量框,然后 定义重组后目标变 量名。此例重组后 的目标变量名为: weight,此例选择创建单个索引变量,定义索引变量名、标签及索引值,未选定重组变量的处理,完成重组后数据集,合并数据文件,可以使用两种不同的方式合并两个文件中的数据,1、纵向合并: 合并活动的数据集与另一个打开的数据集,两个 数据集中变量相同,个案不同(即将一个数据集中的个案添加到 另一具有相同变量数的数据集中)。 2、横向合并:合并活动的数据集与另一个打开的数据集,两个 数据集中个案相同,变量不同(即将一个数据集中的变量添加到 另一具有相
8、同个案数的数据集中)。 3、无论用那一种合并方式,如果两个数据集中有变量数(或个案 数)不同,则合并后的数据集中有部分缺省值。 4、横向合并有匹配合并和不匹配合并,如何是匹配合并则两个数 据集中必须具有唯一相同的匹配变量。,示例:下面两个数据集分别来自于两家医院,如何合并?,A医院数据集,B医院数据集,选择合并文件 添加个案,Add Cases:纵向合并,从打开的数据文件中增加记录到当前活动数据集中,相互合并的数据文件中应该有相同的变量。,文件纵向合并,左框:新、老数据文件中不匹配的变量名,*:当前数据集中的变量 +:新添加数据集中的变量,右框:已匹配的变量名,选择完成后单击确定即可,合并后的
9、数据集,横向合并示例:,研究开始时的基线数据集,随访结束时的数据集,文件横向合并,1. 未被纳入的变量列 2. 被纳入合并后新数据集的变量列表 3. 记录匹配使用的关键变量,Add Variables:横向合并,从打开数据文件增加变量到活动数据文件,两个数据集要有一个一一对应的关键变量进行匹配合并,且记录应按关键变量排序后再合并。,1,2,3,“分类汇总数据”将活动数据集中的个案组汇总为单个个案并创建新的汇总文件,或在活动数据集中创建包含分类汇总数据的新变量。基于零个或多个中断(分组)变量的值汇总个案。如果未指定中断变量,则整个数据集将成为单个中断组。,分类汇总数据,如果创建新的分类汇总数据文
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据管理
链接地址:https://www.31doc.com/p-3098040.html