第讲数据的编码录入与整理.ppt
《第讲数据的编码录入与整理.ppt》由会员分享,可在线阅读,更多相关《第讲数据的编码录入与整理.ppt(45页珍藏版)》请在三一文库上搜索。
1、第1讲 数据的编码、录入与整理,一、数据的编码、录入与整理,原理 是研究者利用SPSS进行统计分析的必要前提。 就是把通过问卷调查获得的资料转变为SPSS能够识别的数据文件,为各种统计分析做好准备。 数据编码概念 数据编码是指把需要加工处理的数据库信息,用特定的数字来表示的一种技术。 根据一定数据结构和目标的定性特征,将数据转换为代码或编码字符,在数据传输中表示数据的组成,并作为传送、接受和处理的一组规则和约定。,二、数据问卷与编码(举例),问卷量表,二、数据问卷与编码(举例),问卷编码方案,三、编码类型,数值型数据的编码 数值型数据的编码就是根据调查问卷的评分标准对变量赋予分值。 通常采用三
2、点计分、四点计分和五点计分等方式进行评分 如选项A、B、C计分为1、2、3 如选项A、B、C、D计分为1、2、3、4 编码示例中的第5、6题就是属于数值型编码 第5题是正向数值型(被选项的程度越高,分值越大) 第6题是反向数值型(被选项的程度越高,分值越小),三、编码类型,非数值型数据的编码 非数值型数据的编码,首先要确定编码规则,然后根据规则对变量赋予分值。 双值型变量的编码 多采用“0、1”或“1、2”来赋值;如编码示例中的第1题 多值型变量的编码 采用 “1、2、3、”来赋值;如编码示例中的第2题 通常对非数值型数据编码,主要起到分组的作用,不能进行各种算术运算,三、编码类型,多项选择题
3、 多项选择题就是题目答案的选项是多选项 限定多选项分类法 限定了一次最多可以选择项目的个数; 不能直接对题目进行编码,必须先确定最多选择, 并给每个选项建立一个变量; 如编码示例中的第3题 任意多项二分法 表示每一次可以任选几个选项; 编码方法把每一个被选项作为一个变量来定义, 每个变量只能选择“1或0”; 如编码示例中的第4题,四、缺失值的处理,概念 缺失值是指在数据采集与整理过程中丢失的内容,往往会给统计分析带来一些麻烦和误差。 类型 用户缺失值 在问卷调查中把不回答的选项当作缺失值来处理 缺失值可用研究者能识别的数字来表示如“0、9、99” 系统缺失值 指计算机默认的缺失方式,如输入数据
4、空缺、输入非法字符等 通常把缺失值标记为“.”,四、缺失值的处理,缺失值处理方法 替代法:采用统计命令或在相关统计功能中利用参数替代 Transform Replace Missing Values 剔出法:剔除有缺失值的题目或剔除有缺失值的整份问卷,五、数据处理中的操作术语,个案(Cases) 一个研究对象就是一个个案;一个个案就是一条记录;在数据表格中表示为“一行” 每一个个案记录的是一个研究对象各个属性的具体数值,如学生信息(姓名、性别、年龄等) 个案,每一行为一条记录 每一列为一个字段 每个记录只能对应一个对象且仅为一个,字段,学生表,五、数据处理中的操作术语,样本(Sample) 是
5、指具有共同属性的所有研究对象,如学生的所有信息 样本包含多个个案,在数据表格中表示为“n行” 变量(Variable) 是指问卷中每一个问题,数据库里字段,数据表格中表示为“一列” 量值(Value) 是指问卷中的答案,也称为观测值,在SPSS系统里,单元格中的数值就是变量值,六、定义变量,启动SPSS后进入数据编辑窗口,显示为一个空文件,输入数据前首先要定义变量。,六、定义变量,定义变量所包含的内容: 变量名(Name):变量的名称 变量类型(Type):变量的类型 宽度(Width):存储变量值的最大值(1可存储1个字节的字符,2可存储1个汉字) 小数位数(Decimals):变量为数值类
6、型时,小数后的位数 变量标签(Label):对变量名的注释。光标在变量名上时,会显示该标签 变量值标签(Values):变量标签的取值 缺失值(Missing Values):定义缺失的值,例如,当定义99为缺失值时,当该变量的值为99时,把它认为是缺失值 显示数据的列宽(Colums):与上面“宽度”不同,它只管显示 对齐方式 (Align):左对齐、右对齐、居中 量度类型(Measure):定比变量(Scale)、定序变量(Ordinal)、定类变量(Nominal)。只用于统计制图时坐标轴变量的区分和SPSS决策树模块的变量定义。,六、定义变量,单击数据编辑窗口左下方的“Variable
7、 View”标签或双击列的题头(Var),打开变量定义窗口,进行变量定义。,六、定义变量,定义变量名 在定义变量窗口中Name下的单元格中输入变量名 变量名必须以字母开头,长度不超过8个 SPSS保留的关键词不能作为变量名 AND、OR、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ、NE、ALL等 SPSS中允许使用中文变量名,但尽量不要使用,以免出现兼容性问题,六、定义变量,定义变量类型、宽度及小数位数 在Type下单击单元格,打开变量类型窗口,选择变量类型 常用变量类型有: 数值型(Numeric) 日期型(Date) 货币型(Dollar) 字符型(String) 在Wid
8、th、Decimal下单元格,选择宽度和小数位数,系统默认为“8”和“2”;或者在变量类型窗口中设置,六、定义变量,定义变量标签 在Label下单击单元格,输入变量标签 SPSS允许变量标签长度为255字节 定义变量值标签 变量值标签是对变量的每一可能取值进一步描述,当变量是定类或定序变量时,非常有用。变量值标签系统默认为None 在Values下单击单元格,打开变量值标签窗口,输入变量值标签,六、定义变量,定义缺失值 在Missing下单击单元格,打开缺失值窗口,输入缺失值 No missing values:没有缺失值 Discrete missing values:定义13个单一数为缺失
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 编码 录入 整理
链接地址:https://www.31doc.com/p-2572740.html