1、国家开放大学2023-2024学年大数据分析与挖掘技术模拟试卷及答案解析【题目】【题型:单选题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于Python的说法错误的是()。A.Python是一种面向对象的解释型高级编程语言B.可移植性和可扩展性不强C.1结构简单,语法和代码定义清晰明确D.易于学习和维护【答案】B【知识点】04399.1.1.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于Python中的注释说法正确的是()。A.Python中可以
2、使用州作为注释,“#右边的一切内容均不会被执行B.Python中可以使用州进行一行或多行注释C.Python中注释下的一切内容会被执行但不显示D.PythOn中只有使用州这一种注释方法【答案】A【知识点】04399.1.1.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:否】【自动判分:是】【应用类别:终考】【特殊标签:】如需在Python中安装第三方工具库或包(PaCkages),可以在终端使用的命令是()。【A.】install(package的名称)B.installpip(package的名称)C.pipinstall(package的名称)D.PiP(P
3、aCkage的名称)【答案】C【知识点】04399.1.1.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】关于统计和数据挖掘,下列说法错误的是()。A.统计侧重于从样本到总体的推断B.J数据挖掘侧重于预测个体记录(Cl经典统计中强调的推断在数据挖掘中已不存在D.经典统计中强调的推断在数据挖掘中依然存在【答案】D【知识点】04399.1.1.1【解析】无【题目】【题型:多选题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于Python的说法正确的是()。A.
4、Python是一种面向对象的解释型高级编程语言B.J可移植性和可扩展性不强C.结构简单,语法和代码定义清晰明确D.易于学习和维护【答案】ACD【知识点】04399.1.1.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】关于统计和数据挖掘,下列说法正确的是()。(A.)统计侧重于从样本到总体的推断B.数据挖掘侧重于预测个体记录C.J经典统计中强调的推断在数据挖掘中已不存在D.经典统计中强调的推断在数据挖掘中依然存在【答案】ABC【知识点】04399.1.1.1【解析】无【题目】【题型:多选题】【难度:易】【考核能
5、力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】统计和数据挖掘的主要区别是()。A.统计侧重于从样本到总体的推断B统计侧重于预测个体记录CJ数据挖掘侧重于从样本到总体的推断D.数据挖掘侧重于预测个体记录【答案】AD【知识点】04399.1.1.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列属于PythOn的第三方库的是()。A.StatsmodelsB.MatplotlibC.ScipyD.Scikit-Iearn【答案】ABCD【知识点】04399.1.1.1【解析】无【题目】【
6、题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于Python中的注释说法错误的是()。A.Python中可以使用州作为注释,“#右边的一切内容均不会被执行B.Python中可以使用州进行一行或多行注释C.Python中注释下的一切内容会被执行但不显示D.PythOn中只有使用州这一种注释方法【答案】BCD【知识点】04399.1.1.1【解析】无【题目】【题型:判断题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】Python中可以使用州作为注释,州右边的一切内容均不会被执行。A
7、VB.【答案】A【知识点】04399.1.1.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】Python是一种面向对象的解释型高级编程语言,其结构简单,易于学习和维护,但可移植性和可扩展性较差。A.VB.【答案】B【知识点】04399.1.1.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】Python中的注释会被执行但不显示结果。A.VBJ【答案】B【知识点】04399.1.1.1【解析】无【题目】【题型:判断题】【难度:易】
8、考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】与统计学相比,数据挖掘以开放式方式处理大型数据集,这使得其不可能像推断所需的那样对所分析问题施以严格的限制。A.VBJ【答案】A【知识点】04399.1.1.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】Python中只能使用州作为注释,并且可以对多行注释。A.VB.【答案】B【知识点】04399.1.1.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签
9、经典统计中强调的推断在数据挖掘中依然存在。A.B【答案】B【知识点】04399.1.1.1【解析】无【题目】【题型:单选题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】在PythOn基本库中,最常见也是最主要的数据结构类型是()。(A.)表格B.文字C.J数组D.序列【答案】D【知识点】04399.1.1.2【解析】无【题目】【题型:多选题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】Python中常见的序列数据结构类型有()。A.数字B列表C.1元组D.字典【答案】ABCD【知识点】043
10、99.1.1.2【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】在Python基本库中,序列是最常见也是最主要的数据结构类型。A.VB.【答案】A【知识点】04399.1.1.2【解析】无【题目】【题型:判断题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】Python可以使用import语句导入已经安装在系统中的package0A.B【答案】A【知识点】04399.1.1.3【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:
11、是】【应用类别:终考】【特殊标签:】在调用StatSmodeIS进行数据分析时,往往采用数据分析接口(api)的方式进行。A.VB.【答案】A【知识点】04399.1.1.3【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列操作不属于数据分析和挖掘的一般流程的是()。A.数据预处理B.1探索性分析C.从平台或渠道获取数据D.将模型结果进行可视化【答案】C【知识点】04399.1.3.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下
12、列操作属于数据分析和挖掘的一般流程的是()。(A)数据预处理B.J探索性分析C.J从平台或渠道获取数据D.将模型结果进行可视化【答案】ABD【知识点】04399.1.3.1【解析】无【题目】【题型:判断题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据挖掘的对象是各种各样的数据,针对不同的数据其分析方法可能是不同的。但这并不是说数据挖掘没有章法,其是有一般流程的。A.VB.【答案】A【知识点】04399.1.3.1【解析】无【题目】【题型:判断题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数
13、据挖掘的对象是各种各样的数据,针对不同的数据其分析方法可能是不同的,所以说数据挖掘没有章法。A.VB.【答案】B【知识点】04399.1.3.1【解析】无【题目】【题型:单选题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据预处理是数据分析工作的()。A.实施阶段BJ准备阶段【C.】总结阶段D.收尾阶段【答案】B【知识点】04399.2.1.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据预处理涉及数据整理和整合的各个方面,不包括()。A.数据清洗B.数据筛
14、选C.1数据变换【D.】数据可视化【答案】D【知识点】04399.2.1.1【解析】无【题目】【题型:单选题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】除了填补缺失值,另一个处理缺失值的常用方法就是删除缺失值。这可以通过函数()实现。A.)dropna()B.deletena()C.clearna()D.throwna()【答案】A【知识点】04399.2.1.1【解析】无【题目】【题型:单选题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】删除缺失值的函数dropna(),默认是删除行,如果要
15、对列进行删除,则需要添加参数()。A.ais=nullB.ais=-lC.axis=0D.ais=l【答案】D【知识点】04399.2.1.1【解析】无【题目】【题型:单选题】【难度:难】【考核能力:应用】【漏选得分:否】【自动判分:是】【应用类别:终考】【特殊标签:】如果想把原始数据中的问号转成Python中缺失值的表示方式NaN,可以输入的语句是()OimportnumpyasnpA.)data=data.replace(7znp.NaN)B.data=data.replace(7,znp.NaN)C.data=data.replace(,7zNaN)D.data=data.replace
16、7,z,np.NaN,)【答案】B【知识点】04399.2.1.1【解析】无【题目】【题型:单选题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于函数dropna()的说法不正确的是()。(A.J作用是删除缺失值B默认是删除行C.1默认是删除列D.作用于数据框来实现【答案】C【知识点】04399.2.1.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列不属于缺失值的产生原因的是()。A.数据本身为异常值B.J某些原因没有收集到信息C.1对于这些个体来
17、说这些属性是不可用的D.数据重复出现【答案】AD【知识点】04399.2.1.1【解析】无【题目】【漏选得分:是】【自动判分:是】【题型:多选题】【难度:难】【考核能力:应用】【应用类别:终考】【特殊标签:】下列关于函数dropna()的说法正确的是()。A.作用是删除缺失值B.J默认是删除行C.)默认是删除列D.作用于数据框来实现【答案】ABD【知识点】04399.2.1.1【解析】无【题目】【自动判分:是】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【应用类别:终考】【特殊标签:】一般数据的预处理,主要包括()。A.异常点检测B噪声数据检测C.1缺失值的处理D.重复数据的
18、处理【答案】ABCD【知识点】04399.2.1.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据预处理涉及数据整理和整合的各个方面,主要包括()。A.数据清洗B数据筛选C,1数据变换D.数据可视化【答案】ABC【知识点】04399.2.1.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】缺失值的产生,有可能是因为()。A.数据本身为异常值B.J某些原因没有收集到信息C对于这些个体来说这些属性是不可用的D.数据重复出现【答案】B
19、C【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】缺失值的产生有可能是因为某些原因没有收集到信息,也有可能是对于这些个体来说这些属性是不可用的。A.VB.【答案】A【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】dropna()函数默认是删除列,要对行进行删除,则需要添加参数axis=,A.VBJ【答案】B【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【
20、难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据预处理是数据分析工作的实施阶段。A.VB.【答案】B【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】在某些情况下,有些时候并不一定会收集到数据,因而会造成观测值或变量的数据有缺失,这些缺失的数据就称为缺失值。A.VB.【答案】A【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:否】【自动判分:是】【应用类别:终考】【特殊标签:】除了
21、填补缺失值,另一个处理缺失值的常用方法就是删除缺失值。这可以通过函数dropna()作用于数据框来实现。A.VB.【答案】A【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据预处理是数据分析工作的准备阶段。A.VB【答案】A【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【难度:易】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】如果数据质量不高,则会影响数据挖掘的结果。A.VB.【答案】A【知识点】04399.2.1.1【解析】
22、无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】dropna()函数默认是删除行,要对列进行删除,则需要添加参数axis=,A.VBJ【答案】A【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】dropna()函数默认是删除行,要对列进行删除,则需要添加参数axis=。A.VB.l【答案】B【知识点】04399.2.1.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是
23、应用类别:终考】【特殊标签:】数据预处理涉及数据整理和整合的各个方面,包括数据清洗、筛选和数据变换,用于数据挖掘前的模型选择等,有助于提高数据挖掘的效率。A.VB.【答案】A【知识点】04399.2.1.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下面哪项代码是对数据data进行标准化的过程()。【A.】Z=(data-data.mean()/data.std()B.Z=(data.mean()-data)/data.std()C.Z=(data-data.std()/data.mean()D.Z=(da
24、ta.std()-data)/data.mean()【答案】A【知识点】04399.2.1.2【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列代码可以将数据data转换成数值型数据的是()。A.pd.to_numeric(data)B.pd.to_num(data)C.pd.to_number(data)D.pd.to_string(data)【答案】B【知识点】04399.2.1.2【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】
25、缺失值会受到标准化过程影响。A.VBJ【答案】B【知识点】04399.2.1.2【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】异常点通常是指处于数据边界和数据集中的其他点有着不同模式的点。A.VB.【答案】A【知识点】04399.2.1.2【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:否】【自动判分:是】【应用类别:终考】【特殊标签:】为了去除异常值,我们可以对每个变量计算Z-得分,然后去除那些Z-得分异常高或者异常低的个体。A.VB.【答案】A【知识点】04399.2.1.2【解析
26、无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】缺失值是不受标准化过程影响的。A.B【答案】A【知识点】04399.2.1.2【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列代码可以将数据集data中的重复个体检测出的是()。A.data.repeat()B.data.repetition()C.data.duplicated()D.data.duplication()【答案】C【知识点】04399.2.1.3【解析】无【题目】【题型:多
27、选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于函数duplicated。的说法不正确的是()。A.函数结果会返回数据中的所有重复值B函数结果会返回一个布尔数组C.1函数结果表明每一行是否与前面行有重复D.函数结果会返同数据中的所有非重复值【答案】AD【知识点】04399.2.1.3【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于函数duplicated。的说法正确的是()。A.函数结果会返回数据中的所有重复值B.J函数结果会返回一个布尔数组(cl
28、函数结果表明每一行是否与前面行有重复D.函数结果会返回数据中的所有非重复值【答案】BC【知识点】04399.2.1.3【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】duplicated。函数会返回一个布尔数组,表明每一行是否与前面行有重复。A.VBJ【答案】A【知识点】04399.2.1.3【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】duplicated。函数可以将数据中的重复值直接筛选出来。A.VB.【答案】B【知识点】0439
29、9.2.1.3【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】一些数据集是由合并数据源形成的,这就使其有可能含有重复数据或者近似重复的个体。A.VB【答案】A【知识点】04399.2.1.3【解析】无【题目】【题型:单选题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合不包括()OA.删除数据的异常值B减少接下来处理数据的大小C.1改变粒度分析(从精细到粗放尺度)D.提高数据的解释能力【答案】A【
30、知识点】04399.2.2.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作,数据整合包括()。A.删除数据的异常值B.J减少接下来处理数据的大小C.改变粒度分析(从精细到粗放尺度)D.提高数据的解释能力【答案】BCD【知识点】04399.2.2.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】数据整合是一个将两个或者多个对象的值合并成一个对象的预处理操作。A.VB.【答
31、案】A【知识点】04399.2.2.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于抽样的说法正确的是()。A.抽样有多种方法,如有放问抽样、无放Pl抽样等B有放回抽样则将抽出来的个体从抽样对象中去除C.无放回抽样有可能对同一个个体抽中了多次D.无放回抽样会有重复的个体【答案】A【知识点】04399.2.3.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于抽样的说法错误的是()。(A.)抽样有多种方法,如有放同抽样、
32、无放同抽样等B.无放回抽样则将抽出来的个体从抽样对象中去除C.有放回抽样有可能对同一个个体抽中了多次D.无放回抽样会有重复的个体【答案】D【知识点】04399.2.3.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于抽样的说法正确的是()。A.抽样有多种方法,如有放同抽样、无放同抽样等(B无放回抽样则将抽出来的个体从抽样对象中去除C.1有放回抽样有可能对同一个个体抽中了多次D.无放问抽样会有重复的个体【答案】ABC【知识点】04399.2.3.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应
33、用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】无放回抽样有可能对同一个个体抽中了多次,有放向抽样则将抽出来的个体从抽样对象中去除,因此不会有重复的个体。A.VBJ【答案】A【知识点】04399.2.3.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】有放回抽样有可能对同一个个体抽中了多次,无放回抽样则将抽出来的个体从抽样对象中去除,因此不会有重复的个体。A.VBJ【答案】A【知识点】04399.2.3.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判
34、分:是】【应用类别:终考】【特殊标签:】离散化是一种将连续取值的变量转换成一个分类变量的数据预处理步骤。A.VB.【答案】A【知识点】04399.2.4.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】离散化是一种将分类取值的变量转换成一个连续变量的数据预处理步骤。A.VB【答案】B【知识点】0439924.1【解析】无【题目】【题型:单选题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于主成分的属性说法错误的是()。(A.)它们是原始变量的线性组合B.它们
35、相互正交(垂直)C.J它们捕获了数据差异最小的方向D.它们捕获了数据差异最大的方向【答案】C【知识点】04399.2.5.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于主成分分析的说法错误的是()。A.主成分分析一种经典的减少分析变量的方法B.J它将数据从原始的低维空间投影到高维空间cl它将数据从原始的高维空间投影到低维空间D.所有原始变量可通过变换的方式得到综合变量,称为主成分【答案】B【知识点】04399.2.5.1【解析】无【题目】【题型:多选题】【难度:难】【考核能力:应用】【漏选得分:是】【自
36、动判分:是】【应用类别:终考】【特殊标签:】下列关于主成分分析的说法错误的是()。A.主成分分析一种经典的减少分析变量的方法B.J主成分分析一种经典增加分析变量的方法C.它将数据从原始的高维空间投影到低维空间D.它将数据从原始的低维空间投影到高维空间【答案】BD【知识点】04399.2.5.1【解析】无【题目】【题型:多选题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于主成分分析的说法正确的是()。A.主成分分析一种经典的减少分析变量的方法B.J主成分分析一种经典增加分析变量的方法(C.它将数据从原始的高维空间投影到低维空间D.它将数据
37、从原始的低维空间投影到高维空间【答案】AC【知识点】04399.2.5.1【解析】无【题目】【题型:多选题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于主成分的属性说法正确的是()。A.J它们是原始变量的线性组合B.它们相互正交(垂直)C.J它们捕获了数据差异最小的方向D.它们捕获了数据差异最大的方向【答案】ABD【知识点】04399.2.5.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于主成分分析的说法正确的是()。(A.J主成分分析一种经典的
38、减少分析变量的方法B.J它将数据从原始的低维空间投影到高维空间C.1它将数据从原始的高维空间投影到低维空间D.所有原始变量可通过变换的方式得到综合变量,称为主成分【答案】ACD【知识点】04399.2.5.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】主成分分析是一种经典的增加分析变量的方法,它将数据从原始的低维空间投影到高维空间。A.VB.X【答案】B【知识点】04399.2.5.1【解析】无【题目】【题型:判断题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】
39、主成分是原始变量的线性组合,它们相互正交(垂直),捕获了数据差异最小的方向。A.VB.【答案】B【知识点】04399.2.5.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】主成分分析是一种经典的减少分析变量的方法,它将数据从原始的高维空间投影到低维空间。A.VB.【答案】A【知识点】04399.2.5.1【解析】无【题目】【题型:判断题】【难度:难】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】主成分是原始变量的线性组合,它们相互正交(垂直),捕获了数据差异最大的方向。A.V
40、B【答案】A【知识点】04399.2.5.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于设定虚拟变量时应当遵循的原则说法不正确的是()。(A.)对于有k个表现值的定性变量,只设定(k个虚拟变量B虚拟变量的值通常用“0或“1”来表示C.J对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1D.设定虚拟变量时对其数量一般不做要求【答案】D【知识点】04399.2.6.1【解析】无【题目】【题型:多选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】设定
41、虚拟变量时应当遵循如下哪些原则()。A.对于有k个表现值的定性变量,只设定(kl)个虚拟变量B虚拟变量的值通常用“0或“1来表示C1对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1D.设定虚拟变量时对其数量一般不做要求【答案】ABC【知识点】04399.2.6.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】设定虚拟变量时,虚拟变量的值通常用“0或“1”来表示。A.VB.【答案】A【知识点】04399.2.6.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分
42、是】【应用类别:终考】【特殊标签:】虚拟变量的设定即把对变量的定量描述转化成对定性数据的描述。A.VB【答案】B【知识点】04399.2.6.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】虚拟变量的设定即把对变量的定性描述转化成对定量数据的描述。A.VB.【答案】A【知识点】04399.2.6.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】设定虚拟变量时,对于有k个表现值的定性变量,只设定(k-l)个虚拟变量。A.VBJ【答案】A【知识点】04399.2.6.1【解析】无【题目】【题型:判断题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】设定虚拟变量时,对于每个样本而言,同一个定性变量对应虚拟变量的值之和不超过1。A.VB.【答案】A【知识点】04399.2.6.1【解析】无【题目】【题型:单选题】【难度:中】【考核能力:应用】【漏选得分:是】【自动判分:是】【应用类别:终考】【特殊标签:】下列关于性能评估的指标说法错误的是()。A.对于预测任务的数