1、 -中国移动网上大学?探索大数据和人工智能?题库整理Flume采用了三层架构,分别为agent,collector和BA.Map B.storage C.Shuffle D.HashSpark是在哪一年开源的?BA.1980 B.2021 C.1990 D.2000在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢?BA.连接器B.客户端C.接口提供者D.数据采集学习没有标签的数据集的机器学习方法是?BA.监视学习B.无监视学习C.半监视学习D.强化学习以下不是非构造化数据的项是? CA.图片B
2、音频C.数据库二维表数据D.视频2021年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立( A )一职,负责全面推进“数据分享平台战略,并推出大型的数据分享平台。A首席数据官B.首席科学家C.首席执行官D.首席架构师整个 MapReduce的过程大致分为Map、 Shuffle、 bine、( A )?A. ReduceB.HashC. CleanD. Loading在Spak的软件栈中,用于交互式查询的是AA. SparkSQLB.MllibC.GraphXD. Spark Streaming在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问效劳器数量与处理时间是什么
3、关系?BA数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系以下选项中,不是 kafka适合的应用场景是?CA.日志收集B.消息系统C.业务系统D.流式处理大数据的多样性使得数据被分为三种数据构造,那么以下不是三种数据构造之一的是DA.构造化数据B.非构造化数据C.半构造化数据D.全构造化数据以下选项中,不是人工智能的算法中的学习方法的是? AA.重复学习B.深度学习C.迁移学习D.对抗学习自然语言处理难点目前有四大类,以下选项中不是其中之一的是AA.机器性能B.语言歧义性C.知识依赖D.语境传統的机器学习方法包括监视学习、无监视学习和半监视学习,其中监视学习是
4、学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么? DA.给定标签B.离散C.分类D.回归中国移动自主研发、发布的首个人工智能平台叫做( A ) A.九天B. OneNETC.移娃D.大云HDFS中 Namenodef的 Metadata的作用是?AA.描述数据的存储位置等属性B.存储数据C.调度数据D.电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的? AA大数据技术B.互联网技术C.游戏技术D.影像技术随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢? BA.闭源B.开源C.独立D.
5、封闭以下数据单位换算错误的选项是? CA.1KB=1024BB. 1GB=1024MBC.1TB=1000GBD. 1MB=1024KB以下选项中,不是Flume的特点的是?DA.可靠性B.集中式架构C.可扩展性D.可管理性BP神经网络模型拓扑构造不包括DA.输入层B.隐层C.翰出层D.显层以下哪个不是语音识别的范畴? DA.语音听写B.语音合成C.语音转写D.语音唤醒以下哪个场景可以称为大数据场景?CA.故宫游客人B.故宫门票收入C.美团APP的定位信息D.文章内容2021年5月是哪家全球知名咨询公司在? Big data: The next frontier for innovation,
6、 petition and productivity?研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的? BA.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯以下选项中,哪项是分布式文件存储系统?AA.HDFSB. FlumeC. KafkaD. Zookeeper以下选项中,正确描述Flume对数据源的支持的是BA.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式机器学习研究如何通过计算的手段,利用经历来改善系统自身的性能,请问机器学习利用数据训练出什么? AA.模型B.表构造C.结果D.报表以下选项中,不是人工智能的算法中的学习方法
7、的是AA.重复学习B.深度学习C.迁移学习D.对抗学习语音识别产品体系有四局部,以下哪项不是体系之一?BA.语音合成B.语音播放C.语音识别D.语义理解今年,大数据分析将出现革命性的新方法,从前的很多算法和根底理论可能会产生理论級别的突破。而哪项技术将继续成为大数据智能分析的核心技术AA机器学习B.智能物流C.脑科学D.智能终端以下哪个不属于大数据在电信行业的数据商业化方面的应用BA.精准广告B.网络管理C.营销洞察D.大数据检测和决策RDD是由多个什么组成?AA.partitionB. puterC. ActionD. Transformation以下选项中,不是大数据的一局部的是?DA.海
8、量计算B.大量数据管理C.数据分析D.单机计算属于“人造智能,具有意识,到达或超越人类智慧水平的人工看能称为(C) A.高人工智能B.低人工智能C.强人工智能D.弱人工智能mapreduce计算模型适用于哪种任务?CA.多线程处理B.有关联的行处理C.批处理D.实时数据变化处理当前世界产生的数据总量的单位是? BA.KBB. ZBC.GBD.TBIBM提出的大数据5V特征包括更大( Volume)、更快( Velocity)、更多Variety)、更值钱(Value)和( C ) A.更有效B.更充分C.更真实( Veracity)D.更直观Spark.是基于什么的迭代计算框架?它适用于需要屡
9、次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小AA.内存B.硬盘C.磁带D.显卡数据采集的根本步骤(ETL)中不包括哪项?CA.抽取转换B.加载C.计算D.以下哪种学习方法不属于人工智能算法? DA.迁移学习B.对抗学习C.强化学习D.自由学习语音识别常用的应用有四个,以下不是常用应用的是?DA聊天B.拨号C.导航D.设备控制以下选项中,哪项是由谷歌开发的人工能箅法框架? BA. KafkaB. TensorflowC. CaffeD. Torch“大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程
10、优化能力来适应()、高増长率和多样化的信息资产。AA.海量B.少数C.小量D.构造化MPP是指AA.大规模并行处理系统B.受限的分布式计算模型C.集群计算资源管理框架D.分布式计算编程框架Hadoop是( C )年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2021 -2021在 Spark的软件栈中,用于流计算的是?CA. GraphXB. MllibC. Spark StreamingD. SparkSQL以下数据量可以称为大数据的是CA. 100MBB.100KBC. 100PBD.100MB人工智能通过输入的图片,解析出图片的内容,这种技术叫什么? A
11、A.图片识别B.语音识别C.自动驾驶D.消费金融IBM的()是第一个在国际象棋上战胜人类B人工智能计算机。A. AlphagoB. 深蓝C.图灵机模型D.深度学习机器人以下选项中,不是人工智能的根底设施的是? DA.CPU效劳器B.GPU效劳器C.专用芯片D.游戏显卡以下哪个不属于大数据在电信行业的应用? BA数据商业化B.物流网络C.企业运营管理D.客户关系管理客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮助他们快速精准的找到答案。AA.大数据技术B.客户画像C.客户状态D.客户心情IBM提出的大数据5V特征包括( B )、更快(
12、 velocity)、更多( Variety)、更值钱(Value)和更真实( Veracity) A.更有效B.更大(Volume)C.更充分D.更直观Hadoop2系列版本中默认的HDFS的block是多大?CA32MBB.64MBC.128MBD. 16MB工信部官网正式发布大数据产业“一三五“开展规划是在哪一年DA.1987B.1997C.2007D.2021BP神经网络的学习规那么是? BA.梯度上升法B.梯度下降法C.梯度提升法D.梯度曲线法中国移动研发了智能客服问答机器人( D ),使业务流程自动化,更加智能的答复用户解决业务咨询、业务办理、流量查询等问题。A.精灵B.阿尔法蛋C
13、小度D.移娃对抗学习中两个网络互相竟争,一个负责生成样本,那么另一个负责做什么? AA.判别样本B.计算样本C.统计样本D.生成样本以下应用没有使用你的地理位置信息的是? DA.美团B.滴滴C.高德地图D.word以下选项中,不是大数据开展趋势的是DA.大数据分析的革命性方法出现B.大数据与云计算将深度融合C.大数据一体机将陆续发布D.大数据未来可能会被淘汰在 Spark的软件栈中,用于图计算的是CA. Spark StreamingB.MllibC. GraphXD. SparkSQLHBASE的特点不包括哪些?AA.面向行B.稀疏性C.多版本D.高可靠性总体来说,人工智能开展的未来趋势是
14、 AA.上升B.下降C.不动D.大幅度下降以下数据单位从小到大排列的顺序是? BA.GB、B、KBB.B、KB、MBC.KB、ZB、PBD. B、 MB、KB最初的大数据概念还比较模湖,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商? AA.谷歌B.百度C.360D.bing以下选项中,不是用于数据存储的技术是哪一个?DA.MongoDBB.MySQLC.HDFSD.Java多项选择人工智能按照开展层级划分可以分为哪三层?ABCA.计算智能B.感知智能C.认知智能D.人工智能那么以下哪些技术适合流处理?ABA.Spark Streamin
15、g B.Storm C.Hbase D.MapReduce大数据生态中,算法模型分为两代,那么第二代算法模型的两种代表是?ABA.Tez B.Spark C.Pig D.MapReduce电信行业的网络管理和优化包含了两局部的优化,这两项优化是以下选项中的哪两个?BCA.网络速度的优化B.根底设施建立的优化C.网络运营管理和优化D.并发性的优化在数据清洗的过程中,总共可以归为三个阶段,它们分别是?BCDA.数据加工B.数据质量检查C.数据校对D.数据标准化HBASE的特点不包括哪些?ABA.面向行B.稠密性C.多版本D.高可靠性麦肯锡全球研究所对大数据的定义是种规模大到在获取、存储、管理、分析
16、方面大大超出了传統数据库软件工具能力范围的数据集合,具有以下哪些特征?ABCDA.海量的数据规模B.快速的数据流转C.多样的数据类型D.价值密度低以下哪两项是人工智能开展的标志性产品? ABA.深蓝alphagoC.智能门禁D.智能手机人工智能关键技术的根底设施中包含下面哪两项?ABA.算法框架B.根底硬件C.人员D.机器学习在非电信领域,大数据可被应用到的以下哪些方面ACDA.公共平安B.无明显应用C.智能运输D.智能建筑大数据应用领域成就有哪些? ABCA.金融B.互联网电子商务C.工业生产D.没有明显成就以下属于计算机视觉的研究方向的有? ACA.物体识别和检测B.语音导航C.视觉问答看
17、图说话)D.机器翻译传统的机器学习算法可以分为哪三类? ABCA.监视学习B.无监视学习C.半监视学习D.强化学习在人工智能开展历程中有过屡次低谷期,这些低谷期最主要的两项原因是什么? ACA.运算力缺乏B.人员缺乏C.技术瓶颈D.费用太高HBASE的应用场景有哪些?ABDA.半构造化或非构造化数据B.记录非常稀疏C.构造化数据D.超大数据量使用有监视学习的问题可以被分为哪两类? ADA.回归问题B.抽样问题C.聚类问题D.分类问题以下选项属于人工智能的根本概念有ABCDA.机器学习B.深度学习C.BP神经网络D.卷积神经网络以下选项中,是大数据开展趋势的是ACA.开源大数据商业化进一步深化B
18、打包的大数据行业分析应用开拓新市场C.大数据细分市场规模进一步增大D.大数据推动公司并购的规模和数量进一步提升人工智能关键技术框架主要包括哪两层? BCA.根底设施B.算法C.技术D.人员2021年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了哪些大数据的重要组成技术? ABCA.海量数据存储B.数据挖掘C.图像视频智能分析D. python世界经济论坛以“大数据的回报与风险主题发布了?全球信息技术报告(第13版)?,通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义? ABCDA.推动经济开展B.改善公共效劳C.增进人民福祉D.
19、保障国家平安以下选项中,哪两项是可以用于数据采集的技术? ACA. FlumeB. HiveC. KafkaD.Mahout关于RDD,说法正确的两项是?CDA.RDD不能由多个分区( partition)组成B.弹性、集中式内存集C.RDD能生成 ChildrenRDDD.是一个容错的、并行的数据构造以下用到语音识别技术的应用包括:ABCA.苹果手机siriB.微信C.百度地图D.word人工智能目前在以下哪三个领域有了长足的开展?ABDA.安康B.教育C.探索太空D.理财HDFS适用于什么样的应用场景?ABCA.存储和管理PB级别的数据B.处理非构造化数据C.注重数据处理的吞吐量D.大量小
20、文件Flume采用了三层架构,每一层均可以水平扩展,它们分别是?ABCA. agentB. collectorC.storageD. sourceKAfak的总体数据流有三个关键角色,它们分别是ACDA. ProducerB.MessageC. ClusterD. Consumer业务运营监控,可以基于大数据分析从以下哪三个维度为运营商监控管道和客户运营情况? ABDA.网络B.业务C.气候D.用户自然语言处理的主要难点不包括以下哪两项ACA.语言独立性B.语言歧义性C.多国语言D.语境以下数据量不能说成大数据的是?ABA.100MBB.1000KBC.100PBD. 1EB以下哪些属于大数据
21、在电信行业的应用? ABCDA.网络管理和优化B.数据商业化C.客户关系管理D.企业运营管理通过地理位置信息可以分析出哪些信息? BCA.颜值B.家庭住址C.工作地址D.体重人工智能技术的根底设施不包括哪两局部? ACA.系统应用B.机器学习算法C.根底硬件D.算法框架自然语言处理需要解决的难点有哪些? ABCDA.语言歧义性B.语言鲁棒性C.知识依赖D.语境HDFS在哪些场景中表现很差? ABCA.大量小文件B.随机读取C.修改文件D.存储和管理PB级别数据大数据的业务应用处理需要经过哪些流程? ABCDA.数据采集B.数据清洗C.数据建模D.数据加工HDFS适用于哪些场景?BCA.大量小文
22、件B.存储和管理PB级别数据C.一次写入,屡次读取D.低延迟读取人工智能在哪些领域应用广泛? ABCDA.安康医疗B.智能投顾C.智能教育D.智能法务以下哪两个属于大数据特征? ACA.数据体量大B.价值密度高C.数据种类多D.处理速度慢数据建模目前有两种比较通用的方式,分别是? CDA.通用建模B.专属建模C.范式建模D.维度建模以下应用使用了你的地理位置信息的是?ABA. 滴滴B. 百度地图C. wordD. excelBP神经网络模型拓扑构造包括? ABCA.输入层B.隐层C.输出层D.显层HBase是在 Hadoop之上构建的开源分布式构造化数据存储系统,它有哪些特点?AB面向列存储A.非关系型B.面向列存储C.关系型D.面向行存储大数据可以被应用到的行业有?ABCDA.电信B.工业C.政府D.金融- .word.zl