以下为《云计算章节测验(无答案)》的无排版文字预览,完整内容请下载
第一章章节测验
1.[单选题]
下列数据属于结构化数据的是
A.职工信息表
B.人脸图片集
C.HTML网页
D.XML
2.[单选题]
下列不属于大数据架构平台的是
A.Hadoop
B.HDFS
C.SQLSever
D.MapReduce
3.[单选题]
下列属于数据采集解决的工具的是
A.ETL工具
B.SVM
C.SPARK
D.Kmeans
4.[单选题]
数据清洗与预处理阶段的工作主要是:
A.使用工具对数据进行分类汇总,通过数据来挖掘数据背后的联系,分析原因,找出规律,然后应用到实际业务中。
B.数据去重,异常处理,数据归一化等
C.直观地展现大数据的特点
D.抽取分布的,异构数据源中的数据到临时文件或者数据库中。
5.[单选题]
下列属于并行计算的描述是
A.每个处理器都有独享的内存,数据交换通过网络完成
B.处理器共享内存
C.处理器共享同一IP地址
D.处理器有独立的硬盘存储
6.[单选题]
下列不属于分布式文件系统的是
A.GFS
B.HDFS
C.Ceph
D.FAT
7.[单选题]
不属于分布式数据库的是
A.HBase
B.MongoDB
C.MySQL
D.ScaleBase
8.[单选题]
下列不属于数据仓库的特点是
A.面向主题的
B.集成的
C.易变化的
D.反映历史变化的
9.[单选题]
下面关于云计算和虚拟化的关系描述不正确的是
A.云计算是一个概念,虚拟化是一种具体技术。
B.虚拟化是云计算之后的应用。
C.虚拟化是云计算中的一部分。
D.云计算的基础是虚拟化。
10.[单选题]
下列与虚拟化技术关系不大的是
A.容器技术
B.KVM技术
C.Linux内核
D.Intel VT
11.[多选题]
大数据技术涉及我们社会生活的层面有:
A.微博
B.朋友圈
C.打车
D.网购
12.[多选题]
各行各业意识到了大数据的价值,涌现出了
A.工业大数据
B.金融大数据
C.医疗大数据
D.教育大数据
13.[多选题]
大数据根据结构可划分为
A.结构化数据
B.非结构化数据
C.混合型数据
D.半结构化数据
14.[多选题]
大数据处理流程的步骤:
A.数据采集
B.数据清洗与预处理
C.数据统计分析和挖掘
D.结果可视化
15.[多选题]
下列属于分布式计算可能出现的问题是
A.编译错误
B.一致性
C.数据完整性
D.任务调度
16.[多选题]
分布式文件系统的关键技术有
A.元数据管理
B.系统可扩展性
C.存储层级Qg的优化技术
D.针对应用和负载的优化
17.[多选题]
常见的虚拟化产品有
A.WMware
B.Virtualbox
C.OpenStack
D.Docker
18.[填空题]
大数据的4个特性是(中文描述):
(1)
(2)
(3)
(4)
19.[填空题]
分布式数据库的特征有
(1)
(2)
(3)
20.[填空题]
Hadoop的核心是
(1)
(2)
(3)
21.[判断题]
XML和HTML属于结构化数据( )
22.[判断题]
结构化数据具有固定的结构,属性划分,以及类型等信息。利于关系数据库中的学生表。( )
23.[判断题]
企业中大部分是结构化数据。( )
24.[判断题]
大数据的价值密度较低( )
25.[判断题]
MapReduce属于分布式计算机程序( )
26.[判断题]
数据仓库是主要用于支持管理决策的。( )
27.[判断题]
分布式计算和并行解决没有区别,完全一样。( )
28.[判断题]
MLlib是Hadoop生态中的机器学习库。
( )
29.[判断题]
Giraph是Hadoop生态数据挖掘算XX。( )
30.[判断题]
Hive是Hadoop的数据仓库工具。( )
第三章章节测验
1.[单选题]
下列对HBase数据模型的描述错误的是
A.HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳
B.HBase列族支持动态扩展,可以很轻松地添加一个列族或列
C.HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本
D.每个HBase表都由若干行组成,每个行由行键(row key)来标识
2.[单选题]
下面关于NoSQL数据库和关系数据库不正确的是
A.NoSQL数据库具有弱一致性,关系型数据库具有强一致性
B.NoSQL数据库缺乏统一的查询语言,而关系型数据库有标准化查询语言
C.NoSQL数据库的可扩展性比传统的关系型数据库更好
D.NoSQL数据库很容易实现数据完整性,关系型数据库很难实现数据完整性
3.[单选题]
下列哪个是文档数据库
A.MySQL
B.MongoDB
C.HBase
D.Redis
4.[单选题]以下对Hadoop的说法错误的是
A.Hadoop是基于JAVA语言开发的,只支持JAVA语言编程
B.Hadoop2.0增加了NameNode和wire-conpatibility 两个重大特性
C.Hadoop核心是HDFS和MapReduce
D.Hadoop MapReduce是针对 谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算
5.[单选题]以下哪个不是hadoop的特性
A.高可靠性
B.高容错性
C.高成本
D.支持多种编程语言
6.[单选题]HDFS的命名空间不包含
A.字节
B.文件
C.块
D.目录
7.[单选题]采用多副本冗余存储的优势不包含
A.节约存储空间
B.保证数据可靠性
C.容易检查数据错误
D.加快传输速度
8.[单选题]下面关于分布式文件系统HDFS的描述正确的是
A.分布式文件系统HDFS比较适合存储大量零碎的小文件
B.分布式文件系统HDFS是谷歌分布式文件系统GFS(Google File System)的一种开源实现
C.分布式文件系统HDFS是Google Bigtable的一种开源实现
D.分布式文件系统HDFS是一种关系型数据库
9.[单选题]
对于HBase数据库而言,每个Region的建议最佳大小是
A.500MB-1000MB
B.1GB-2GB
C.2GB-4GB
D.100MB-200MB
10.[单选题]
Hadoop的两大核心是 和
A.GFS; MapReduce
B.HDFS; HBase
C.HDFS; MapReduce
D.MapReduce; HBase
11.[多选题]
下列对HBase的理解正确的是
A.HBase多用于存储非结构化和半结构化的松散数据
B.HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件
C.HBase是针对谷歌BigTable的开源实现
D.HBase是一种关系型数据库,现成功应用于互联网服务领域
12.[多选题]
HBase和传统关系型数据库的区别在于哪些方面:
A.数据模型
B.数据维护
C.可伸缩性
D.存储模式
13.[多选题]
NoSQL数据库的类型包括
A.列族数据库
B.图数据库
C.文档数据库
D.键值数据库
14.[多选题]以下对名称节点理解正确的是
A.名称节点用来负责具体用户数据的存储
B.名称节点的数据保存在内存中
C.名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问
D.名称节点通常用来保存元数据
15.[多选题]以下对数据节点理解正确的是
A.数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作
B.数据节点通常只有一个
C.数据节点的数据保存在磁盘中
D.数据节点用来存储具体的文件内容
16.[多选题]
NoSQL数据库的类型包括
A.键值数据库
B.文档数据库
C.列族数据库
D.图数据库
17.[填空题]
Hbase是一种 数据库(行式/列式)
18.[填空题]
分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据叫 ,另一类存储具体数据叫 。
19.[填空题]
1TB = ( )MB
20.[填空题]
NoSQL的含义是
21.[判断题]
HDFS采用了主从结构模型,包含多个名称节点和多个数据节点。( )
22.[判断题]
大数据时代数据存储与管理技术包括分布式文件系统、NewSQL和NoSQL数据库、云数据库等。( )
23.[判断题]
传统的关系数据库和NoSQL数据库各有所长,不存在一方完全取代另一方的问题,在很长的一段时期内,二者都会共同存在,满足不同应用的差异化需求。( )
24.[判断题]
Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,是基于Java语言开发的,具有很好的跨平台特性。( )
第四章章节测验
1.[单选题]
下列说法错误的是
A.不同的Map任务之间不能互相通信
B.Map函数将输入的元素转换成形式的键值对
C.MapReduce框架采用了Master/Slave架构,包括一个Master和若干个Slave
D.Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写
2.[单选题]
在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello hadoop hello world”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式:
A.、和
B.、和
C.、和
D.、、和
3.[单选题]
对于文本行“hello hadoop hello world”,经过WordCount的Reduce函数处理后的结果是
A.
B.
C.
D.
4.[单选题]
TaskTracker 使用 来等量划分本节点上的资源量(CPU、内存等)。
A.slot
B.task
C.job
D.client
5.[多选题]
下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是
A.前者相比后者学习起来更难
B.前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好
C.前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型
D.前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好
6.[多选题]
MapReduce体系结构主要由哪几个部分组成
A.TaskTracker
B.JobTracker
C.Task
D.Client
7.[多选题]
下面哪些属于大数据处理与分析技术
A.MapReduce
B.Spark
C.Hive
D.SPSS
8.[多选题]
下面哪些方式产生的数据是图结构数据
A.社交网络
B.传染病传播途径
C.传感监测
D.交通事故对路网的影响
9.[多选题]
下列适用于批处理计算的框架有哪些
A.Pregel
B.Storm
C.MapReduce
D.Spark
10.[填空题]
MapReduce采用 策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片,这些分片可以被多个Map任务并行处理。
11.[填空题]
所谓 过程,是指对Map输出结果进行分区、排序、合并等处理,并交给Reduce的过程。
12.[填空题]
广义的数据分析包括 和 。
(1)
(2)
13.[判断题]
MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。( )
14.[判断题]
广义的数据分析和狭义的数据分析没什么区别。( )
15.[判断题]
Map Reduce处理的是大规模静态数据
( )
16.[判断题]
流计算是针对流数据的实时计算( )
第五章章节测验
1.[单选题]
大数据采集下列说法错误的是
A.来源广泛,数据量巨大
B.数据类型丰富,包括结构化、半结构化和非结构化
C.分布式数据库,分布式文件系统
D.来源单一,数据量相对较少
2.[单选题]
关于数据采集源错误的是
A.传感器
B.互联网
C.书籍报刊
D.日志文件
3.[单选题]
一个字节有()二进制位
A.16
B.8
C.2
D.10
4.[单选题]
计算机中最早的字符编码是(),一个字节只占7个二进制位,最高位为0
A.ASCII
B.UTF
C.UTF-8
D.GBK
5.[单选题]
向服务器发出请求后,服务器回复响应状态码是200代表()
A.成功
B.服务器内部错误
C.服务器拒绝访问
D.应使用代理访问
6.[单选题]
在python中需要导入requests完成对页面的请求,正确的代码是
A.include requests
B.including requests
C.import requests
D.importing requests
7.[单选题]
python中获得相应对象的文本信息的属性是
A.content
B.context
C.text
D.txt
8.[单选题]
requests库中获取数据的编码的属性是
A.encode
B.encoding
C.decode
D.decoding
9.[单选题]
从网页爬取一张图片,需要把Reponse对象的内容以二进制数据的形式返回,使用属性()
A.text
B.binary
C.context
D.content
10.[单选题]
requests库发送了请求,然后得到了服务器的响应,使用方法()
A.post
B.get
C.put
D.delete
11.[判断题]
手机拍照功能属于传感器数据采集的一部分( )
12.[判断题]
互联网数据的采集通常是借助于网络爬虫来完成的。( )
13.[判断题]
网络爬虫不能爬取视频文件( )
14.[判断题]
网络爬虫爬取的非结构化数据不能存储在传统的结构化数据库中( )
15.[判断题]
通过数据源采集到数据后可直接进行存储( )
16.[判断题]
通用爬虫只需要爬行与主题相关的页面,极大地节省了硬件和网络资源( )
17.[判断题]
数据清洗包括缺失值处理、异常值处理、数据类型转换和重复值处理。( )
18.[判断题]
数据脱敏不仅要执行“数据漂白”,抹去数据中的敏感内容,还要保证脱敏前后的数据一致性和有效性( )
19.[判断题]
数据在内存当中处理时,使用的格式是GBK,统一标准。( )
20.[判断题]
Robots协议用来告诉爬虫,哪些页面是可以抓取的,哪些不可以。( )
第六章章节测验
1.[单选题]
数据仓库的特点不包括()
A.面向主体
B.面向对象
C.集成的
D.相对稳定的
2.[单选题]
对数据仓库的理解正确的是()
A.数据仓库就是数据库,二者没有什么区别
B.数据仓库系统被称为OLTP
C.数据仓库面向的用户一般是管理人员或决策层
D.数据仓库里面保存数据都是最新的数据
3.[单选题]
数据仓库里面的数据特征不包括()
A.大量的历史数据
B.提供了汇总和聚集机制
C.可以用于查询和联机事务处理
D.可以在不同的粒度级别、不同的维度视角来存储和管理数据
4.[单选题]
数据仓库中采用的数据模型不包括()
A.E-R模型
B.星形
C.雪花形
D.事实星座
5.[单选题]
OLTO的数据访问模式不包括()
A.主要由短的原子事务所组成
B.既有读操作也有写操作,
C.只能提供读操作
D.需要考虑事务管理、并发控制和故障恢复等机制。
6.[单选题]
数据仓库管理系统的提供商不包括()
A.Oracle
B.NCR
C.IBM
D.iphone
7.[单选题]
数据仓库管理系统在数据仓库体系结构中属于()
A.数据源
B.OLAP引擎
C.前端工具和应用
D.数据存储及管理
8.[单选题]
OLAP引擎的分类不包括()
A.ROLAP
B.MOLAP
C.HOLAP
D.OLTP
9.[单选题]
下列属于多维分析的基本分析动作的是()
A.上扬
B.下降
C.旋转
D.拉伸
10.[单选题]
Hive是一个基于()的数据仓库工具
A.HADOOP
B.HDFS
C.MapReduce
D.HiveQL
11.[多选题]数据仓库的数据 ETL 过程中, ETL 软件的主要功能包括( )
A? 数据抽取 ?????B? 数据转换 ??????C? 数据加载 ??????D? 数据稽核 数
12.[多选题]
下列对数据仓库的理解正确的是()
A.数据仓库用于支持管理和决策,面向分析型数据处理
B.数据仓库是对多个异构的数据源有效集成
C.数据仓库是按照一定的主题域进行组织。
D.面向整个企业的分析处理,数据已经集成,消除了数据的不一致性。
正确答案:ABCD
13.[多选题]
数据仓库中的数据()
A.实时更新,数据根据需要及时发生变化
B.定期加载,加载后的数据极少更新
C.主要关心当前数据
D.包含历史数据
14.[多选题]
操作性数据库与数据仓库的区别不包括()
A.数据的内容不同
B.访问模式不同
C.数据的视图不同
D.产品不一样
15.[多选题]
在Hadoop生态系统中与Hive相联系的其他组件有()
A.HDFS
B.PIG
C.MapReduce
D.HBase
16.[填空题]
数据管理技术的发展可以分为三个阶段,分别是_________、__________、___________。
17.[填空题]
数据仓库的特点包括________、________、________、________、________。
18.[填空题]
数据仓库系统的体系结构包括_________、_________、_________、_________。
19.[填空题]
在星形模式中,它的事实(中心表)描述信息有______、______。
20.[填空题]
多维分析的基本分析动作包括________、________、________、________、________。
21.[判断题]
Hive依赖于HDFS 存储数据,Hive依赖于MapReduce 处理数据。( )
22.[判断题]
OLTP系统面向一般的客户和知识工人或者管理决策人员,并提供数据分析功能。( )
23.[判断题]
操作型数据库是面向特殊处理任务,各个系统之间各自分离。( )
24.[判断题]
操作 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 ,则最终生成的画面需达到:
A.真,就是真实性
B.善,就是易感知
C.美,就是艺术性
D.善,就是有良知
9.[多选题]
可视分析学涉及到的学科包括:
A.计算机图形学
B.数据挖掘
C.人机交互
D.统计分析
10.[多选题]
数据可视化的作用包括:
A.观测、跟踪数据
B.分析数据
C.辅助理解数据
D.增强数据吸引力
11.[判断题]
从数据清洗、数据整合、数据组织、数据分析到最终的知识获取,可视化在这个链条的每个环节中都发挥着互助互利的作用。( )
12.[判断题]
人类的认知十分有限,在利用可视化探索数据的过程中毫无作用。( )
13.[判断题]
可视分析以可视交互界面为通道,利用视觉感知通道和交互可视化,将人类的感知和认识通过可视化融入数据的处理,形成人脑智能和机器智能优势互补和相互提升,建立螺旋式的信息交流和知识提炼,完成理解、推理和决策等任务。( )
14.[判断题]
在对可展示的数据进行筛选时,要确保不能展示过多数据,同时也不能展示过少数据。( )
15.[判断题]
在考虑数据可视化的目标时,能帮助人理解数据、分析数据,比效果美观酷炫更重要。( )
[文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《云计算章节测验(无答案)》的无排版文字预览,完整内容请下载
云计算章节测验(无答案)由用户“huangzexing”分享发布,转载请注明出处