大数据管理技术练习题

单选题

  1. 在分布式文件系统HDFS中( )负责数据的存储和读取。 C A. 第二名称节点 B. 名称节点 C. 数据节点 D. 主节点

  2. 以下哪项不属于传统的数据存储和管理技术( )。 C A. NoSQL数据库 B. 关系数据库 C. 数据仓库 D. 文件系统

  3. R为5元关系R(A,B,C,D,E),S为3元关系S(B,C,D),R与S的自然连接构成的新关系为( )元关系。 C A. 4 B. 3 C. 5 D. 6

  4. 已知关系课程表C(Cno,Cname,Cteacher),Cno、Cname、Cteacher分别是课程号、课程名称、授课教师,用关系代数查询“程军”老师所授课程的课程号(C#)和课程名(Cname),正确的是( )。 A A. ∏C#,Cname(σCteacher='程军'(C)) B. σCteacher='程军'(C) C. ∏C#(σCteacher='程军'(C)) D. ∏C#,Cname(σC='程军'(C))

  5. 关系模型中,实体完整性是指( )。 A A. 实体的主码中的属性值不能为空值 B. 实体不允许是空实体 C. 实体的外键值不允许是空值 D. 实体的属性值不能是空值

  6. 在规范化的关系中,下列说法正确的是( ) C A. 行列顺序有关 B. 属性名允许重名 C. 任意两个元组不允许重复 D. 列是非同质的

  7. 现有如下关系:患者(患者编号,患者姓名,性别,出生日期),医疗(诊断书编号,患者编号,患者姓名,医生编号,医生姓名, 诊断日期,诊断结果),其中,医疗关系的外键是( ) A A. 患者编号 B. 患者姓名 C. 患者编号和患者姓名 D. 医生编号和患者编号

  8. 关系数据库表的主键可以由( )字段组成。 D A. 一个 B. 两个 C. 多个 D. 一个或多个

  9. 在数据系统中,在三级模式间引入二级映像的主要作用是( )。 C A. 提高数据与程序的安全性 B. 提高数据与程序间的一致性 C. 提高数据与程序间的独立性 D. 提高数据与程序间的完整性

  10. 数据管理技术依次经历了( )三个阶段。 C A. 人工管理、数据库系统管理、文件系统管理 B. 数据库系统管理、文件系统管理、人工管理 C. 人工管理、文件系统管理、数据库系统管理 D. 文件系统管理、人工管理、数据库系统管理

  11. 上传当前目录下的本地文件file.txt到分布式文件系统HDFS的“/path”目录下的Shell命令是: A A. hdfs dfs -put file.txt /path B. hdfs dfs -put ?/path ?file.txt C. hdfs fs -put file.txt?/path D. hadoop dfs -put /path file.txt

  12. 就数据的量级而言,1PB数据是多少TB( )。 B A. 512 B. 1024 C. 2048 D. 1000

  13. 以下哪个不是大数据时代新兴的技术( )。 C A. Hadoop B. Spark C. MySQL D. HBase

  14. 使用“CREATE( )TABLE score (col1 INT, col2 INT);”语句创建外部表时,括号中关键字是( )。 A A. external B. interval C. partition D. clustered

  15. Hive中删除非空数据库db1的命令是( )。 B A. drop databse db1; B. drop databse db1 cascade; C. drop databse if exists db1; D. drop databse descade db1;

  16. Hive默认的计算引擎是( )。 B A. Spark B. MapReduce C. HDFS D. Strom

  17. 下列关于Hive基本操作命令的解释错误的是( ) A A. load data local inpath ‘/usr/local/data’ overwrite into table student; //把目录’/usr/local/data’下的数据文件 中的数据以追加的方式装载进student表 B. insert into table student select * from user where age>10; //向表student表中插入来自user表的age大于10的 数据 C. create database userdb;//创建数据库userdb D. create table if not exists user(id bigint,name string,age int);//如果user表不存在,创建表user,含三个属性i d,name,age

  18. 以下哪些数据不属于半结构化数据( )。 C A. HTML B. XML C. 二维表 D. JSON

  19. 有关数据仓库的描述,不符合的是( )。 C A. 主要反映历史数据变化状况的数据 B. 用于支持管理决策的 C. 数据常常会随着用户操作产生频繁的增、删、改、查操作 D. 面向主题的,集成的数据集合

  20. 数据库管理系统的英文缩写是( ) C A. DB B. DBS C. DBMS D. DBSS

多选题

  1. 采用多副本冗余存储的优势( )。 BCD A. 节约存储空间 B. 保证数据可靠性 C. 容易检查数据错误 D. 加快数据传输速度

  2. 如下不是分布式文件系统的是( )。 AD A. FAT B. HDFS C. GFS D. NTFS

  3. 关于自然连接的描述,正确的有( ) ACD A. 它要求两个关系中进行比较的分量必须是同名的属性组 B. 任意两个关系都可以做自然连接 C. 做自然连接的第一步先要对两个关系做广义笛卡尔积 D. 自然连接是一种特殊的等值连接

  4. 关系模型为什么要有完整性规则( ) ABC A. 保证数据库中的数据正确有效 B. 为了保证数据库中数据的安全性 C. 为了让数据库中的数据更加真实的体现现实世界 D. 数据库管理员随意制定的一些规则

  5. 数据库的三级模式之间存在的映射,正确的是(? )。 ABC A. 外模式/模式 B. 外模式/内模式 C. 模式/内模式 D. 模式/模式

  6. 数据库系统的三级模式包括( )。 ABC A. 概念模式 B. 内模式 C. 外模式 D. 数据模式

  7. 数据库系统设计可以分为六个阶段,以下( )阶段被包含在内。 ABCD A. 逻辑结构设计阶段 B. 概念结构设计阶段 C. 数据库实施阶段 D. 物理结构设计阶段

  8. 典型的NoSQL数据库的类型包括( )。 ABCD A. 列族数据库 B. 文档数据库 C. 键值数据库 D. 图数据库

  9. 数据仓库的数据ETL过程中,ETL软件的主要功能包括( )。 ABC A. 数据抽取 B. 数据转换 C. 数据加载 D. 数据审核

  10. 关于OLAP和OLTP的区别描述,正确的是( )。 ACD A. OLAP是联机分析处理,发现有价值的信息,对实时性要求不高。 B. OLTP是联机事物处理,对性能要求不高。 C. OLTP的用户通常为决策人员。 D. OLAP的请求数量较少,但每个请求都比较复杂。

判断题

  1. 外模式-模式映像可以保证数据的物理独立性 正确

  2. 在数据库领域的各种逻辑数据模型中,一个结点可以有多个双亲,结点之间可以有多种联系,该数据模型指的 是层次模型。( ) 错误

  3. 在E-R图向关系模型转换的过程中,无论是一个1:1的联系,一个1:n的联系,还是一个m:n的联系,都可以 转换为一个独立的关系模式。( ?) 错误

  4. NoSQL数据库的数据库模式灵活,可扩展性好,同时,所有NoSQL数据库都支持事务的ACID四性。 错误

  5. 传统的关系数据库和NoSQL数据库各有所长,不存在一方完全取代另一方的问题,在很长的一段时期内,二者 都会共同存在,满足不同应用的差异化需求。 正确

  6. Hive、HDFS、HBase等工具可以统一部署在一个Hadoop平台上 正确

  7. 在分布式文件系统HDFS中,数据节点负责管理HDFS的元数据。 错误

  8. HDFS高效存储大量的小文件。 错误

  9. FsImage记录了所有对文件的创建、更新和删除等操作。 正确

  10. 关系数据库不允许外键取空值。 错误

大数据管理技术练习题

原文地址: https://www.cveoy.top/t/topic/ooNX 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录