niusouti.com
更多“Hadoop是一个能够对大量数据进行分布式处理的软件框架。”相关问题
  • 第1题:

    大数据储存技术首先需要解决的是数据海量化和快速增长需求,其次处理格式多样化的数据,谷歌文件系统(GFS)和Hadoop的( )奠定了大数据存储技术的基础。

    A.分布式文件系统
    B.分布式数据库系统
    C.关系型数据库系统
    D.非结构化数据分析系统

    答案:A
    解析:
    大数据存储技术首先需要解决的是数据海量化和快速增长需求。存储的硬件架构和文件系统的性价比要大大高于传统技术,存储容量计划应可以无限制扩展,且要求有很强的容错能力和并发读写能力。目前,谷歌文件系统(GFS)和Hadoop的分布式文件系统HDFS奠定了大数据存储技术的基础。大数据存储技术第二个要解决的是处理格式多样化的数据,这要求大数据存储管理系统能够对各种非结构化数据;进行高效管理,代表产品如:谷歌BigTable和HadoopHbase等非关系型数据库(NoSQL)。

  • 第2题:

    Hadoop分布式文件系统(HDFS)具有()的特性。

    • A、适合数据批量处理
    • B、数据处理能力极强
    • C、最大化吞吐率
    • D、允许计算向数据迁移
    • E、适合多线程问题

    正确答案:A,C,D

  • 第3题:

    按照软件的工作方式进行分类,能够对实时发生的事件和数据及时进行处理的软件应分类为()。

    • A、并行处理软件
    • B、分时软件
    • C、交互式软件
    • D、实时处理软件

    正确答案:D

  • 第4题:

    以下软件属于关系型数据库的有()。

    • A、Oracle
    • B、Informix
    • C、Sybase
    • D、Hadoop

    正确答案:A,B,C

  • 第5题:

    Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。


    正确答案:正确

  • 第6题:

    Hadoop有以下哪几个主要应用领域()

    • A、构建大型分布式集群
    • B、数据仓库
    • C、数据挖掘
    • D、数据发散

    正确答案:A,B,C

  • 第7题:

    判断题
    Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第8题:

    判断题
    HDFS是一个不可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第9题:

    单选题
    按照软件的工作方式进行分类,能够对实时发生的事件和数据及时进行处理的软件应分类为()。
    A

    并行处理软件

    B

    分时软件

    C

    交互式软件

    D

    实时处理软件


    正确答案: D
    解析: 暂无解析

  • 第10题:

    判断题
    Hadoop是一个能够对大量数据进行聚合式处理的软件框架。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第11题:

    单选题
    以下关于Hadoop描述不准确的是().
    A

    用于在大量高性能硬件设备组成的集群上运行应用程序

    B

    Apache开源组织的一个分布式计算框架

    C

    旨在构建一个具有高可靠性和良好扩展性的分布式系统,为应用程序提供了一组稳定可靠的接口

    D

    工作原理完全参照Google云计算系统


    正确答案: B
    解析: 暂无解析

  • 第12题:

    单选题
    Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台,该平台使用的是面向对象编程语言()实现的,具有良好的可移植性。
    A

    JAVA

    B

    C++

    C

    Python

    D

    Delphi


    正确答案: B
    解析: 暂无解析

  • 第13题:

    hadoop中的hdfs是分布式()

    • A、计算框架
    • B、存储系统
    • C、中介系统
    • D、网络系统

    正确答案:B

  • 第14题:

    spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集

    • A、单机
    • B、集中式
    • C、分布式
    • D、NOSQL

    正确答案:C

  • 第15题:

    以下关于Hadoop描述不准确的是().

    • A、用于在大量高性能硬件设备组成的集群上运行应用程序
    • B、Apache开源组织的一个分布式计算框架
    • C、旨在构建一个具有高可靠性和良好扩展性的分布式系统,为应用程序提供了一组稳定可靠的接口
    • D、工作原理完全参照Google云计算系统

    正确答案:A

  • 第16题:

    内存计算描述正确的是

    • A、实质上就是CPU直接从内存而非硬盘上读取数据
    • B、在内存中对数据进行分析
    • C、可支持分布式框架
    • D、部分处理要读取硬盘上的数据。

    正确答案:A,B,C

  • 第17题:

    HDFS是一个不可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。


    正确答案:错误

  • 第18题:

    多选题
    Hadoop的HDFS是一种分布式文件系统,适合以下哪种场景的数据存储和管理?()
    A

    大量小文件存储

    B

    高容错,高吞吐量

    C

    低延迟读取

    D

    流式数据访问


    正确答案: C,B
    解析: 暂无解析

  • 第19题:

    多选题
    基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储的组件有?()
    A

    MR

    B

    Spark

    C

    HDFS

    D

    HBase


    正确答案: C,B
    解析: 暂无解析

  • 第20题:

    单选题
    下面关于Hadoop兼容性错误的是()。
    A

    Flink能够支持Yarn,能够从HDFS和HBase中获取数据

    B

    能够使用所有的Hadoop的格式化输入和输出

    C

    能够使用Hadoop原有的Mappers和Reducers,但不能与Flink的操作混合使用

    D

    能够更快的运行Hadoop的作业


    正确答案: A
    解析: 暂无解析

  • 第21题:

    多选题
    Hadoop分布式文件系统(HDFS)具有()的特性。
    A

    适合数据批量处理

    B

    数据处理能力极强

    C

    最大化吞吐率

    D

    允许计算向数据迁移

    E

    适合多线程问题


    正确答案: E,C
    解析: 暂无解析

  • 第22题:

    判断题
    Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集
    A

    B


    正确答案:
    解析: 暂无解析

  • 第23题:

    判断题
    Apache Hadoop 是一个用C语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算系统,它可以让应用程序支持上千个节点和PB级别的数据。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第24题:

    判断题
    Aneka是一个软件平台和在云端开发分布式应用程序的框架。它按需利用台式机和服务器或数据中心异构网络的计算资源。(  )
    A

    B


    正确答案:
    解析: