niusouti.com
更多“15. Hadoop中,MapReduce处理流程的三大步骤不包括()。”相关问题
  • 第1题:

    MapReduce处理流程的三大步骚不包括()

    A、map

    B、sort

    C、shuffle

    D、reduce


    参考答案B

  • 第2题:

    MapReduce框架提供了一种序列化键/值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是()

    A.实现Writable接口的类是值

    B.实现WritableComparable接口的类可以是值或键

    C.Hadoop的基本类型Text并不实现WritableComparable接口

    D.键和值的数据类型可以超出Hadoop自身支持的基本类型


    正确答案:C

  • 第3题:

    Hadoop之父DougCutting曾曰Spark迟早会把mapreduce给取代,意味着hadoop已经走向没落,会被取代逐渐淘汰


    正确答案:错误

  • 第4题:

    etl处理完成的数据可以存在以下哪些组件中()

    • A、hdfs
    • B、hive
    • C、hbase
    • D、mapreduce

    正确答案:A,B,C

  • 第5题:

    绘制系统流程图的主要根据不包括:()

    • A、信息处理的步骤和内容
    • B、各步骤之间的物理和逻辑关系
    • C、使用流程图常用符号的多少
    • D、每一步所涉及的物理过程

    正确答案:C

  • 第6题:

    在中水处理中,无论采用哪种处理流程,消毒灭菌的步骤及其保障性时必不可少的。


    正确答案:正确

  • 第7题:

    问答题
    Spark的出现是为了解决Hadoop MapReduce的不足,试列举Hadoop MapReduce的几个缺陷,并说明Spark具备哪些优点。

    正确答案: (1)Hadoop存在以下缺点:
    ①表达能力有限;②磁盘IO开销大;③延迟高
    (2)Spark主要有如下优点:
    ①Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作,还提供了多种数据集操作类型,编程模型比MapReduce更灵活;
    ②Spark提供了内存计算,中间结果直接存放内存中,带来更高的迭代运算效率;
    ③Spark基于DAG的任务调度执行机制,要优于MapReduce的迭代执行机制。
    解析: 暂无解析

  • 第8题:

    单选题
    关于Hive和Hadoop其他组件的关系,以下描述错误的是?()
    A

    Hive最终将数据存储在HDFS中

    B

    HiveSQL其本质是执行MapReduce任务

    C

    Hive是Hadoop平台的数据仓库工具

    D

    Hive对HBase有强依赖


    正确答案: D
    解析: 暂无解析

  • 第9题:

    判断题
    企业物流运作流程设计的步骤中不包括实施流程再造。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第10题:

    判断题
    Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫PigLatin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。(  )
    A

    B


    正确答案:
    解析:

  • 第11题:

    单选题
    下面不属于Hadoop安装步骤的是()
    A

    安装JDK和配置Java环境变量

    B

    设置免密码登录

    C

    下载Eclipse集成开发环境

    D

    修改Hadoop配置文件并启动Hadoop


    正确答案: A
    解析: 暂无解析

  • 第12题:

    单选题
    Hadoop中MapReduce组件擅长处理哪种场景的计算任务?()
    A

    迭代计算

    B

    离线计算

    C

    实时交互计算

    D

    流式计算


    正确答案: C
    解析: 暂无解析

  • 第13题:

    Hadoop是Java开发的,所以MapReduce只支持Java语言编写。( )

    此题为判断题(对,错)。


    正确答案:错误

  • 第14题:

    在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,不正确的是()

    A.Job和JobControl类可以管理非线性作业之间的依赖

    B.ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成

    C.使用ChainReducer时,每个mapper和reducer对象都有一个本地JobConf对象

    D.ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高


    正确答案:D

  • 第15题:

    与Hadoop的MapReduce相比,Spark基于内存的运算要快100倍以上,基于硬盘的运算也要快10倍以上


    正确答案:正确

  • 第16题:

    hadoop中的mapreduce是基于什么运行的计算框架()

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第17题:

    订货处理流程的步骤?


    正确答案: 订货处理流程:
    (1)订单准备
    (2)订单传输
    (3)订单录入
    (4)订单状况报告
    (5)定单履行

  • 第18题:

    问答题
    请描述在YARN框架中执行一个MapReduce程序时,从提交到完成需要经历的具体步骤。

    正确答案: ①用户编写客户端应用程序,向YARN提交应用程序,提交的内容包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等。
    ②YARN中的ResourceManager负责接收和处理来自客户端的请求。接到客户端应用程序请求后,ResourceManager里面的调度器会为应用程序分配一个容器。同时,ResourceManager的应用程序管理器会与该容器所在的NodeManager通信,为该应用程序在该容器中启动一个ApplicationMaster。
    ③ApplicationMaster被创建后会首先向ResourceManager注册,从而使得用户可以通过ResourceManager来直接查看应用程序的运行状态。
    ④ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请资源。
    ⑤ResourceManager以“容器”的形式向提出申请的ApplicationMaster分配资源,一旦ApplicationMaster申请到资源后,就会与该容器所在的NodeManager进行通信,要求它启动任务。
    ⑥当ApplicationMaster要求容器启动任务时,它会为任务设置好运行环境(包括环境变量、JAR包、二进制程序等),然后将任务启动命令写到一个脚本中,最后通过在容器中运行该脚本来启动任务。
    ⑦各个任务通过某个RPC协议向ApplicationMaster汇报自己的状态和进度,让ApplicationMaster可以随时掌握各个任务的运行状态,从而可以在任务失败时重启任务。
    ⑧应用程序运行完成后,ApplicationMaster向ResourceManager的应用程序管理器注销并关闭自己。若ApplicationMaster因故失败,ResourceManager中的应用程序管理器会监测到失败的情形,然后将其重新启动,直到所有任务执行完毕。
    解析: 暂无解析

  • 第19题:

    判断题
    在中水处理中,无论采用哪种处理流程,消毒灭菌的步骤及其保障性时必不可少的。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第20题:

    单选题
    绘制系统流程图的主要根据不包括:()
    A

    信息处理的步骤和内容

    B

    各步骤之间的物理和逻辑关系

    C

    使用流程图常用符号的多少

    D

    每一步所涉及的物理过程


    正确答案: D
    解析: 暂无解析

  • 第21题:

    问答题
    试述hadoop和谷歌的mapreduce、gfs等技术之间的关系

    正确答案: Hadoop的核心是分布式文件系统HDFS和MapReduce,HDFS是谷歌文件系统GFS的开源实现,MapReduces是针对谷歌MapReduce的开源实现。
    解析: 暂无解析

  • 第22题:

    问答题
    订货处理流程的步骤?

    正确答案: 订货处理流程:
    (1)订单准备
    (2)订单传输
    (3)订单录入
    (4)订单状况报告
    (5)定单履行
    解析: 暂无解析

  • 第23题:

    问答题
    试述MapReduce和Hadoop的关系。

    正确答案: 谷歌公司最先提出了分布式并行编程模型MapReduce, Hadoop MapReduce是它的开源实现。谷歌的MapReduce运行在分布式文件系统GFS上,与谷歌类似,HadoopMapReduce运行在分布式文件系统HDFS上。相对而言,HadoopMapReduce 要比谷歌MapReduce 的使用门槛低很多,程序员即使没有任何分布式程序开发经验,也可以很轻松地开发出分布式程序并部署到计算机集群中。
    解析: 暂无解析

  • 第24题:

    问答题
    MapReduce 是处理大数据的有力工具,但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

    正确答案: 适合用MapReduce来处理的数据集,需要满足一个前提条件:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理。
    解析: 暂无解析