niusouti.com

MapReduce计算文件词频的例子中描述不正确的是A.包括了Split,Map,Shuffle,Reduce几个过程。在计算过程中数据始终以键值对的形式存在。B.Split就是将输入文件中的内容按行分割为key和value的形式。Map阶段对每块的每一个单词为key,单词个数作为value排序进行输出。C.在Shuffle阶段,会对map的输出按照key进行合并和排序。D.Reduce的过程将所属key下的value进行了叠加,计算出单词key的次数。

题目

MapReduce计算文件词频的例子中描述不正确的是

A.包括了Split,Map,Shuffle,Reduce几个过程。在计算过程中数据始终以键值对的形式存在。

B.Split就是将输入文件中的内容按行分割为key和value的形式。Map阶段对每块的每一个单词为key,单词个数作为value排序进行输出。

C.在Shuffle阶段,会对map的输出按照key进行合并和排序。

D.Reduce的过程将所属key下的value进行了叠加,计算出单词key的次数。


相似考题
更多“MapReduce计算文件词频的例子中描述不正确的是”相关问题
  • 第1题:

    下列关于对安全评价过程控制体系文件中的程序文件的描述,不正确的是( )。


    正确答案:B

  • 第2题:

    下面例子中,哪个例子是描述性研究的最好例子()

    A企业调查

    B农村调查

    C经济调查

    D人口普查


    D

  • 第3题:

    spark架构计算速度比mapreduce计算速度快单纯因为内存


    正确答案:错误

  • 第4题:

    在Bigtable中,()主要用来存储子表数据以及一些日志文件

    • A、GFS
    • B、Chubby
    • C、SSTable
    • D、MapReduce

    正确答案:A

  • 第5题:

    mapreduce是基于()运行的计算框架

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第6题:

    在MapReduce编程模式中,Map任务的输入是()?

    • A、一个或多个文件块
    • B、由文件块转换的键值表对
    • C、文件系统中一篇文档
    • D、数据库中一条元组

    正确答案:A

  • 第7题:

    MapReduce是一个什么类型的并行计算系统?

    • A、专门为MPI设计的系统
    • B、图计算
    • C、流计算
    • D、作业批处理

    正确答案:D

  • 第8题:

    单选题
    关于MapReduce的描述,错误的是()。
    A

    易于编程

    B

    良好的扩展性

    C

    实时计算

    D

    高容错性


    正确答案: D
    解析: 暂无解析

  • 第9题:

    判断题
    MapReduce设计的一个理念是“数据向计算靠拢”
    A

    B


    正确答案:
    解析: 暂无解析

  • 第10题:

    单选题
    MapReduce适合做下列哪项()。
    A

    迭代计算

    B

    离线计算

    C

    实时交互计算

    D

    流式计算


    正确答案: B
    解析: 暂无解析

  • 第11题:

    问答题
    MapReduce适合做哪些计算?

    正确答案: MapReduce计算模型对于高性能要求的应用以及平行计算领域的需求非常适合。对于大量数据要做同样的计算的时候,就可以把数据进行划分,然后分配到不同的机器上来分别作计算。
    解析: 暂无解析

  • 第12题:

    单选题
    MapReduce中默认把输入文件按照多少MB来划分?
    A

    16

    B

    32

    C

    64

    D

    128


    正确答案: C
    解析: 暂无解析

  • 第13题:

    MapReduce中默认把输入文件按照多少MB来划分?

    A.16

    B.32

    C.64

    D.128


    参考答案:C

  • 第14题:

    MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()

    • A、实时性
    • B、高容错性
    • C、易于扩展
    • D、易于编程

    正确答案:B,C,D

  • 第15题:

    与spark基于内存相比,mapreduce是基于()运行的计算框架

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第16题:

    hadoop中的mapreduce是基于什么运行的计算框架()

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第17题:

    有关MapReduce的输入输出,说法错误的是().

    • A、链接多个MapReduce作业时,序列文件是首选格式
    • B、把输入数据划分为分片,分片数目和大小任意定义
    • C、想完全禁止输出,可以使用Null Output Format
    • D、每个reduce需将它的输出写入自己的文件中,输出无需分片

    正确答案:B

  • 第18题:

    MapReduce中默认把输入文件按照多少MB来划分?

    • A、16
    • B、32
    • C、64
    • D、128

    正确答案:C

  • 第19题:

    问答题
    请描述在YARN框架中执行一个MapReduce程序时,从提交到完成需要经历的具体步骤。

    正确答案: ①用户编写客户端应用程序,向YARN提交应用程序,提交的内容包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等。
    ②YARN中的ResourceManager负责接收和处理来自客户端的请求。接到客户端应用程序请求后,ResourceManager里面的调度器会为应用程序分配一个容器。同时,ResourceManager的应用程序管理器会与该容器所在的NodeManager通信,为该应用程序在该容器中启动一个ApplicationMaster。
    ③ApplicationMaster被创建后会首先向ResourceManager注册,从而使得用户可以通过ResourceManager来直接查看应用程序的运行状态。
    ④ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请资源。
    ⑤ResourceManager以“容器”的形式向提出申请的ApplicationMaster分配资源,一旦ApplicationMaster申请到资源后,就会与该容器所在的NodeManager进行通信,要求它启动任务。
    ⑥当ApplicationMaster要求容器启动任务时,它会为任务设置好运行环境(包括环境变量、JAR包、二进制程序等),然后将任务启动命令写到一个脚本中,最后通过在容器中运行该脚本来启动任务。
    ⑦各个任务通过某个RPC协议向ApplicationMaster汇报自己的状态和进度,让ApplicationMaster可以随时掌握各个任务的运行状态,从而可以在任务失败时重启任务。
    ⑧应用程序运行完成后,ApplicationMaster向ResourceManager的应用程序管理器注销并关闭自己。若ApplicationMaster因故失败,ResourceManager中的应用程序管理器会监测到失败的情形,然后将其重新启动,直到所有任务执行完毕。
    解析: 暂无解析

  • 第20题:

    单选题
    MapReduce是一个什么类型的并行计算系统?
    A

    专门为MPI设计的系统

    B

    图计算

    C

    流计算

    D

    作业批处理


    正确答案: B
    解析: 暂无解析

  • 第21题:

    单选题
    下面例子中,哪个例子是描述性研究的最好例子()
    A

    企业调查

    B

    农村调查

    C

    经济调查

    D

    人口普查


    正确答案: A
    解析: 暂无解析

  • 第22题:

    单选题
    有关MapReduce的输入输出,说法错误的是().
    A

    链接多个MapReduce作业时,序列文件是首选格式

    B

    把输入数据划分为分片,分片数目和大小任意定义

    C

    想完全禁止输出,可以使用Null Output Format

    D

    每个reduce需将它的输出写入自己的文件中,输出无需分片


    正确答案: C
    解析: 暂无解析

  • 第23题:

    单选题
    Hadoop中MapReduce组件擅长处理哪种场景的计算任务?()
    A

    迭代计算

    B

    离线计算

    C

    实时交互计算

    D

    流式计算


    正确答案: C
    解析: 暂无解析

  • 第24题:

    单选题
    在MapReduce编程模式中,Map任务的输入是()?
    A

    一个或多个文件块

    B

    由文件块转换的键值表对

    C

    文件系统中一篇文档

    D

    数据库中一条元组


    正确答案: C
    解析: 暂无解析