HDFS分布式文件系统,是谷歌文件系统GFS的开源实现,而Hadoop MapReduce也是针对谷歌MapReduce的开源实现。
第1题:
大数据储存技术首先需要解决的是数据还量化和快递增长需求,其次是处理格式多样化的数据。谷歌文件系统(GFS)和Hadoop 的( )奠定了大数据储存技术的基础。
A.分布式文件系统
B.分布式数据库系统
C.关系式数据库系统
D.非结构化数据分析
第2题:
第3题:
Hadoop分布式文件系统(HDFS)具有()的特性。
第4题:
以谷歌GFS6为代表的分布式文件系统将数据分为()同样大小的文件块。
第5题:
Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。
第6题:
并行数据处理框架MapReduce是()公司在大数据领域的重要贡献。
第7题:
大量小文件存储
高容错,高吞吐量
低延迟读取
流式数据访问
第8题:
Hive最终将数据存储在HDFS中
HiveSQL其本质是执行MapReduce任务
Hive是Hadoop平台的数据仓库工具
Hive对HBase有强依赖
第9题:
谷歌公司
百度公司
雅虎公司
脸谱公司
第10题:
谷歌操作系统
MapReduce
谷歌文件系统
BigTable
第11题:
百度
谷歌
脸谱
腾讯
第12题:
百度
谷歌
脸谱
腾讯
第13题:
试题二(共25分)
阅读以下关于分布式存储系统设计的叙述,回答问题1至问题3。
某软件公司开发基于云计算的分布式文档协作平台( DDCP),系统部分需求如下所示:
(1)实现文档的分布式存储,客户端可随时随地上传和下载文档;
(2)支持多客户端并发编辑同一文档,某个客户端所做修改会实时显示在其他客户端;
(3)要求系统具有自我修复机制,当系统中某个节点失效时,无需人工干预能够自动实现节点替换并恢复到一致状态。
项目组经过讨论,决定采用现有的分布式文件系统作为基础架构,但在具体选用哪种设计方案时产生了分歧。王工建议采用Hadoop分布式文件系统HDFS作为系统参考架构,但张工认为Google分布式文件系统GFS更适合该系统需求。最后经过更为详细
的分析和讨论,同意了张工的建议,采用GFS作为分布式文档协作平台的文件系统架构。
【问题1】(12分)
请用300字以内的文字说明GFS和HDFS有何异同,并针对系统需求,用200字以内的文字说明选择GFS的原因。
【问题2】(8分)
针对图2-1所示DDCP基础架构,请分别说明一次数据读操作和一次并发写操作的过程。
【问题3】(5分)
请分别叙述采用GFS和HDFS架构,单点失效问题是如何解决的。
第14题:
谷歌的云计算主要由()组成,它们是谷歌内部云计算基础平台的主要部分。
第15题:
随着谷歌()和()的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。
第16题:
谷歌在()年连续发表了3篇很有影响力的文章,分别阐述了GFS、MapReduce和BigTable的核心思想。
第17题:
分布式文件系统GFS是()公司在大数据领域的重要贡献。
第18题:
MapReduce
谷歌文件系统
igTable
以上三个选项都对
第19题:
第20题:
MR
Spark
HDFS
HBase
第21题:
Google GFS
Google MapReduce
Google BigTable
Google Chubby
第22题:
适合数据批量处理
数据处理能力极强
最大化吞吐率
允许计算向数据迁移
适合多线程问题
第23题:
第24题: