Hadoop问题请回答

时间:2015-01-29 10:27:22

标签: hadoop

请回答以下问题

1)给定具有以下结构的文件目录:行号,制表符,字符串:

示例:

  

1 abialkjfjkaoasdfjksdlkjhqweroij

     

2 kadfjhuwqounahagtnbvaswslmnbfgy

     

3 kjfteiomndscxeqalkzhtopedkfsikj

您希望将每一行作为一条记录发送到Mapper。你应该使用哪种InputFormat 完成这一行:conf.setInputFormat(____ .class); ?

一个。 SequenceFileAsTextInputFormat

B中。 SequenceFileInputFormat

℃。 KeyValueFileInputFormat

d。 BDBInputFormat

2)您想对大量图像进行分析。您希望将此数据存储在HDFS中 并使用MapReduce处理它,但您也想为您的数据分析师和数据科学家提供帮助 能够使用解释的高级编程直接从HDFS处理数据 像Python这样的语言。您应该使用哪种格式将此数据存储在HDFS中?

一个。 SequenceFiles

B中。阿夫罗

℃。 JSON

d。 HTML

电子。 XML

F。 CSV

3)哪个过程描述了映射器的生命周期。

一个。 jobTracker调用TaskTracker的configure()方法,然后调用map()方法,最后调用close()方法。

B中。任务跟踪器生成一个新的映射器进程来处理单个InputSplit的所有记录。

℃。任务跟踪器会生成一个新的映射器进程来处理每个键值对。

d。 JobTracker生成一个新的映射器进程来处理单个输入文件的所有记录。

4)以下哪项最能说明TextInputFormat的工作原理?

一个。输入文件拆分可能会跨越换行符。将忽略跨越tile拆分的行。

B中。输入文件在换行符处精确分割,因此每个Record Reader将读取一系列块。

℃。输入文件拆分可能会跨越换行符。跨越文件拆分的行由包含虚线的两个拆分的RecordReader读取。

d。输入文件拆分可能会跨越换行符。跨越文件拆分的行由包含折线末尾的拆分的RecordReader读取。

电子。输入文件拆分可能会跨越换行符。跨越文件拆分的行由包含折线开头的拆分的RecordReader读取。

1 个答案:

答案 0 :(得分:0)

回答1:

C- KeyValueFileInputFormat

此处有更多信息:InputFormat Decision

回答2:

A-序列文件

此处有更多信息:http://www.aiopass4sure.com/cloudera-exams/ccd-410-exam-questions/which-format-should-you-use-to-store-this-data-in-hdfs.html

回答3:

C-任务跟踪器产生一个新的映射器进程来处理每个键值对。

此处有更多信息:http://www.aiopass4sure.com/cloudera-exams/ccd-410-exam-questions/which-process-describes-the-lifecycle-of-a-mapper.html

回答4

D-输入文件拆分可能会跨越换行符。跨越文件拆分的行由包含折线末尾的拆分的RecordReader读取。

此处有更多信息:http://www.aiopass4sure.com/cloudera-exams/ccd-333-exam-questions/which-of-the-following-best-describes-the-workings-of-textinputformat.html