请回答以下问题
1)给定具有以下结构的文件目录:行号,制表符,字符串:
示例:
1 abialkjfjkaoasdfjksdlkjhqweroij
2 kadfjhuwqounahagtnbvaswslmnbfgy
3 kjfteiomndscxeqalkzhtopedkfsikj
您希望将每一行作为一条记录发送到Mapper。你应该使用哪种InputFormat 完成这一行:conf.setInputFormat(____ .class); ?
一个。 SequenceFileAsTextInputFormat
B中。 SequenceFileInputFormat
℃。 KeyValueFileInputFormat
d。 BDBInputFormat
2)您想对大量图像进行分析。您希望将此数据存储在HDFS中 并使用MapReduce处理它,但您也想为您的数据分析师和数据科学家提供帮助 能够使用解释的高级编程直接从HDFS处理数据 像Python这样的语言。您应该使用哪种格式将此数据存储在HDFS中?
一个。 SequenceFiles
B中。阿夫罗
℃。 JSON
d。 HTML
电子。 XML
F。 CSV
3)哪个过程描述了映射器的生命周期。
一个。 jobTracker调用TaskTracker的configure()方法,然后调用map()方法,最后调用close()方法。
B中。任务跟踪器生成一个新的映射器进程来处理单个InputSplit的所有记录。
℃。任务跟踪器会生成一个新的映射器进程来处理每个键值对。
d。 JobTracker生成一个新的映射器进程来处理单个输入文件的所有记录。
4)以下哪项最能说明TextInputFormat的工作原理?
一个。输入文件拆分可能会跨越换行符。将忽略跨越tile拆分的行。
B中。输入文件在换行符处精确分割,因此每个Record Reader将读取一系列块。
℃。输入文件拆分可能会跨越换行符。跨越文件拆分的行由包含虚线的两个拆分的RecordReader读取。
d。输入文件拆分可能会跨越换行符。跨越文件拆分的行由包含折线末尾的拆分的RecordReader读取。
电子。输入文件拆分可能会跨越换行符。跨越文件拆分的行由包含折线开头的拆分的RecordReader读取。
答案 0 :(得分:0)
回答1:
C- KeyValueFileInputFormat
此处有更多信息:InputFormat Decision
回答2:
A-序列文件
回答3:
C-任务跟踪器产生一个新的映射器进程来处理每个键值对。
回答4
D-输入文件拆分可能会跨越换行符。跨越文件拆分的行由包含折线末尾的拆分的RecordReader读取。