从MapReduce程序中读取xls文件

时间:2013-12-27 05:37:39

标签: java hadoop mapreduce

我需要读取保存在Hadoop集群上的XLS文件。我需要使用JAVA的MapReduce编程模型解析文件。 请帮助我。

提前致谢

1 个答案:

答案 0 :(得分:1)

我相信你有两个选择:

  • 编写您自己的可以读取Excel文件的自定义InputFormat
  • 从电子表格生成CSV或TSV文件,并使用TextInputFormat