标签: hadoop mapreduce
我一直在研究Hadoop / MR项目,该项目需要处理MS word文档并从中生成一些输出。该文件的格式如下 -
PARAGRAPH1 ....... ....... PARAGRAPH2 ....... .......
PARAGRAPH1
.......
PARAGRAPH2
问题是双管齐下 -
对此的任何帮助都会非常有用。