Hadoop'grep'的例子

时间:2011-06-06 10:36:18

标签: hadoop mapreduce

在Hadoop'grep'示例(随Hadoop包一起提供)中,group参数是什么。您可以给我一个示例。

1 个答案:

答案 0 :(得分:2)

免责声明:我没有运行这个例子,只是在看http://wiki.apache.org/hadoop/Grep之后就开始回答

CLI调用是:bin/hadoop org.apache.hadoop.examples.Grep <indir> <outdir> <regex> [<group>],您想了解<group>

我怀疑这是正则表达式中的分组。 (随机链接 - http://www.exampledepot.com/egs/java.util.regex/Group.html

正如Hadoop Grep链接所述

  

该命令与...不同   Unix grep调用:它不显示   完整的匹配线,但只有   匹配字符串

我从中得到的是,如果您指定<group>值(数字),它将仅输出该组的值。

举个例子(从群组链接拉出来)

  

输入: aba
  正则表达式:(a(b)*)+
  第0组: aba
  第1组: a   第2组: b

如果<group>的值为1,则结果为a。组0是完全匹配,而不是原始字符串。在这种情况下,它恰好是相同的。

HTH