在Hadoop'grep'示例(随Hadoop包一起提供)中,group参数是什么。您可以给我一个示例。
答案 0 :(得分:2)
免责声明:我没有运行这个例子,只是在看http://wiki.apache.org/hadoop/Grep之后就开始回答
CLI调用是:bin/hadoop org.apache.hadoop.examples.Grep <indir> <outdir> <regex> [<group>]
,您想了解<group>
。
我怀疑这是正则表达式中的分组。 (随机链接 - http://www.exampledepot.com/egs/java.util.regex/Group.html)
正如Hadoop Grep链接所述
该命令与...不同 Unix grep调用:它不显示 完整的匹配线,但只有 匹配字符串
我从中得到的是,如果您指定<group>
值(数字),它将仅输出该组的值。
举个例子(从群组链接拉出来)
输入: aba
正则表达式:(a(b)*)+
第0组: aba
第1组: a 第2组: b
如果<group>
的值为1
,则结果为a
。组0是完全匹配,而不是原始字符串。在这种情况下,它恰好是相同的。
HTH