Question

我需要找到正则表达式来找到一个用grep重复4次或更多次的字符。

我知道表达式是{n，}，所以如果我需要找到行，例如，当字符“g”重复4次或更多次时，理论上用grep man page是：

grep "g{4,}" textsamplefile

但是不起作用。有什么帮助吗？

角色可以有其他字母。例如，有效匹配是：

的克有效的克匹配的

克示例的克的克

克其他的克有效的克匹配的克是克此处克

GGGG 其他

Answer 1

您应该在以下位置更改grep命令：

grep -E 'g{4,}' input_file # --> this will extract only the lines containing chains of 4 or more g

如果您想要包含所有包含4个或更多相同字符的链的行，那么您的正则表达式会变成：

grep -E '(.)\1{3,}' input_file

如果您不需要链，但只有g出现4次或更多次的行：

grep -E '([^g]*g){4}' input_file

您可以概括使用以下内容重复4次或更多次的字符：

grep -E '(.)(.*\1){3}' input_file