将连续重叠组与正则表达式匹配

时间:2016-11-08 00:58:10

标签: regex awk grep overlap regex-lookarounds

我有像:

这样的字符串
TAACCCTAACCCTAACCCTA

我能做到

$ echo TAACCCTAACCCTAACCCTA | grep -Eo "[ACGT]{4}"
TAAC
CCTA
ACCC
TAAC
CCTA

但我想:

TAAC
AACC
ACCC
CCCT
CCTA
...
...

它必须与非贪婪和前瞻或外观有关,但我需要一些帮助。

1 个答案:

答案 0 :(得分:1)

echo TAACCCTAACCCTAACCCTA | awk '{while (d++ < length) print substr($0, d, 4)}'