我正在尝试在从S3下载的大文本文件夹中找到所有唯一的Cookie ID值,以查看有多少重复项。
以下是数据外观的示例,但引号中的数字会有所不同。
"user_attributes":{"1234567890":"<Cookie ID>",
我正在尝试使用grep查找唯一的Cookie ID值并将其打印到文件中。
cat cookieid.txt | grep "\"*\":\"<Cookie ID>" > output.txt | sort | uniq -c
答案 0 :(得分:1)
您不能对grep
使用通配符,必须使用正则表达式。 .*
是匹配任何内容的正则表达式,类似于*
通配符。
您需要将输出重定向放在管道的末尾。您正在将grep
输出发送到该文件,并且没有任何内容通过管道传输到sort
和uniq
。
grep '".*":"<Cookie ID>' cookieid.txt | sort | uniq -c > output.txt