我需要从一个包含140000行的文件中查找字符长度,每个字符串的长度都不同。
aaaaa
bbb
ccccc
ddddd
fff
预期输出如下
strings char-length
2 3
3 5
(表示2个字符串的字符长度为3,3个字符串的字符长度为5)。我已经尝试过for-loop,它可以读取每一行,但是由于我的文件有140000个字符串行,因此需要一些时间。
答案 0 :(得分:0)
如果有可用的awk,则可以尝试以下命令:
awk '{ print length($0) }' <your_file> | sort | uniq -c
(在我的VM上使用27ms的示例测试文件,包含7000行,每行大约10个字符)。