Question

我需要从一个包含140000行的文件中查找字符长度，每个字符串的长度都不同。

aaaaa
bbb
ccccc
ddddd
fff

预期输出如下

strings char-length
2       3
3       5

（表示2个字符串的字符长度为3，3个字符串的字符长度为5）。我已经尝试过for-loop，它可以读取每一行，但是由于我的文件有140000个字符串行，因此需要一些时间。

Answer 1

如果有可用的awk，则可以尝试以下命令：

awk '{ print length($0) }' <your_file> | sort | uniq -c

（在我的VM上使用27ms的示例测试文件，包含7000行，每行大约10个字符）。