以下python脚本打印文件中第一次出现的行。
#!/usr/bin/env python
import sys
x = set()
for line in sys.stdin:
if line not in x:
print line,
x.add(line)
uniq
仅适用于相邻行。将要使用的文件非常大,因此sort | uniq
并不理想。是否有标准工具可以做到这一点?
答案 0 :(得分:4)
你试过sort -u
吗?至少这是uniq man page所暗示的。
答案 1 :(得分:1)
awk
awk '!x[$0]++' file.old > file.new