标签: utf-8 character-encoding special-characters uniq
uniq(GNU coreutils 8.5)似乎没有区分em和en-dashes:
uniq
$ echo -e“a-b \ na-b”| uniq -c
2 a–b
有没有办法强迫这种区别?我已经尝试过LC_COLLATE的各种设置而没有运气。
答案 0 :(得分:3)
为我工作
echo -e "a–b\na—b" | LC_COLLATE=C uniq -c 1 a–b 1 a—b