如何强制独特区分em和en-dashes?

时间:2011-10-28 11:54:30

标签: utf-8 character-encoding special-characters uniq

uniq(GNU coreutils 8.5)似乎没有区分em和en-dashes:

$ echo -e“a-b \ na-b”| uniq -c

  2 a–b

有没有办法强迫这种区别?我已经尝试过LC_COLLATE的各种设置而没有运气。

1 个答案:

答案 0 :(得分:3)

为我工作

echo -e "a–b\na—b" | LC_COLLATE=C uniq -c
      1 a–b
      1 a—b