我正在尝试从标记文本文件中提取唯一标记的列表。标签由尖括号分隔,每个标签名称以冒号开头:<:ttx>, <ol_2>
依此类推。
我首先在每个>
之后添加换行符,然后尝试sort
。结果让我感到困惑,直到我意识到sort
忽略了前两个字符。
我是否需要添加一个开关,或者我的Bbuntu风格的bash是否为sort -d
没有选项?
答案 0 :(得分:9)
使用LANG=C
停用您的语言区域=&gt; sort
通常效果更好:
grep -o '<:[A-Za-z0-9]>' your-tagged-text-file | LANG=C sort