bash排序忽略非alpha字符

时间:2012-01-13 10:26:23

标签: bash ubuntu-9.10

我正在尝试从标记文本文件中提取唯一标记的列表。标签由尖括号分隔,每个标签名称以冒号开头:<:ttx>, <ol_2>依此类推。

我首先在每个>之后添加换行符,然后尝试sort。结果让我感到困惑,直到我意识到sort忽略了前两个字符。

我是否需要添加一个开关,或者我的Bbuntu风格的bash是否为sort -d没有选项?

1 个答案:

答案 0 :(得分:9)

使用LANG=C停用您的语言区域=&gt; sort通常效果更好:

grep -o '<:[A-Za-z0-9]>' your-tagged-text-file | LANG=C sort