是否有BASF的UTF-8替代品?

时间:2012-04-24 04:46:44

标签: bash utf-8

我经常需要在计算机上编写简单的BASH脚本来操作文件。 BASH似乎很难使用UTF-8内容。

  • 是否有完全符合UTF-8标准的BASH版本?
  • 是否有BASH的替代品,它使用相似或相同的语法,但是兼容UTF-8?

2 个答案:

答案 0 :(得分:3)

使用UTF8时,Bash本身应该没有任何问题。很可能你的问题是由另一个程序引起的,例如:终端模拟器或编辑器。确保您的环境设置为使用UTF8。有关此问题的详细信息,请参阅示例here

答案 1 :(得分:1)

我认为你的问题是通常的sed / awk / grep ...等不支持unicode,所以stackoverflow解决方案通常不适合你吗?

没有外部程序,bash本身就非常有限。

要做你想做的事,你可能需要使用除bash之外的更多函数式编程语言进行编码。 UTF-8本身不太适合处理,需要将其解析为2字节或4字节字符然后处理字符。 (即转换为UTF-16或UTF-32)然后将其转换回UTF-8进行存储。