我经常需要在计算机上编写简单的BASH脚本来操作文件。 BASH似乎很难使用UTF-8内容。
答案 0 :(得分:3)
使用UTF8时,Bash本身应该没有任何问题。很可能你的问题是由另一个程序引起的,例如:终端模拟器或编辑器。确保您的环境设置为使用UTF8。有关此问题的详细信息,请参阅示例here。
答案 1 :(得分:1)
我认为你的问题是通常的sed / awk / grep ...等不支持unicode,所以stackoverflow解决方案通常不适合你吗?
没有外部程序,bash本身就非常有限。要做你想做的事,你可能需要使用除bash之外的更多函数式编程语言进行编码。 UTF-8本身不太适合处理,需要将其解析为2字节或4字节字符然后处理字符。 (即转换为UTF-16或UTF-32)然后将其转换回UTF-8进行存储。