如何在Linux中的Thorn字符'þ'上拆分一行?
我试过以下
awk -F 'þ' '{print $2}'
awk -F '\xC3\xBE\x02' '{print $2}'
awk -F 'þ' '{print $2}'
没什么用的。
编辑: 该文件位于HDFS(Hadoop文件系统)路径中,以下命令在命令行上运行,但不在shell脚本中运行(执行shell脚本时,它会提供一个空输出,即无法识别刺char!
命令行:
~/etltestsar/DoubleClick$ hadoop fs -cat /raw/doubleclick/data/dt=2015-03-30/NetworkMatchtablesActivity_7657_03-30-2015_advertiser.log.gz|gunzip|tail -n +2|awk -F 'þ' '
Warning: $HADOOP_HOME is deprecated.
3848762
3963771
4112862
4140939
4199580
4199584
.....
shell脚本中的相同命令不产生输出
hadoop@node28-19-88:~/etltestsar/DoubleClick$ sh testthorn.sh
Warning: $HADOOP_HOME is deprecated.
答案 0 :(得分:1)
获取不同的awk?关于cygwin的bash 4.1.17(9)中的GNU awk 4.1.1:
$ cat file
fooþbar
$ awk -F 'þ' '{print $2}' file
bar