如何在Linux中的Thorn字符'þ'上拆分一行?

时间:2015-04-17 22:17:52

标签: linux awk string-split

如何在Linux中的Thorn字符'þ'上拆分一行?

我试过以下

awk -F 'þ' '{print $2}'
awk -F '\xC3\xBE\x02' '{print $2}'
awk -F 'þ' '{print $2}'
没什么用的。

编辑: 该文件位于HDFS(Hadoop文件系统)路径中,以下命令在命令行上运行,但不在shell脚本中运行(执行shell脚本时,它会提供一个空输出,即无法识别刺char!

命令行:

~/etltestsar/DoubleClick$ hadoop fs -cat /raw/doubleclick/data/dt=2015-03-30/NetworkMatchtablesActivity_7657_03-30-2015_advertiser.log.gz|gunzip|tail -n +2|awk -F 'þ' '
Warning: $HADOOP_HOME is deprecated.

3848762
3963771
4112862
4140939
4199580
4199584
.....

shell脚本中的相同命令不产生输出

hadoop@node28-19-88:~/etltestsar/DoubleClick$ sh testthorn.sh
Warning: $HADOOP_HOME is deprecated.

1 个答案:

答案 0 :(得分:1)

获取不同的awk?关于cygwin的bash 4.1.17(9)中的GNU awk 4.1.1:

$ cat file
fooþbar

$ awk -F 'þ' '{print $2}' file
bar