给定./wordslist.txt
文件<word> <number_of_apparitions>
,例如:
aš toto 39626
ir 35938
tai 33361
tu 28520
kad 26213
...
如何排除行尾数字,以便收集output.txt
个数据:
aš toto
ir
tai
tu
kad
...
注意:
Sed
,find
,cut
或grep
首选。因为我的数据可以包含ascii字母,非ascii字母,中文字符,数字等,所以我不能使用保存[a-z]内容的东西。
答案 0 :(得分:1)
我建议:
cut -d " " -f 1 wordslist.txt > output.txt
或者:
sed -E 's/ [0-9]+$//' wordslist.txt > output.txt.
答案 1 :(得分:1)
在这种情况下,使用awk打印第一个单词。
awk '{print $1}' your_file > your_new_file
答案 2 :(得分:1)
awk
解决方案只需打印输入行,不包括上一栏
$ awk '{NF--; print}' wordslist.txt
aš toto
ir
tai
tu
kad
注意:
awk 'NF{NF--}1'
答案 3 :(得分:0)
以下作品:
sed -r 's/ [0-9]+$//g' wordslist.txt