我在unix上有文件,其中包含带有特殊字符的行也是纯字符串。特殊字符可以是任何类似的。,$%& *() - @。以下样本
样本输入
\302\275B\303\236Gcl\302\275t eRkAtMbn;
Jacob
Chinese
39:00
Language
53.00
输出:
雅各布
中国
语言
我想从这个文件中只获得纯字符串。我有办法读取每一行并用字母表比较每个字符,但如果文件很大则会耗费大量时间。
有更好的方法或建议吗?
答案 0 :(得分:0)
最好的选择是grep
实用程序。
grep -i '^[a-z]\+$' file.txt
具体来说,我们对仅包含字符-i
的行进行不区分大小写的搜索([a-z]
),并且仅对从开头(^
)到完成($
)。