使用grep查找所有重音词(变音符号)?

时间:2017-10-18 16:47:37

标签: grep

我在文本文件中有一个大的单词列表(每行一个单词)有些单词有重音字符(变音符号)。如何使用grep仅显示包含重音字符的行?

2 个答案:

答案 0 :(得分:1)

我有一个解决方案。首先使用" iconv"去除重音符号。然后做一个"差异"对于原始文件中的行:

=INDIRECT("Table1")

答案 1 :(得分:1)

对于较大的字符类别(“什么单词不是纯ASCII?”),我发现的最佳解决方案是将PCRE与-P选项一起使用:

grep -P "[\x7f-\xff]" filename

这将找到带有UTF-8和ISO-8859-1(5)(Latin1,win1252,cp850)重音符号的字符。