如何检测文本文件中的非英文字符?

时间:2010-11-09 16:22:21

标签: regex bash awk ascii

我想知道是否有一个awk / sed正则表达式可用于检测包含非英文字符的任何行,例如:

あと1つのスマッシュが見つからへん…もう寝よう
ความหวังดีของคนเรา สุดท้าย
Το θερμόμετρο χτυπάει
LA #MACIF a félicité #DotYou pour le site http://www.roulonspourlavenir.com , un petit compliment dans un monde de brutos... c'est bon ça!!

但由于它们是Twitter帖子,我需要保留带有链接的符号,@符号,因此我相信我想要检测任何非ascii字符?

感谢您的帮助,

托梅克

1 个答案:

答案 0 :(得分:0)

这有用吗?

/[^a-z0-9]/i