(grep)正则表达式匹配非ASCII字符?来自WINDOWS

时间:2016-05-30 15:49:40

标签: unix svn utf-8 grep non-ascii-characters

我正在开发一个预提交钩子以避免使用非ascii字符提交文件,它也可以在unix系统中使用以下REGEX:

grep -P -n '[\x80-\xFF]' /tmp/app.txt

现在给我带来很多痛苦的问题是,当我从windows提交时,grep的结果会发生变化,比非ascii字符给我更多的char ...

有人知道如何解决这个问题吗?我真的尝试了很多不同的东西..

1 个答案:

答案 0 :(得分:0)

strings -n 1 filename将显示正常字符,但如果您只想查看文件类型,该怎么办? file filename会显示该类型的文件,但我担心它不会为您工作 您可以尝试类似

的内容
cat /tmp/app.txt | tr -d "[:print:]\r\n" | wc -c

或避开猫

tr -d "[:print:]\r\n" < /tmp/app.txt | wc -c