我正在努力寻找一个如何在非常大的xml数据文件中找到非ascii字符的答案。我不想转换非ascii字符,我只是想确定字符所在的数据文件中的位置,以便我可以通知源删除该值。非ascii数据(似乎是单个字符)导致我的处理程序失败。不幸的是,错误数据无法帮助我确定有问题的字符在文件中的位置。此XML数据文件包含数据记录,很可能位于描述字段或名称字段中。
我尝试过使用文字工具,但它是一个如此庞大的文件(> 32MB)的文字,它是压倒性的。有没有办法在像PSPad或TextPad这样的工具中运行REGEX来查找7-BIT ASCII字符集之外的任何字符?