PHP
或Java
是否有办法检测encoding issues
?
我的意思是,有时文字会被破坏,就像this file的内容一样。
如下图所示。 Notepad ++有一些黑色字符,里面有代码。那是因为他注意到那里存在问题。
我想在PHP
或Java
上检测到这一点,因此我可以将该文件的批量替换替换为替换的UTF-8字符。
这是一个大问题的一部分。我把它简化为最低的。
在HxD十六进制编辑器(使用编码ANSI
)上,您可以看到这些字符是(十六进制):93和94。
在Notepad ++(使用的编码UTF-8
)上,您还可以获得黑色背景的这些代码。
我真的需要找到一种方法来检测这些破碎的字符在哪里。
如果您知道使用其他程序实现此检测的其他方法,让我进行批量替换,那对我有用。
使用Notepad++
我甚至无法搜索该文字。我的意思是,它会向您显示问题,但如果您复制该字符并在Notepad++
上查找,则无法进行替换。
在PHP上有一个函数可以检测文本是否正确:mb_check_encoding
,但它不允许我进行替换。