编码问题 - 破碎的字符

时间:2017-03-07 22:30:24

标签: java php encoding utf-8 character-encoding

PHPJava是否有办法检测encoding issues

我的意思是,有时文字会被破坏,就像this file的内容一样。

如下图所示。 Notepad ++有一些黑色字符,里面有代码。那是因为他注意到那里存在问题。

我想在PHPJava上检测到这一点,因此我可以将该文件的批量替换替换为替换的UTF-8字符。

这是一个大问题的一部分。我把它简化为最低的。

在HxD十六进制编辑器(使用编码ANSI)上,您可以看到这些字符是(十六进制):93和94。

在Notepad ++(使用的编码UTF-8)上,您还可以获得黑色背景的这些代码。

我真的需要找到一种方法来检测这些破碎的字符在哪里。

如果您知道使用其他程序实现此检测的其他方法,让我进行批量替换,那对我有用。

使用Notepad++我甚至无法搜索该文字。我的意思是,它会向您显示问题,但如果您复制该字符并在Notepad++上查找,则无法进行替换。

在PHP上有一个函数可以检测文本是否正确:mb_check_encoding,但它不允许我进行替换。

enter link description here

enter image description here

0 个答案:

没有答案