Question

我需要使用notepad ++查找并替换xml文件中的所有未识别字符。我不知道描述那些身份不明的角色的技术术语，可能他们甚至不能被称为角色，所以我附上了一个示例图像：

＆＃34; string＆＃34;之间的东西和＆＃34; / string＆＃34;是我需要找到的。你知道：它们不能像文字一样被复制，因为它们实际上不是文本，如果我试图在这里复制它，它看起来像这样：

那么如何使用正则表达式从文件中找到所有这些（不包括换行符）和清除（用＆＃34;空白＆＃34;替换）？

编辑：编码＆gt;＆gt;转换为UTF-8不会清除那些

编辑：我上传了一个示例文件，以便更好地说明这里的情况：https://file.io/QsyodE：我需要清除像＃34;类型＆＃34;中那些未识别的内容。字符串，汉字（？）字符之前的字符串。如果您使用纯文本查看器（如记事本）打开文件，则无法看到这些内容，因为它们实际上不是文本（这就是我需要删除它们的原因，因为它们不是文本的原因iTunes不重要的大量XML文件;但是当你用Notepad ++打开它时，你会看到它们。

Answer 1

以下内容不会找到é或ü但会找到xEF XBF xBE

\b[xX][0-9a-fA-F]+\b

用notepad ++

1 个答案: