我有一行2000行的SQL代码文件,里面有一些垃圾字符。我的意思是,这些字符不属于西班牙语或英语字母。在notepad ++中,有没有办法搜索这样的无效字符?
例如,请考虑以下行
UPDATE table A SET some_string = 'No se encontró un producto fìsico para el plan ingresado' WHERE some_ID = 'XYZ001'
这里的特殊字符是³和¬但是Ã不是因为它是有效的西班牙语字符。
如果还有其他方式,请随时提出建议。
答案 0 :(得分:2)
我找不到任何西班牙语字母ã/Ã的引用。你在这里有一个编码错误的情况,垃圾信件是其结果。要解决这样做:
1. Open a new empty document, Ctrl+N.
2. Change the encoding to cp1252 (Encoding -> Character sets -> Western European -> Windows-1252.
3. Paste your original text ("... encontró...")
4. Change encoding to UTF-8 (Encoding -> Encode in UTF-8).
结果字符串是“...seencontróunproductofìsicopara...”,其中btw不包含ã/Ã。
如果您想要找到“西班牙语”字符,就像您的问题所示,请执行以下操作:
Regex search: [^\x00-\x7FãáéíñóúüÃÁÉÍÑÓÚÜ¿¡]
(Notepad ++附带内置PCRE支持。)上面的表达式将匹配所有非ASCII,非“西班牙语”字符,如两个字符³和¬你在上面列出。