正则表达式问题剥离出扩展的ascii / unicode

时间:2017-09-06 21:05:15

标签: mysql regex notepad++

我正在使用workbench将sql转储导入mysql数据库。数据集包括一些扩展的ascii / unicode字符,如某些插入语句中“Français”中的“ç”。这些特征打破了重要性。

我不关心那些字符,所以使用notepadd ++和这个页面Notepad++, How to remove all non ascii characters with regex?我试图使用这个正则表达式[^ \ x00- \ x7F] +删除所有扩展字符,根据我的理解基本不好NOT 00-7f或NUL(0)到DEL(127)。

它找到了正确的字符,但由于某种原因也在每一行的末尾找到了CRLF - 这不在这个范围内,我不知道为什么CR和LF是\ x0A和\ x0D它们不应该是在那一套。

我确信我遗漏了一些简单的东西 - 那么是否有更好的正则表达式用于不丢失我的换行符,甚至是告诉SQL工作台忽略扩展字符的方法?

以下是其中一个插入行的示例:

  

INSERT INTO as_catalog VALUES('525234','Google Apps Sync™for   MicrosoftOutlook®3.3.355.950','0');

谢谢!

0 个答案:

没有答案