我有一堆故意损坏的数据。我正在尝试去除基本上不是使用标准英语键盘的用户会键入的任何东西,并且还会抛出一些西班牙字母来踢球:
$string = "ó�Ⲃⲟⲟⲉⲁⲛ ⲁⲛⲇ ⲒⲛϯⲉⲉꞅHôpitüD�sseldor ";
$re = '/[^\A-Za-z0-9@\.\' ;<>,-_\|!@#+=\[\]{}$%^&:*()"ñáéíóú]/mu';
$string = preg_replace($re, '', $string);
根据regex101,我应该把它作为结果返回:
ó HpitDsseldor
但是我反而得到了:
ó???????? ??? ????????HpitD?sseldor
是什么导致所有这些?
保留在清除的输出中?