使用正则表达式删除特殊键盘字符/形状?

时间:2012-02-01 18:06:49

标签: php regex

我使用YQL来抓取一些数据,然后将其解析为Amazon的simpledb。尝试将某些标题插入数据库时​​,我遇到了一些错误,因为我正在解析的xml文件中的某些标题包含的字符如下所示。

◆ ▒ ♠ ✖ ¸ . ´ ¨

我确信这不是所有可能的特殊字符。这只是我到目前为止注意到的导致错误的那个。

这些不是标准键盘字符。是否有一种简单的方法可以删除/禁止这些类型的字符(正则表达式等),而无需查找它们中的每一个并将它们包含在正则表达式中?

由于

1 个答案:

答案 0 :(得分:1)

$text = preg_replace('/[^a-zA-Z0-9_ -]/s', '', $text);

这将修剪文本,使其仅包含字母或数字,空格和下划线/短划线。

参考 http://www.phpfreaks.com/forums/index.php?topic=223131.0