我使用YQL来抓取一些数据,然后将其解析为Amazon的simpledb。尝试将某些标题插入数据库时,我遇到了一些错误,因为我正在解析的xml文件中的某些标题包含的字符如下所示。
◆ ▒ ♠ ✖ ¸ . ´ ¨
我确信这不是所有可能的特殊字符。这只是我到目前为止注意到的导致错误的那个。
这些不是标准键盘字符。是否有一种简单的方法可以删除/禁止这些类型的字符(正则表达式等),而无需查找它们中的每一个并将它们包含在正则表达式中?
由于
答案 0 :(得分:1)
$text = preg_replace('/[^a-zA-Z0-9_ -]/s', '', $text);
这将修剪文本,使其仅包含字母或数字,空格和下划线/短划线。