php无法替换em dash

时间:2018-05-23 00:05:51

标签: php replace

我正在抓取一个HTML页面并处理内容。我的页面是UTF-8,正如我正在抓取的页面一样。 我看过这个问题,但它对我不起作用。 PHP Replace EM Dash REGEX

我正在阅读的数据是存储在$ v

中的数据
 25th March –Â The Red Barn

我需要删除March和The之间的特殊字符。 查看十六进制编辑器,第一个字符是一个短划线:E2 80 93

我在上面的问题中已经尝试了这个,但它没有删除字符。

$v = mb_ereg_replace("[\xE2\x80\x93]", "", $v);

我无法删除其他字符:C3 82 我怀疑这是出于同样的原因。

请帮忙。

1 个答案:

答案 0 :(得分:-1)

这将完成它:

<?php
$v = "25th March –Â The Red Barn";
$result = str_replace("–Â", "", $v);
echo $result;

虽然这是你要求的,但请注意它会导致“March”和“The”之间的双倍空格,所以你可能想要删除双倍空格(如果你关心):

$new_result = str_replace("  ", " ", $result);
echo $new_result;