我正在抓取一个HTML页面并处理内容。我的页面是UTF-8,正如我正在抓取的页面一样。 我看过这个问题,但它对我不起作用。 PHP Replace EM Dash REGEX
我正在阅读的数据是存储在$ v
中的数据 25th March –Â The Red Barn
我需要删除March和The之间的特殊字符。 查看十六进制编辑器,第一个字符是一个短划线:E2 80 93
我在上面的问题中已经尝试了这个,但它没有删除字符。
$v = mb_ereg_replace("[\xE2\x80\x93]", "", $v);
我无法删除其他字符:C3 82 我怀疑这是出于同样的原因。
请帮忙。
答案 0 :(得分:-1)
这将完成它:
<?php
$v = "25th March –Â The Red Barn";
$result = str_replace("–Â", "", $v);
echo $result;
虽然这是你要求的,但请注意它会导致“March”和“The”之间的双倍空格,所以你可能想要删除双倍空格(如果你关心):
$new_result = str_replace(" ", " ", $result);
echo $new_result;