php preg_replace€sign with“euro”

时间:2012-06-08 11:42:49

标签: php preg-replace simplexml special-characters str-replace

我想在添加到xml文件之前将$ XML_COMMENT中的€符号替换为“euros”。

我得到的€符号不是utf-8字符,而是来自simplexml的错误消息

Warning: SimpleXMLElement::addAttribute(): string is not in UTF-8 in ...
Warning: SimpleXMLElement::asXML(): output conversion failed due to conv error, bytes 0x82 0x26 0x61 0x6D in ....

欧元符号在MySQL(utf-8)数据库中显示为'â,''

但是在网页上的textarea中正确显示。

我尝试使用这些不同的str_replace

$XML_COMMENT=str_replace('€','euros',$XML_COMMENT)
$XML_COMMENT=str_replace('€','euros',$XML_COMMENT)
$XML_COMMENT=str_replace(chr(128),'euros',$XML_COMMENT)
$XML_COMMENT=str_replace(chr(0xE2).chr(0×82).chr(0xAC),'euros',$XML_COMMENT)
$XML_COMMENT=str_replace(chr(0x82).chr(0x26).chr(0x61).chr(0x6D),'euros',$XML_COMMENT)

没有成功

仅供参考:我到处都在使用utf-8(MySQL,网页和XML)

这是我的代码

// ? : $XML_COMMENT= "bla bla bla € bla bla bla";
// ? : $XML_COMMENT= "bla bla bla € bla bla bla";
// expected : $XML_COMMENT= "bla bla bla euros bla bla bla";

$ProductLog_XML = simplexml_load_file($file);
$ProductUpdate = $ProductLog_XML->order->product->addChild('update');
$ProductUpdate->addAttribute('comment',$XML_COMMENT);
$fp=fopen(file, "w");
fwrite($fp, $ProductLog_XML->asXML());
fclose($fp);

有没有使用regex / preg_replace的替代方案?

2 个答案:

答案 0 :(得分:4)

我遇到了同样的问题,以下内容适用于原始HTML页面采用UTF-8并使用& euro的情况,其中使用PHP进行cURL-ing后将其吐出为“â,”

$nodeValue = str_replace(chr(0xE2).chr(0x82).chr(0xAC), "", $nodeValue)

答案 1 :(得分:3)

您可以尝试htmlentities()转换所有实体,包括欧元符号,因此它们显示为€

我会以下列方式使用它:htmlentities($str, ENT_QUOTES|"ENT_HTML401", "UTF-8", true)

您可以选择使用:htmlentities($XML_COMMENT, ENT_QUOTES | ENT_IGNORE, "UTF-8", true)。有关标志更改的完整说明,请访问以下链接。 根据OP @baptme的要求(见评论)。

来源:php.net reference