我使用cur
l从https://www.thegioididong.com/dtdd/iphone-6读取内容然后使用DOM来解析og元数据但数据编码不正确,但是当使用facebook og调试器进行调试时,结果是正确的{{3 }}
这是我的描述元结果:
iPhone 6ramắtvá»isá»±thayÄá»ilá»nvá»mặtthiếtkếvÃcấuhìnhsová»icácthếhá» TRAE°的»℃。 iPhone6cómÃnhìnhlá»nÄẺn4,7英寸vÃ相机chá»ng rungquanghá»c。*
facebook的结果:
iPhone 6ramắtvớisựthayđổilớnvềmặtthiếtkếvàcấuhìnhsovớicácthếhệtrước。 iPhone6cómànhìnhlớnđến4,7英寸và相机chốngngngquanghọc。*
我尝试将文字转换为UTF-8
,但仍无效,此处为代码
iconv(mb_detect_encoding($text, mb_detect_order(), true), "UTF-8", $text);
我也尝试了file_get_contents
而不是curl
,但仍然得到了相同的结果。谁能想出怎么样?非常感谢。
解决:
我想出了问题:在使用DOM解析内容之前转换html内容
mb_convert_encoding($content, 'HTML-ENTITIES', 'UTF-8')