好的,所以,我在标签之间获取了一些文本,并且我使用了file_get_html,现在,文本以不同的编码返回,这就是我所做的:
$name = $dom->find('h1');
$name = $name[0]->plaintext;
$name = html_entity_decode($name);
$name = utf8_decode($name);
html_entity_decode会删除大部分垃圾,但我仍然会收到来自' - '的迹象,我发现这是一个编码问题,所以我使用utf8_decode,它改变了?,但我怎么做把它恢复到原来的' - '价值?有什么快速解决方法吗?
我对编码不是很了解,所以任何帮助都非常适合