我正在使用以下方式提取Facebook帖子页面
$context = stream_context_create(array('http'=>array('user_agent' => 'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11')));
$facebook = file_get_contents('https://www.facebook.com/feeds/page.php?id=XXXXXXXXXX&format=json', true, $context);
$facebook = json_decode($facebook,true);
但是我得到了标签上的垃圾点击,鼠标悬停,相关等等。
除了href以及可能使用php的目标属性之外,删除a标签属性的最佳方法是什么?
感谢 安迪
答案 0 :(得分:0)
PREG_MATCH是一个很好的起点。我确信有一些预制课程可以为你解决这个问题。
答案 1 :(得分:0)
我会做一个foreach循环并使用PREG_MATCH来摆脱不必要的onclicks。