php简单的html dom解析器总是返回false

时间:2017-02-19 11:16:07

标签: php html parsing web-crawler

大家好我试图用简单的html Dom解析器解析一些页面,但它在这个网站上不起作用我搜索了一些数据,但我无法理解问题是什么。

<?
include("./simple_html_dom.php");

$html = file_get_html('http://ko.pokemon.wikia.com/wiki/%EC%A0%84%EA%B5%AD%EB%8F%84%EA%B0%90');

foreach($html->find('tr') as $element) 
   echo $element->href . '<br>';

&GT;

这是我的代码,因为类似标题和用户代理是这个错误?然后我该如何修复?

1 个答案:

答案 0 :(得分:0)

您的脚本会搜索标记,并应输出这些标记的href。由于href是一个应用于链接标记的html属性,因此脚本不会输出任何内容。

您应该像这样重写脚本:

<?php
include("./simple_html_dom.php");

$html = file_get_html('http://ko.pokemon.wikia.com/wiki/%EC%A0%84%EA%B5%AD%EB%8F%84%EA%B0%90');

foreach($html->find('tr') as $element) {
   echo $element->plaintext . '<br>';
}
?>

或者如果你想让链接像这样运行:

<?php
include("./simple_html_dom.php");

$html = file_get_html('http://ko.pokemon.wikia.com/wiki/%EC%A0%84%EA%B5%AD%EB%8F%84%EA%B0%90');

foreach($html->find('a') as $element) 
   echo $element->href . '<br>';
?>