我想解析$ raw中的HTML代码以获取标题并将其保存为mysql。我试过用php dom和Ganon HTML解析器来做这件事,但是当我运行它时,向我显示错误500.如果你用Ganon解决这个问题会很棒。
function store($raw)
{
include_once('ganon.php');
$html = file_get_dom($raw);
echo $html('title', 0)->parent->getPlainText();
}
store ('<html> all html code </html>');
答案 0 :(得分:0)
您的代码存在一些问题。
首先,您使用期望以文件名传递的file_get_dom()
,因此请改用str_get_dom()
。
其次,示例HTML不包含标题,因此不起作用。
然后当你找到标题时,你会转到父元素并从那里输出。您只需要使用该节点内容。
include_once('ganon.php');
function store($raw)
{
$html = str_get_dom($raw);
echo $html('title', 0)->getPlainText();
}
store ('<html><title>Title</title> all html code </html>');
...输出
Title of page