到目前为止我创建了这段代码:
<?php
$url=" SOME HTML URL ";
$html = file_get_contents($url);
$doc = new DOMDocument();
@$doc->loadHTML($html);
$tags = $doc->getElementsByTagName('a');
foreach ($tags as $tag) {
echo $tag->getAttribute('href');
}
?>
我有表格的html页面,所以我想要链接标题和日期。 html代码示例:
<TR>
<TD align="center" vAlign="top" bgColor="#ffffff" class="smalltext">3</TD>
<TD class="plaintext" ><a href="pdf/blahblah.pdf" target="_blank" class="link1style">THIS IS THE TITLE</a> </TD>
<TD align="center" class="plaintext" >THIS IS DATE</TD>
</TR>
链接可以正常使用,但我不知道如何使用其他链接。
TNX。
答案 0 :(得分:0)
你这样做的地方:
$tags = $doc->getElementsByTagName('a');
您正在取回所有A标签。只有一个。
如果你想获得文本“这是日期”,你不会通过查看A标签来获得它,因为文本不在A标签内 - 它在TD标签中。
$tds = $doc->getElementsByTagName('td');
...可以获取所有TD元素,或者您可以为要定位的元素指定ID并改为使用getElementById
。
但基本上,这些信息都在the documentation,您在提问之前绝对应该阅读。快乐阅读!