如何从网站中隔离特定的超链接(使用简单的html dom php)。例如下面的脚本我只想要带有http://www.website.com/ 发布的粗体路径的链接 / ...
<a class="blue" href="/releases/2012.htm">release of ---</a>
<a class="blue" href="/releases/1/2012.htm">release of ---</a>
以及其中包含子域名( news )的链接
<a class="blue" href="http://news.website.com/one/1">release of ---</a>
也有办法隔离网站上的特定链接并进入该特定链接并获取其标题和描述
答案 0 :(得分:2)
通常你只是遍历所有链接,检查每个链接是否符合你的条件,如果是,请从中获取你想要的数据。
foreach($html->find('a') as $link) {
if(substr($link->href, 0, 10) == "/releases/") {
// do stuff with a releases link
}
// and so on
}
答案 1 :(得分:1)
迭代所有可能匹配的链接,然后检查他们的href
是否符合您的条件。如果标准对于基本匹配而言太高级,您可以使用basic string functions或regular expressions进行此项检查。