Scrape网站检索某些li元素

时间:2012-04-05 23:36:29

标签: php jquery scrape

我正在运行一个彩票集团,并希望自动化我们的系统来检查彩票号码(英国国家彩票)

我得到的网址是:https://www.national-lottery.co.uk/player/p/results/lotto.ftl

我正在使用

<?php
$html = file_get_contents("https://www.national-lottery.co.uk/player/p/results/lotto.ftl");
?>

我希望能够抓住页面的这个区域,即数字:

enter image description here

问题是,该页面上有很多内容,我不知道我要采取的第一步是打破这一切。

有没有人知道在PHP或jQuery中执行此操作的方法?

由于

2 个答案:

答案 0 :(得分:3)

现有的RSS Feed http://www.alllotto.co.uk/rss/latest.rss

怎么样?

答案 1 :(得分:2)

我会看一下PHP Simple HTML DOM Parser。它简化了抓取并完成了您的要求。

使用它,找到LI元素就像这样简单:

foreach($html->find('li') as $element) {
       echo $element . '<br>';
}