刮擦与casperjs / phantomjs的链接

时间:2016-01-22 22:10:24

标签: javascript web-scraping css-selectors phantomjs casperjs

我正试图抓取http://www.basketball-reference.com/teams/GSW/2016_games.html上的所有“Box Score”链接。如果有人向我展示了一种逐一点击它们的方法,那将是完美的,但只是刮掉它们就已经很棒了。 使用'a'选择器我设法从页面中删除所有链接:

$('tbody tr a').each(function (i) {
            console.log([i + 1, $(this).text(), ' // ' + $(this).attr('href')].join(': '));
        });

但我没有看到如何指定Box-score链接的方法

1 个答案:

答案 0 :(得分:0)

此选择器可以执行您想要的操作:

#teams_games > tbody > tr > td:nth-child(5) > a

一个有用的提示 - 如果您在Chrome中使用开发者工具,则可以右键单击已检查的元素,然后选择复制>>复制选择器以获取它的css选择器。对于像这样的案例,这通常是一个很好的起点,可以制作一个更具概括性的选择器。