如何从网站上抓取链接和图像?

时间:2015-03-30 22:17:24

标签: javascript web-scraping screen-scraping

我是javascript的新手,希望我的第一个项目是:

我尝试使用javascript或php从源代码中获取this site的频道和缩略图名称,以显示我网站上所有频道的缩略图。

这是我想要抓住一个href =" this-link"和img src,但来自所有渠道:

<div class="browseThumb">
                <a href="/realmanpwns" target="_top"><img src="//thumbnails.vaughnsoft.com/1427753239/fetch/live/realmanpwns.png" class"browseThumb" width="200" height="113" /></a>
                <div class="browseTxt" onclick="window.location = '/realmanpwns';">
                    <a href="/realmanpwns" target="_top" class="browseTxt">realmanpwns</a>
                </div>
            </div>

欢迎任何有关如何入门的指导。

1 个答案:

答案 0 :(得分:0)

我在最近的一个项目中使用了scrapy。当时不知道python,但我已经涉及其他几种语言并且不难接受。

他们有大量的资源需要学习。

这是直接链接: http://scrapy.org

PS。我与他们没有任何关系,只是一个快乐的用户。