如何在Laravel中摆脱CAPTCHA的糟糕刮刀?

时间:2014-09-20 17:18:48

标签: laravel-4 web-scraping captcha scraper

如果有人想在我的服务器中加载我的页面,我想阻止它。但我无法找到办法。

例如,有人可以加载页面并可以获取页面的组件(file_get_contents($ url))。这是一个非常基本的例子。

我也举个例子。在本地服务器中打开一个新的php文件。试试这个

$file = file_get_contents('http://www.sahibinden.com/ilan/alisveris-bilgisayar-notebook-dizustu-hp-compaq-cq61-3gb-ram-320-hdd-180232745/detay');
echo $file;

互联网上有很多图书馆。例如this lib for php。 您还可以尝试使用该库废弃网页。我会给你一个示例代码。

 $url = 'http://www.sahibinden.com/bilgisayar-notebook-dizustu-bilgisayar?hasSecureTrade=true';
    include('lib.php');
    $html = new simple_html_dom();
    $html->load_file($url);
    foreach ($html->find('td.searchResultsSmallThumbnail a') as $a) {
        $details = new simple_html_dom();
        $details->load_file('http://www.sahibinden.com'.$a->href);
        foreach ($details->find('div.classifiedDetail h1') as $headers) {
            echo $headers;
        }
    }

运行脚本几次。你什么都得不到。

在重新加载页面几次后,该网页将使用验证码阻止您的脚本。你可以尝试一下。我只想知道如何在laravel中为我的网页做这件事。

我在互联网上搜索过它,但我找不到任何东西。如何在Laravel中阻止抓取脚本?

0 个答案:

没有答案