从网页中提取数据

时间:2013-03-31 20:01:19

标签: javascript web-scraping

我有一个Apple App Store上的应用程序链接。我需要在自己的网页上使用它的数据。更确切地说,我想提取应用程序图标,其类别以及它是否是免费的,并将此数据添加到我的网页。我怎么能用JavaScript做到这一点?

2 个答案:

答案 0 :(得分:1)

据我所知,由于跨平台安全问题,您无法使用Javascript执行此操作。 你可能需要一个Web服务器,并可能用PHP编写一个刮板来读取该页面。然后从JavaScript中调用PHP脚本。

答案 1 :(得分:0)

这是PHP脚本:

<?php
$ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $Url);
    curl_setopt($ch, CURLOPT_REFERER, "https://itunes.apple.com/us/app/google+/id447119634?mt=8");
    curl_setopt($ch, CURLOPT_USERAGENT, "Mozzila/1.0");
    curl_setopt($ch, CURLOPT_HEADER, 0);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    curl_setopt($ch, CURLOPT_TIMEOUT, 10);
    $output = curl_exec($ch);
    curl_close($ch);


$logo = explode('<div class="artwork">', $output);
$logo = explode('src="', $logo[1]);
$logo = explode('"', $logo[1]);
$logo = $logo[0];

$category = explode('<span class="label">Category:', $output);
$category = explode('">', $category[1]);
$category = explode('<', $category[1]);
$category = $category[0];

echo $logo;
echo $category;
?>