从具有多个选项卡的HTML页面中废弃数据

时间:2017-11-29 23:30:16

标签: php jquery html web-scraping tabs

我想废弃this page的数据。该页面激活页面加载时的第一个选项卡。我在第一页(产品标签)上删除数据没有问题。我需要能够在下一个选项卡(描述选项卡)上废弃数据。我如何以编程方式从第一个活动Tab移动到第二个选项卡(描述选项卡)。我使用php获取url的html内容,然后使用regex获取所需的数据。

以下是我如何从网址

获取html网页内容
<?php

$html-page-content = file_get_contents("http://m.kikuu.com/product/677925?countryId=2");

#extract data from $html-page-content using regex
# ....

从(产品标签)转到(说明标签)时丢失了。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:1)

这仅适用于这个非常具体的实例......

您尝试抓取的网站确实将该标签引用为javascript中的网址。

$html = file_get_contents('http://m.kikuu.com/product/677925?countryId=2');

if( preg_match('%https?://images-global\.kikuu\.com/ProductDetailToQiniu-\d+\.html%', $html, $match) === 1 )
{
  echo file_get_contents($match[0]);
}