我想从谷歌页面解析一些城市的展示时间:
我从Page1获取电影名称:
http://www.google.co.in/movies?near=chennai&hl=en&ei=8OIaUr-0EYrFkwX9kICQCA_&date=0
我从第2页获得了显示时间:
http://www.google.co.in/movies?near=chennai&hl=en&ei=8OIaUr-0EYrFkwX9kICQCA_&date=0&tid=8a030c04960c6341
我的Php代码:
$htm = file_get_html('http://www.google.co.in/movies?near=chennai&hl=en&ei=8OIaUr-0EYrFkwX9kICQCA_&date=0');
$linker = $htm->find('div h2 a');
$value = $linker[2]->href;
$link = "http://www.google.co.in$value";
$htmls = file_get_html($link);
如果我echo "$link";
它打印与第2页相同的链接:
$cinemaname = $htmls->find('div[class=name]');
$cinematimes = $htmls->find('div[class=times]');
echo strip_tags($cinemaname[0])."<div>";
echo strip_tags($cinematimes[0])."<div>";
如果我echo $cinemaname[0]";
从第1页打印,但我想从第2页打印。
答案 0 :(得分:0)
关于链接编码的此问题。您的链接返回到以下位置:&
http://www.google.co.in/movies?near=chennai&hl=en&ei=8OIaUr-0EYrFkwX9kICQCA_&date=0&tid=8a030c04960c6341
您必须decode
使用html_entity_decode
功能
$value = $linker[2]->href;
$link = html_entity_decode("http://www.google.co.in".$value);
$htmls = file_get_html($link);