我想要获得网页的一部分。 让我告诉你喜欢做什么。
例如,http:// www.xxxxxx.com/page=2
如您所见,有一个列表,此列表显示50个广告。请忽略其他人。每个广告在其链接中都有唯一的ID。
例如:
http:// xxx.com/-iid-155546130
身份证号码是:155546130
好的,id喜欢从该页面获取唯一的ID号,并将它们回显到屏幕上。所以,我需要从该页面获得50个唯一ID。只有身份证号码。
好吧,请你给我一些建议吗?我应该使用哪些功能?我怎么能做那份工作?问候。
答案 0 :(得分:0)
您必须获取HTML并为这些ID解析它。在这种情况下,您必须确切知道这些ID的存在位置。您可以使用正则表达式查找指向其他页面(网站)的链接,然后查找ID。
答案 1 :(得分:0)
PHP有一个built-in DOM parser。围绕这类功能展开,以揭示你正在寻找的东西。
答案 2 :(得分:0)
使用以下内容获取页面:
$html = file_get_contents($url); // or curl if you like it cumbersome
使用正则表达式获取数字:
preg_match_all("/-iid-(\d+)/", $html, $m); // could be more precise
print_r($m[1]);