我正在尝试索引网站,而我的preg_match返回一个空数组。
这是我到目前为止所做的:
$content = get_content("www.something.com");
preg_match_all('#<span class="box_cod">Cod: ([0-9\.]*)</span><span class="box_pret">PRET: (.*)</span>#',$content,$Produs);
其中get_content是一个用于检索网站的curl函数。
谢谢!
答案 0 :(得分:3)
您可以使用PHP Simple HTML DOM Parser来解析并获取变量中的网站内容。
例如,首先你包括php文件..
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
比使用正则表达式解析HTML更容易。