对于一个项目,我需要从我生成的HTML页面中提取一个字符('v')的值。
HTML页面包含以下链接,其中包含大量垃圾数据:
/watch?v=blablabla&list=blablabla&index=7&feature=blablabla /watch?v=blablabla&list=blablabla&index=8&feature=blablabla
任务是必须检索“v”的值。存储在XML中的类别下。
答案 0 :(得分:0)
尝试使用preg_match_all
$file = file('path/file.html');
preg_match_all("/\/watch\?v=([a-z0-9]+)&list=[a-z0-9]*&index=[0-9]*/i", $file, $matches);
我不确定网址会是什么样子,所以必须改变正则表达式。
尝试http://gskinner.com/RegExr/微调您的表达