必须从html页面检索字符串值并将其存储在类别下的xml中

时间:2012-01-19 14:12:15

标签: php html xml

对于一个项目,我需要从我生成的HTML页面中提取一个字符('v')的值。

HTML页面包含以下链接,其中包含大量垃圾数据:

/watch?v=blablabla&list=blablabla&index=7&feature=blablabla
/watch?v=blablabla&list=blablabla&index=8&feature=blablabla

任务是必须检索“v”的值。存储在XML中的类别下。

1 个答案:

答案 0 :(得分:0)

尝试使用preg_match_all

的正则表达式
$file = file('path/file.html');
preg_match_all("/\/watch\?v=([a-z0-9]+)&list=[a-z0-9]*&index=[0-9]*/i", $file, $matches);

我不确定网址会是什么样子,所以必须改变正则表达式。

尝试http://gskinner.com/RegExr/微调您的表达