PHP preg_match正则表达式(2)

时间:2009-11-05 13:07:15

标签: php regex

大家好我有问题,我有以下代码:

<object classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=9,0,115,0" width="320" height="240">
<param name="movie" value="http://www.domain.com" />
<param name="quality" value="high" />
<param name="wmode" value="opaque" />
<param name="allowfullscreen" value="true" />
<param name="allowscriptaccess" value="always" />
<param name="FlashVars" value="file=http://www.domain.com/file.flv&screenfile=http://domain.com/file.jpg&dom=domain.com" />
<embed src="http://www.domain.com" width="320" height="240" bgcolor="#000000" type="application/x-shockwave-flash" pluginspage="http://www.macromedia.com/go/getflashplayer" allowfullscreen="true" flashvars="file=http://domain.com/file.flv&screenfile=http://domain.com/file.jpg&dom=domain.com" />
</object>

我需要在screenfile=之后获取值,例如这个:http://domain.com/file.jpg,但我不知道我该怎么做,我还需要替换宽度和高度属性。

3 个答案:

答案 0 :(得分:5)

这是关于SO的常见问题,答案总是相同的:正则表达式是解析或处理HTML或XML的不良选择。他们有很多方法可以打破。 PHP附带至少三个内置的HTML解析器,它们将更加强大。

查看Parse HTML With PHP And DOM并使用类似的内容:

$html = new DomDocument;
$html->loadHTML($source); 
$html->preserveWhiteSpace = false; 
$params = $html->getElementsByTagName('param');
foreach ($params as $param) {
  if ($param->getAttribute('name') == 'FlashVars') {
    $params = decode_query_string($param->getAttribute('value'));
    $screen_file = $params['screenfile'];
  }
}
$embeds = $html->getElementsByTagName('embed');
$embed = $embed[0];
$embed->setAttribute('height', 300);
$embed->setAttribute('width', 400);
$raw_html = $html->saveHTML();

function decode_query_string($url) {
  $parts = parse_url($url);
  $query_string = $parts['query'];
  $vars = explode('&', $query_string);
  $ret = array();
  foreach ($vars as $var) {
    list($key, $value) = explode('=', $var, 2);
    $ret[urldecode($key)][] = urldecode($value);
  }
  return $ret;
}

答案 1 :(得分:2)

遵循:

$html = '<your HTML here>';

$dom = new DOMDocument;
$dom->loadHTML($html);

$xpath  = new DOMXPath($dom);
$result = $xpath->query('//object/param[@name = "FlashVars"][1]/@value');

foreach ($result as $node) {  // there should only be one
  preg_match(/screnfile=([^&]+)/, $node->nodeValue, $matches);
  print $matches[1];
}

未经测试,但你明白了。我会尽可能避免使用正则表达式解析HTML,尽管在这种情况下单独使用正则表达式可以工作(但由于示例代码和现实倾向于分歧,我仍然建议使用基于解析器的方法。)

答案 2 :(得分:1)

使用/screenfile=([^&]+)/查找screenfile的值。 $1将包含所需的值。用正则表达式解析html并不是一个好主意。

更改宽度:

  replace `/\bwidth="\d+"\b/` with width="423"

更改高度:

  replace `/\bheight="\d+"\b/` with height="565"