如何在html(来自url)标签属性中查找

时间:2013-09-24 18:17:18

标签: php html file-get-contents

   <?php 

    $html = file_get_contents('https://vine.co/v/h5PZJxYiHra/card');
    //$videoSrc = ?;
    ?>

使用函数file_get_contents()

我获取了网址的HTML内容。

我需要在这个HTML中找到TAG <source src="https://v.cdn.vine.co/r/videos/xxxxx.mp4 " type="video/mp4">

如何获取源属性 src

2 个答案:

答案 0 :(得分:1)

有几种方法可以做到这一点。

<强> 1。 PHP DOM - http://us1.php.net/dom

这个doo-hickey将根据您提供的源代码生成XML / XHTML对象。这是一种树状结构,你可以穿过它。

<强> 2。 PHP XML - http://php.net/manual/en/book.xml.php

就像#1一样,但是旧的XML解析器。

第3。字符串文字搜索 - http://php.net/manual/en/function.strpos.php

这是一个很好的但很好的。使用strpos()查找源标记start,然后再次查找src标记并希望抓取字符串。这将要求标签是完美的,并没有留下很大的灵活性。

$source = strpos($html, '<source ');
if($source!==FALSE) {
  $src_loc = strpos($html, 'src="', $source);
  if($src_loc!==FALSE) {
    $end_quote = strpos($html, '"', $src_loc + 5);
    if($end_quote!==FALSE) {
      $final_src = substr($html, $src_loc+5, $end_quote-($src_loc+5)); //TADA!
    }
  }
}

答案 1 :(得分:0)

你可以试试这个

include_once 'simple_html_dom.php';
$url = "https://vine.co/v/h5PZJxYiHra/card";
$html = file_get_html($url);
$ret =  $html->find('source.src');