Question

我认为这应该是基本的，但我仍然无法理解它。假设有相当数量的HTML文档，我需要从中捕获每个图像URL。

内容的其余部分会更改，但网址的基础始终相同，例如：http://images.examplesite.com/images/，

所以我想提取包含该部分的每个字符串。问题是它们总是与<a href=''>或<img src=''>标签混在一起，所以我怎么能把它们删掉？ preg_match可能？

Answer 1

尝试类似：preg_match_all('/http:\/\/images\.examplesite\.com\/images\/(.*?)"/i', $html_data, $results, PREG_SET_ORDER)

Answer 2

或使用正则表达式。

  preg_match_all("/http:\/\/images.examplesite.com\/images\/(.*?)\"/s", $str, $preg);
  print_r($preg);