使用PHP从网页获取特定的HTML

时间:2012-07-17 19:52:28

标签: php regex parsing html-parsing

  

可能重复:
  How to parse and process HTML with PHP?

我正在学习PHP,当我必须从没有可用API的网页中提取(解析)一些数据时,我使用正则表达式或一个接受两个字符串之间的字符串的函数。

我想知道是否有更“专业”,更简单的方法来执行此操作,因为regexp耗费资源而且不是现在为我编写的最简单的方法。

2 个答案:

答案 0 :(得分:1)

您永远不应该尝试使用 regular-expressions 来解析XML( html ),而是为自己创建一个适当的XML解析器库并以正确的方式执行。我可能听起来更艰巨的任务,但最后你会感谢自己。

可以使用以下某种资源或类似资源进行解析。


关于html和正则表达式的流行和传奇答案,诗歌值得一读:

答案 1 :(得分:1)

PHP附带了一个默认的XML解析库供您在此特定情况下使用。使用file_get_contents来检索HTML页面并进行相应的解析。

XML http://php.net/manual/en/book.xml.php

file_get_contents http://php.net/manual/en/function.file-get-contents.php