我正在学习PHP,当我必须从没有可用API的网页中提取(解析)一些数据时,我使用正则表达式或一个接受两个字符串之间的字符串的函数。
我想知道是否有更“专业”,更简单的方法来执行此操作,因为regexp耗费资源而且不是现在为我编写的最简单的方法。
答案 0 :(得分:1)
您永远不应该尝试使用 regular-expressions 来解析XML( html ),而是为自己创建一个适当的XML解析器库并以正确的方式执行。我可能听起来更艰巨的任务,但最后你会感谢自己。
可以使用以下某种资源或类似资源进行解析。
关于html和正则表达式的流行和传奇答案,诗歌值得一读:
答案 1 :(得分:1)
PHP附带了一个默认的XML解析库供您在此特定情况下使用。使用file_get_contents
来检索HTML页面并进行相应的解析。
XML :http://php.net/manual/en/book.xml.php
file_get_contents :http://php.net/manual/en/function.file-get-contents.php