标签: php preg-replace html-parsing str-replace
也许这是一个古老的问题,但我正在尝试作为一个个人实验来从网页上获取一个页面,然后使用所有相对网址,链接,href,src等与其绝对网址进行复制。
我正在使用CURL来获取hte页面,我现在有一个包含所有代码的$ html变量..
那么什么;下一步?我使用preg_replace?如何?
感谢
答案 0 :(得分:1)
下一步是将其放入HTML解析器并遍历树,在href标签上查找并修复a属性,在src上img属性标签等等。解析器将能够在完成后将树重新发射为字符串。
href
a
src
img