我在PHP中整理了一个快速提取功能。基本上,它将读取给定URL的内容并提取必要的HTML代码。然后它会将代码放入新页面。现在,除了一件事,我已经完成了所有工作。
我有一个包含URL内容的字符串,现在我想在两个标签之间提取文本。 假设我想开始在某个标签上复制内容。这很容易,因为这些标签有类。
所以我的函数以“”开头。它只是在文档中搜索与之匹配的所有文本。不过,我遇到了一个问题。在我希望复制的部分中,还有其他标签。因此,如果我告诉函数停止在“,”处提取,则刮刀将在随机标记的末尾停止读取。有人可以帮我写一些PHP代码,以确保函数停止的标签是“”的结束标签,而不是恰好在字符串中的一些随机标签吗?
提前致谢。
答案 0 :(得分:3)
无法执行此操作并考虑代码之间的所有可能内容。使用XmlDocument
并解析HTML。