我需要将 html文档拆分为两部分。第一部分,应包含N(30)个单词,下一个单词应包含其他所有单词。 而主要问题是防止拆分标签(标签的描述和正文)。
<a **<=>** href="text" > text </a>
<a href="text" > **<=>** text </a>
<a href="text" > text </ **<=>** a>
请给我建议(或者如果你已经写过这样的功能,请分享你的代码),如何实现它!感谢。
答案 0 :(得分:1)
使用DOM Parser,您可以在http://php.net/manual/en/book.dom.php
找到的文档您可以使用此类在树中解析html,并通过树操作获取结果并保存数据。