使用DOM处理非格式化的HTML

时间:2011-01-25 01:36:03

标签: dom data-mining

我有一个从网站的源代码中获取的HTML。我使用post方法将数据从我的页面发送到网站,响应是源代码。我需要一些文字来源。

该文件格式不正确。所以,我不能使用DOM,我不能用DOM分隔标签和数据。 我如何分离标签和数据,以及如何获得唯一的数据?

我正在使用PHP。

感谢。

1 个答案:

答案 0 :(得分:0)

我发现了一些从html源代码中获取数据的方法。我说有问题,我使用PHP。 我将使用preg_match_all函数和正则表达式。希望,我能克服;)

感谢所有感兴趣的人;)