php / html:用换行符替换html结束标记

时间:2011-12-14 08:59:03

标签: php html newline strip-tags

我正在抓取网页上的html,当我使用php strip_tags时,它会将整个html刷成一行,删除所有结构。

我想通过用换行替换关闭h,p和br标签来保留结构。

preg替换是否是最佳解决方案?

一旦我替换了所有结束标签,我就会运行一个条形标签,但这样我就会有一个基本结构。

2 个答案:

答案 0 :(得分:5)

$str = 'some html';
$tags = array('</p>','<br />','<br>','<hr />','<hr>','</h1>','</h2>','</h3>','</h4>','</h5>','</h6>');
$str = str_replace($tags,"\n",$str);

// then strip tags

答案 1 :(得分:0)

为什么不通过tidy后续词来运行它来获得结构?