如何将<p>
和<ol>
之类的HTML标签转换为基本格式的文本?
一个客户端有几个要保存到CSV(ugh)的数据表,然后它们要加载到excel中。其中一些字段具有HTML标记,包括项目符号列表和段落标记。我想在excel中正确显示此内容(客户端不太可能说服客户端运行VBA代码的东西),或者如果更容易使用PHP剥离所有标记并将其替换为项目符号,和换行符。
一个字段的示例:
<ol style="list-style-type: lower-alpha;">
<li>Blahblahblah lots of text</li>
<li>Even more text.</li>
<li>Yet more text</li>
</ol>
很抱歉,如果已经问过这个问题,但我只能找到相反问题(bullets -> <li>
)的答案,或者涉及大量VBA和超出我需要做的事情或客户所需要的其他事情的答案客户根本不会做。
答案 0 :(得分:2)
您可以使用strip_tags和str_replace。
将<li>
替换为项目符号,然后删除所有其他html标签。
$str ='<ol style="list-style-type: lower-alpha;">
<li>Blahblahblah lots of text</li>
<li>Even more text.</li>
<li>Yet more text</li>
</ol>';
echo strip_tags(str_replace("<li>", "•", $str));
/*
•Blahblahblah lots of text
•Even more text.
•Yet more text
*/