如何清理HTML / XML?

时间:2016-10-20 00:27:55

标签: javascript html xml web-services rest

我收到如下网络服务回复:

  <text>&lt;span class="TitleServiceChange" &gt;Service Change&lt;/span&gt;
                  &lt;span class="DateStyle"&gt;
                  &amp;nbsp;Posted:&amp;nbsp;10/19/2016&amp;nbsp; 8:04PM
                  &lt;/span&gt;
                  &lt;br/&gt;
                  &lt;br/&gt;
                &lt;P&gt;&lt;STRONG&gt;B103-Ltd&lt;/STRONG&gt; and &lt;STRONG&gt;BM2 &lt;/STRONG&gt;buses are detoured due to paving on Avenue M between Remsen Av and E. 95 St. &lt;/P&gt;
&lt;P&gt;Detour is as follows: &lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;Eastboun&lt;/STRONG&gt;d: Via Avenue M. right on Remsen Av, left on Avenue N, left on Rockaway Pkwy, right on Avenue M and regular route. &lt;/P&gt;
&lt;P&gt;&lt;STRONG&gt;Westbound&lt;/STRONG&gt;: Via Avenue M, left on E. 95 St, right on Avenue N, right on E. 85 St, right on Remsen Av, left on Avenue M, and regular route. &lt;/P&gt;
&lt;P&gt;All corresponding stops will be made along the detoured route. &lt;/P&gt;
&lt;P&gt;Allow additional travel time. &lt;/P&gt;
              &lt;br/&gt;
              &lt;br/&gt;</text>

我不是特别相信这种符号是什么,但似乎&lt;&gt; HTML标签已被转换为&amp; lt和&amp; gt(小于和大于)与其他H​​TML。有没有办法清理这个响应,所以我可以使用纯文本?

1 个答案:

答案 0 :(得分:1)

首先使用htmlspecialchars_decode将特殊字符转换为HTML标记,然后使用strip_tags中的结果字符串删除html标记。在它之后你将只有文字。