从标签中提取文本

时间:2013-09-15 11:38:23

标签: php

我在字符串中有一个HTML,我试图将其提取并放入变量。

HTML

<b>App name</b>
v1.1.5 by
<a href="#">Link</a>
<br>
some description of app -
<a href="#">options</a>
<br>
<small style="color:#666">By Android market</small>

我的主要问题是某些文字不会被HTML标记扭曲,例如v1.1.5 bysome description of app

如何获取所有文本的内部和外部标记并将它们放入数组中?我没有尝试过任何代码因为我不知道得到的文字没有被标签扭曲

1 个答案:

答案 0 :(得分:2)

尝试strip_tags() + explode() + array_filter()

<?php
// header('Content-Type: text/plain');

$str = <<<HTM
<b>App name</b>
v1.1.5 by
<a href="#">Link</a>
<br>
some description of app -
<a href="#">options</a>
<br>
<small style="color:#666">By Android market</small>
HTM;

$buffer = array_filter(explode(PHP_EOL, strip_tags($str)));

var_dump($buffer);
?>

输出:

array(6) {
  [0]=>
  string(8) "App name"
  [1]=>
  string(9) "v1.1.5 by"
  [2]=>
  string(4) "Link"
  [4]=>
  string(25) "some description of app -"
  [5]=>
  string(7) "options"
  [7]=>
  string(17) "By Android market"
}