Question

我想收到一个包含文本

中所有h1标记值的数组

示例，如果这是给定输入字符串：

<h1>hello</h1>
<p>random text</p>
<h1>title number two!</h1>

我需要收到一个包含此内容的数组：

titles[0] = 'hello',
titles[1] = 'title number two!'

我已经想出如何获取字符串的第一个h1值，但我需要给定字符串中所有h1标签的所有值。

我目前正在使用它来接收第一个标签：

function getTextBetweenTags($string, $tagname) 
 {
  $pattern = "/<$tagname ?.*>(.*)<\/$tagname>/";
  preg_match($pattern, $string, $matches);
  return $matches[1];
 }

我传递了我想要解析的字符串，并将其作为$ tagname放入“h1”。我自己并没有写它，我一直在尝试编辑代码来做我想要的但是没有什么真正有效。

我希望有人可以帮助我。

提前致谢。

Answer 1

您可以使用simplehtmldom：

function getTextBetweenTags($string, $tagname) {
    // Create DOM from string
    $html = str_get_html($string);

    $titles = array();
    // Find all tags 
    foreach($html->find($tagname) as $element) {
        $titles[] = $element->plaintext;
    }
}

Answer 2

function getTextBetweenTags($string, $tagname){
    $d = new DOMDocument();
    $d->loadHTML($string);
    $return = array();
    foreach($d->getElementsByTagName($tagname) as $item){
        $return[] = $item->textContent;
    }
    return $return;
}

Answer 3

DOM的替代品。在内存出现问题时使用。

$html = <<< HTML
<html>
<h1>hello<span>world</span></h1>
<p>random text</p>
<h1>title number two!</h1>
</html>
HTML;

$reader = new XMLReader;
$reader->xml($html);
while($reader->read() !== FALSE) {
    if($reader->name === 'h1' && $reader->nodeType === XMLReader::ELEMENT) {
        echo $reader->readString();
    }
}

Answer 4

 function getTextBetweenH1($string)
 {
    $pattern = "/<h1>(.*?)<\/h1>/";
    preg_match_all($pattern, $string, $matches);
    return ($matches[1]);
 }

使用php从h1标签获取所有值

4 个答案: