计算字符串中的html链接并添加列表

时间:2010-02-19 11:02:58

标签: php html regex string count

我将网站内容存储在字符串 $ html 中。

我希望计算链接到 .otf 格式的文件的所有html链接,添加这些链接的列表 $ html 的结尾和删除原始链接。

一个例子:

<?php
$html_input = '
<p>
    Lorem <a href="font-1.otf">ipsum</a> dolor sit amet, 
    consectetur <a href="http://www.cnn.com">adipiscing</a> elit.
    Quisque <a href="font-2.otf">ultricies</a> placerat massa 
    vel dictum.
</p>'

// some magic here    

$html_output = '
<p>
    Lorem ipsum dolor sit amet, 
    consectetur <a href="http://www.cnn.com">adipiscing</a> elit.
    Quisque ultricies placerat massa 
    vel dictum.
</p>
<p>.otf-links: 2</p>
<ul>
    <li><a href="font-1.otf">ipsum</a></li>
    <li><a href="font-2.otf">ultricies</a></li>
</ul>'
?>        

我该怎么做?我应该使用正则表达式,还是有其他方式?

3 个答案:

答案 0 :(得分:5)

require_once("simple_html_dom.php");

$doc = new simple_html_dom();
$doc->load($input_html);

$fonts = array();
$links = $doc->find("a");

foreach ( $links as $l ) {
    if ( substr($l->href, -4) == ".otf" ) {
        $fonts[]      = $l->outertext;
        $l->outertext = $l->innertext;
    }
}

$output = $doc->save() . "\n<p>.otf-links: " . count($fonts) ."</p>\n" .
    "<ul>\n\t<li>" . implode("</li>\n\t<li>", $fonts) . "</li>\n</ul>";

简单HTML DOM的文档http://simplehtmldom.sourceforge.net/

答案 1 :(得分:2)

使用DOM Parser

示例:

$h = str_get_html($html);

$linkCount = count($h->find('a'));

foreach ( $h->find('a') as $a ){
    //print every link ending in .odf
    if ( ends_with(strtolower($a->href), '.odf') ){ //ends with isn't a function, but it is trivial to write

        echo '<li><a href="'.$a->href.'">'.$a->innertext.'</a></li>';
    }
}

答案 2 :(得分:-1)

preg_match('~<a href="[^"]+\.otf">.*?</a>~s', $html_input, $matches);
$linksCount = count($matches[0]);
preg_replace('~<a href="[^"]+\.otf">.*?</a>~s', '', $html_input);
$html_input.='<ul><li>'.implode('</li><li>', $matches[0]).'</li></ul>';