我将网站内容存储在字符串 $ html 中。
我希望计算链接到 .otf 格式的文件的所有html链接,添加这些链接的列表 $ html 的结尾和删除原始链接。
一个例子:
<?php
$html_input = '
<p>
Lorem <a href="font-1.otf">ipsum</a> dolor sit amet,
consectetur <a href="http://www.cnn.com">adipiscing</a> elit.
Quisque <a href="font-2.otf">ultricies</a> placerat massa
vel dictum.
</p>'
// some magic here
$html_output = '
<p>
Lorem ipsum dolor sit amet,
consectetur <a href="http://www.cnn.com">adipiscing</a> elit.
Quisque ultricies placerat massa
vel dictum.
</p>
<p>.otf-links: 2</p>
<ul>
<li><a href="font-1.otf">ipsum</a></li>
<li><a href="font-2.otf">ultricies</a></li>
</ul>'
?>
我该怎么做?我应该使用正则表达式,还是有其他方式?
答案 0 :(得分:5)
require_once("simple_html_dom.php");
$doc = new simple_html_dom();
$doc->load($input_html);
$fonts = array();
$links = $doc->find("a");
foreach ( $links as $l ) {
if ( substr($l->href, -4) == ".otf" ) {
$fonts[] = $l->outertext;
$l->outertext = $l->innertext;
}
}
$output = $doc->save() . "\n<p>.otf-links: " . count($fonts) ."</p>\n" .
"<ul>\n\t<li>" . implode("</li>\n\t<li>", $fonts) . "</li>\n</ul>";
简单HTML DOM的文档http://simplehtmldom.sourceforge.net/
答案 1 :(得分:2)
示例:
$h = str_get_html($html);
$linkCount = count($h->find('a'));
foreach ( $h->find('a') as $a ){
//print every link ending in .odf
if ( ends_with(strtolower($a->href), '.odf') ){ //ends with isn't a function, but it is trivial to write
echo '<li><a href="'.$a->href.'">'.$a->innertext.'</a></li>';
}
}
答案 2 :(得分:-1)
preg_match('~<a href="[^"]+\.otf">.*?</a>~s', $html_input, $matches);
$linksCount = count($matches[0]);
preg_replace('~<a href="[^"]+\.otf">.*?</a>~s', '', $html_input);
$html_input.='<ul><li>'.implode('</li><li>', $matches[0]).'</li></ul>';