Question

此代码必须是文本strign，且其文本之间以';'分隔。

$text='<p class="users_attr" style=""></p>
    <h3 class="show_user_h3" style=""><a href="/ru/tutors/violin/" class="link_users_attr">Игра на скрипке, виолончели</a></h3>
    , 
    <h3 class="show_user_h3" style=""><a href="/ru/tutors/hrafika-1/" class="link_users_attr">Искусствоведение</a></h3>
    , 
    <h3 class="show_user_h3" style=""><a href="/ru/tutors/uroki-vokala/" class="link_users_attr">Уроки вокала</a></h3>
    , 
    <h3 class="show_user_h3" style=""><a href="/ru/tutors/hra-na-fortepano/" class="link_users_attr">Игра на фортепиано</a></h3>
    , 
    <h3 class="show_user_h3" style=""><a href="/ru/tutors/sopilka/" class="link_users_attr">Игра на флейте</a></h3>
    , 
    <h3 class="show_user_h3" style=""><a href="/ru/tutors/muzika/" class="link_users_attr">Музыка</a></h3>
    , 
    <h3 class="show_user_h3" style=""><a href="/ru/tutors/psykholohiia/" class="link_users_attr">Психология</a></h3>
    <p style=""></p>';

我通过以下功能做到这一点：

$data['cats'] = explode('</h3>', $text);
$data['cats'] = implode("; ", $data['cats']);   
$data['cats'] = strip_tags($data['cats'], '<h3><a><p>');
$data['cats'] = str_replace(" , ", "", $data['cats']);

函数$ text之后：

<p class="users_attr"></p>
<h3 class="show_user_h3">
<a href="/ru/tutors/violin/" class="link_users_attr">Игра на скрипке, виолончели</a>; , 
<h3 class="show_user_h3">
<a href="/ru/tutors/hrafika-1/" class="link_users_attr">Искусствоведение</a>; , 
<h3 class="show_user_h3">
<a href="/ru/tutors/uroki-vokala/" class="link_users_attr">Уроки вокала</a>; , 
<h3 class="show_user_h3">
<a href="/ru/tutors/hra-na-fortepano/" class="link_users_attr">Игра на фортепиано</a>; , 
<h3 class="show_user_h3">
<a href="/ru/tutors/sopilka/" class="link_users_attr">Игра на флейте</a>; , 
<h3 class="show_user_h3">
<a href="/ru/tutors/muzika/" class="link_users_attr">Музыка</a>; , 
<h3 class="show_user_h3">
<a href="/ru/tutors/psykholohiia/" class="link_users_attr">Психология</a>;

为什么strip_tags不删除html标签，为什么str_replace不删除文本'，'的这部分？

Answer 1

一旦您删除了所有标签，则只需要用分号和一个空格替换逗号（它们由前导和一个或多个空格字符结尾）。我将添加trim()以清除字符串结尾处所有留存的空白字符。

代码：（Demo）

echo trim(preg_replace('~\s+,\s+~', '; ', strip_tags($text)));

输出：

Игра на скрипке, виолончели; Искусствоведение; Уроки вокала; Игра на фортепиано; Игра на флейте; Музыка; Психология

也许更稳定的选择是解析html并从<a>标记中提取nodeValues。

代码：（Demo）

$dom=new DOMDocument; 
$dom->loadHTML('<?xml encoding="utf-8" ?>' . $text);  // https://stackoverflow.com/a/8218649/2943403
$xpath = new DOMXPath($dom);

$data['cats'] = [];
foreach ($xpath->query("//a") as $node) {
    $data['cats'][] = $node->nodeValue;
}
echo implode('; ', $data['cats']);
// same result

内爆后未清除带有strip_tags和str_replace的文本

1 个答案: