带有单词边界的某些数字或字符后的省略

时间:2016-01-26 20:39:57

标签: php regex ellipsis word-boundary

我正在尝试使用省略号(...)来缩短长描述并希望有字边界。

这是我当前的代码eval.in

# Assume $body is a long text.
$line = $body;
if(strlen($body) > 300 && preg_match('/^.{1,300}\b/su', $body, $match)) {
    $line = trim($match[0]) . "…";
}
echo $line;

这实际上效果很好,我喜欢它,除了有时词边界后面有一个标点符号。

如果我使用上面的代码,我会得到如下结果:

This is a long description…I have punctuations,…。在插入省略号之前,我希望删除最后一个单词之后的标点符号。

帮助?

2 个答案:

答案 0 :(得分:1)

您可以使用:

\w
\b之前

ellipsis确保我们不会在非字词后添加scale

答案 1 :(得分:1)

以下是您的固定方法:

$body = "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nam eu congue ex. Nunc sem arcu, fermentum vel feugiat quis, consequat nec enim. Quisque et pulvinar velit, et laoreet justo. Integer quis sapien ac turpis mattis lobortis at at metus. Vestibulum euismod turpis odio, id luctus quam pharetra, at, et. Sed finibus, nunc at ultricies posuere, dui mauris aliquet quam, eget aliquet ligula libero a turpis. Pellentesque eu diam sodales, sollicitudin leo et, sagittis magna. Donec feugiat, velit quis condimentum porttitor, enim sapien varius elit, sit amet pretium risus turpis vitae massa. Sed ac ligula sit amet lorem scelerisque tristique a id ex. Nullam maximus tincidunt magna, vel molestie lectus tempus non. Sed euismod placerat ultricies. Morbi dapibus augue ut odio faucibus, vel maximus nisl pharetra. Aliquam hendrerit dolor in ipsum pharetra, eget tincidunt lacus ultrices.";

$line = $body;
if(strlen($body) > 300 && preg_match('/^(.{1,300})(?!\w)\b\p{P}*/su', $body, $match)) {
    $line = trim($match[1]) . "…";
}
echo $line;

请参阅eval.in demo

正如我在评论中指出的那样,您可以匹配标点符号(可选地,使用\p{P}*),但我忘记了\b可以匹配尾随前导词边界。通过使用否定前瞻\b限制(?!\w)(例如(?!\w)\b),我们只匹配尾随字边界。

此外,捕获组((...))被添加到模式中,以便我们只捕获到第1组中的字符串,并且删除了尾随标点符号,并且可以使用$match[1]