Question

提取句子字符串中最后一个单词的最优雅方法是什么？

句子不以“。”结尾。单词由空格分开。

sentence <- "The quick brown fox"
TheFunction(sentence)

应该返回：“狐狸”

如果可以使用简单的解决方案，我不想使用包。如果存在基于包的简单解决方案，那也没关系。

Answer 1

为了完整起见：库stringr包含一个完全解决此问题的函数。

library(stringr)

sentence <- "The quick brown fox"
word(sentence,-1)
[1] "fox"

Answer 2

tail(strsplit('this is a sentence',split=" ")[[1]],1)

基本上是@SeñorO。

的建议

Answer 3

x <- 'The quick brown fox'
sub('^.* ([[:alnum:]]+)$', '\\1', x)

这将捕获字符串之前的最后一串数字和字符。

您还可以使用regexec和regmatches功能，但我发现sub更清洁：

m <- regexec('^.* ([[:alnum:]]+)$', x)
regmatches(x, m)

有关详细信息，请参阅?regex和?sub。

Answer 4

另一个打包的选项是stri_extract_last_words()包

中的stringi

library(stringi)

stri_extract_last_words("The quick brown fox")
# [1] "fox"

该功能还会删除句子末尾的任何标点符号。

stri_extract_last_words("The quick brown fox? ...")
# [1] "fox"

Answer 5

顺便提一下，这是我能想到的最简单的答案：

library(stringr)

x <- 'The quick brown fox'
str_extract(x, '\\w+$')
#[1] "fox"