Question

从字符串中提取首字母的最佳方法是什么（除了最后一个单词）？例如转换＆＃34; GEORGE SMITH BROGAN＆＃34;到＆＃34; GS BROGAN＆＃34;

NAMES <- data.frame(ID = c("GEORGE SMITH BROGAN","ADAM STEVE WILLIS","UNITED INTERNATIONAL SHIPPING STATION")

以上名称的理想输出是GS BROGAN，AS WILLIS，UIS STATION。

Answer 1

我们可以尝试gsub

gsub("\\s+(?=[A-Z]\\b)", "", 
   gsub("\\b([A-Z])\\w+\\s|\\s(\\w+)$", "\\1 \\2", NAMES$ID), perl = TRUE)
#[1] "GS BROGAN"   "AS WILLIS"   "UIS STATION"

或将strsplit与paste

一起使用

sapply(strsplit(as.character(NAMES$ID), "\\s+"),
  function(x) paste(paste(substr(x[-length(x)], 1, 1), collapse=""), 
      x[length(x)]))
#[1] "GS BROGAN"   "AS WILLIS"   "UIS STATION"

Answer 2

以下是使用gsub的另一种方法：

gsub('\\s(?![A-Z]+$)', '', 
     gsub('(?<!\\s|^)[A-Z]+\\s', ' ', NAMES$ID, 
          perl = TRUE), perl = TRUE)
# [1] "GS BROGAN"   "AS WILLIS"   "UIS STATION"

从R中的字符串获取缩写

2 个答案: