如何对字符串中的字母进行排序?

时间:2011-05-05 22:23:37

标签: r sorting

假设我有一个字符串s = "bcabca"

"aabbcc"排除在外的最简单方法是什么,即对s中的字母进行排序?

4 个答案:

答案 0 :(得分:25)

也许不是最简单的答案,但这会奏效:

paste(sort(unlist(strsplit(s, ""))), collapse = "")

或修改strReverse的帮助页面中定义的?strsplit功能以满足我们的需求。我们称之为strSort:

strSort <- function(x)
        sapply(lapply(strsplit(x, NULL), sort), paste, collapse="")

答案 1 :(得分:18)

这是Chase解决方案的变体,它处理字符串向量并将原始字符串保留为名称。 ......我有机会推广使用vapply over sapply: - )

> x=c('hello', 'world', NA, 'a whole sentence')
> vapply(x, function(xi) paste(sort(strsplit(xi, NULL)[[1]]), collapse=''), '')
             hello              world               <NA>   a whole sentence 
           "ehllo"            "dlorw"                 "" "  aceeeehlnnostw" 

答案 2 :(得分:7)

提及此问题的stringi包可能会很好。它的stri_orderstri_sort函数非常有效,在上述基本R方法的一半时间内进行测试。

library(stringi)
## generate 10k random strings of 100 characters each
str <- stri_rand_strings(1e4, 100)
## helper function for vapply()
striHelper <- function(x) stri_c(x[stri_order(x)], collapse = "")
## timings
system.time({
  v1 <- vapply(stri_split_boundaries(str, type = "character"), striHelper, "")
})
#    user  system elapsed 
#   0.747   0.000   0.743 

system.time({
  v2 <- sapply(lapply(strsplit(str, NULL), sort), paste, collapse="")
})
#    user  system elapsed 
#   2.077   0.000   2.068 

identical(v1, v2)
# [1] TRUE

答案 3 :(得分:3)

重新审视这个问题,我的回答并不是那么好。这是一个具有base函数的更好版本:

vapply(strsplit(x, NULL), function(x) paste(sort(x), collapse = ''), '')

基于此测试向量:

NN = 1000000L
starts = seq(1L, NN, by = 100L)
name = 
  substring(paste(sample(letters, size = NN, replace = TRUE), collapse = ""),
            starts, starts + 99L)