dplyr:mutate_impl(.data,dots)中的错误:参数' times'不正确

时间:2017-08-21 14:12:42

标签: r dplyr

我有一个小组:

# A tibble: 2 × 2
  read_seq unique_id
     <chr>     <dbl>
1 AATTGGCC         1
2   GGGTTT         2

我想创建一个包含与read_seq大小相同的字符串的新变量。我做到了但是有一个错误:

> r %>% mutate(y=paste(rep("H",width(read_seq)),sep=""))
Error in mutate_impl(.data, dots) : argument 'times' incorrect

当我只尝试捕捉read_seq宽度时,它可以工作:

> r %>% mutate(y=width(read_seq))
# A tibble: 2 × 3
  read_seq unique_id     y
     <chr>     <dbl> <int>
1 AATTGGCC         1     8
2   GGGTTT         2     6

这里是重复性示例的dput():

r <- structure(list(read_seq = c("AATTGGCC", "GGGTTT"), unique_id = c(1, 
2)), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, 
-2L), .Names = c("read_seq", "unique_id"))

1 个答案:

答案 0 :(得分:4)

错误来自reptimes参数需要是x的1或相同的长度,这不是这里的情况:

rep("H", c(1,2))
Error in rep("H", c(1, 2)) : invalid 'times' argument

您可以改用strrep,根据需要回收xtimes

r %>% mutate(y = strrep("H",nchar(read_seq)))

# A tibble: 2 x 3
#  read_seq unique_id        y
#     <chr>     <dbl>    <chr>
#1 AATTGGCC         1 HHHHHHHH
#2   GGGTTT         2   HHHHHH

或者,如果您需要一些大小相等的随机字符串,请使用stringi::stri_rand_strings

r %>% mutate(y = stri_rand_strings(length(read_seq), nchar(read_seq)))

# A tibble: 2 x 3
#  read_seq unique_id        y
#     <chr>     <dbl>    <chr>
#1 AATTGGCC         1 H0flAbNS
#2   GGGTTT         2   QrQOLj