我正在尝试将当前在行中的数据显示为"XXX-XX-0001, YY-YY-0001"
到新列中,概述每行[2]中的数字
我设法突变了一个新列,但是它是字符输出chr [2]
,我只需要2。
{r}
bill <- bill %>%
mutate(NO_IA = strsplit(as.character(IA_YES), ","))
当我尝试用作.numeric
时,不喜欢我的输入是“,”-同样,如果我尝试将其加倍,则拒绝将其输入为(as.numeric
和{{1} })
答案 0 :(得分:0)
经过澄清后,这是一个更好的答案:
string <- scan(text = "
AAA-GB-0001
BBB-ES-0005,ADD-GB-0001
BSC-ES-0005,HQQ-GB-0001,REE-GB-0001
BDD-GB-0001,BSC-ES-0005,HQQ-GB-0001,UZZ-DE-0001
BDD-GB-0001,UEE-DE-0001
BDD-GB-0001,BRE-EE-0005,CTT-DE-0002,LZZ-DE-0011,UZZ-DE-0001",
what = character(), sep = "\n")
library(dplyr)
bill <- tibble(IA_YES = string)
下一次提供一些示例数据将是有意义的。例如,使用dput()
(在这种情况下,是从dput(bill)
复制结果。
请注意,代码中的strsplit
命令将创建一个列表。该列表存储在新创建的列中,并且可以用作R
中的任何其他列表。我们可以使用purrr
包对列表进行操作,它提供了R
的* apply函数的更好版本:
bill %>%
mutate(NO_IA = strsplit(as.character(IA_YES), ",")) %>%
mutate(length = map_int(NO_IA, length))
#> # A tibble: 6 x 3
#> IA_YES NO_IA length
#> <chr> <list> <int>
#> 1 "AAA-GB-0001 " <chr [1~ 1
#> 2 "BBB-ES-0005,ADD-GB-0001 " <chr [2~ 2
#> 3 "BSC-ES-0005,HQQ-GB-0001,REE-GB-0001 " <chr [3~ 3
#> 4 "BDD-GB-0001,BSC-ES-0005,HQQ-GB-0001,UZZ-DE-0001 " <chr [4~ 4
#> 5 "BDD-GB-0001,UEE-DE-0001 " <chr [2~ 2
#> 6 BDD-GB-0001,BRE-EE-0005,CTT-DE-0002,LZZ-DE-0011,UZZ-DE-0~ <chr [5~ 5
对map_int(NO_IA, length)
的简短解释:map
函数均以相同的方式工作。您提供可以转换为列表的列表或向量,并对其应用函数。在这种情况下,我们测量列表中每个条目的length()
。编写它的另一种方法是map_int(NO_IA, function(x) length(x))
。与purrr
函数相比,apply
的优势在于您可以更好地控制输出。 map_int
将返回整数,例如,map_chr
将返回字符对象。
您只需在转换前用点将逗号替换:
library(dplyr)df <- tibble(num = c("12,3", "10.7"))
df %>%
mutate(num = as.numeric(sub(",", ".", num, fixed = TRUE)))
#> # A tibble: 2 x 1
#> num
#> <dbl>
#> 1 12.3
#> 2 10.7
更多“整洁”版本:
library(tidyverse)
df <- tibble(num = c("12,3", "10.7"))
df %>%
mutate(num = str_replace(num, fixed(","), ".") %>%
as.numeric())
#> # A tibble: 2 x 1
#> num
#> <dbl>
#> 1 12.3
#> 2 10.7