创建列,用“,”分隔为数字输出

时间:2019-08-19 10:24:35

标签: r strsplit

我正在尝试将当前在行中的数据显示为"XXX-XX-0001, YY-YY-0001"到新列中,概述每行[2]中的数字

我设法突变了一个新列,但是它是字符输出chr [2],我只需要2。

{r}
bill <- bill %>%
mutate(NO_IA = strsplit(as.character(IA_YES), ","))

当我尝试用作.numeric时,不喜欢我的输入是“,”-同样,如果我尝试将其加倍,则拒绝将其输入为(as.numeric和{{1} })

1 个答案:

答案 0 :(得分:0)

经过澄清后,这是一个更好的答案:

数据(来自注释)

string <- scan(text = "
AAA-GB-0001 
BBB-ES-0005,ADD-GB-0001 
BSC-ES-0005,HQQ-GB-0001,REE-GB-0001 
BDD-GB-0001,BSC-ES-0005,HQQ-GB-0001,UZZ-DE-0001 
BDD-GB-0001,UEE-DE-0001 
BDD-GB-0001,BRE-EE-0005,CTT-DE-0002,LZZ-DE-0011,UZZ-DE-0001", 
               what = character(), sep = "\n")

library(dplyr)
bill <- tibble(IA_YES = string)

下一次提供一些示例数据将是有意义的。例如,使用dput()(在这种情况下,是从dput(bill)复制结果。

解决方案

请注意,代码中的strsplit命令将创建一个列表。该列表存储在新创建的列中,并且可以用作R中的任何其他列表。我们可以使用purrr包对列表进行操作,它提供了R的* apply函数的更好版本:

bill %>%
  mutate(NO_IA = strsplit(as.character(IA_YES), ",")) %>% 
  mutate(length = map_int(NO_IA, length))
#> # A tibble: 6 x 3
#>   IA_YES                                                    NO_IA    length
#>   <chr>                                                     <list>    <int>
#> 1 "AAA-GB-0001 "                                            <chr [1~      1
#> 2 "BBB-ES-0005,ADD-GB-0001 "                                <chr [2~      2
#> 3 "BSC-ES-0005,HQQ-GB-0001,REE-GB-0001 "                    <chr [3~      3
#> 4 "BDD-GB-0001,BSC-ES-0005,HQQ-GB-0001,UZZ-DE-0001 "        <chr [4~      4
#> 5 "BDD-GB-0001,UEE-DE-0001 "                                <chr [2~      2
#> 6 BDD-GB-0001,BRE-EE-0005,CTT-DE-0002,LZZ-DE-0011,UZZ-DE-0~ <chr [5~      5

map_int(NO_IA, length)的简短解释:map函数均以相同的方式工作。您提供可以转换为列表的列表或向量,并对其应用函数。在这种情况下,我们测量列表中每个条目的length()。编写它的另一种方法是map_int(NO_IA, function(x) length(x))。与purrr函数相比,apply的优势在于您可以更好地控制输出。 map_int将返回整数,例如,map_chr将返回字符对象。

旧答案

您只需在转换前用点将逗号替换:

library(dplyr)df <- tibble(num = c("12,3", "10.7"))
df %>% 
  mutate(num = as.numeric(sub(",", ".", num, fixed = TRUE)))
#> # A tibble: 2 x 1
#>     num
#>   <dbl>
#> 1  12.3
#> 2  10.7

更多“整洁”版本:

library(tidyverse)
df <- tibble(num = c("12,3", "10.7"))
df %>% 
  mutate(num = str_replace(num, fixed(","), ".") %>%  
           as.numeric())
#> # A tibble: 2 x 1
#>     num
#>   <dbl>
#> 1  12.3
#> 2  10.7