如何在R tidyverse

时间:2018-04-19 17:15:57

标签: r tidyverse

我正在努力使用Tidyverse,但数据类型转换被证明是一个障碍。我知道自动将字符串转换为因子是不理想的,但有时我想使用因子,因此一些方法可以很容易地将所需的字符列转换为因子。我更喜欢使用readxl包读取excel文件,但因素不是允许的列类型!事实上,我可以逐列完成,但这真的没有效率。我想要以下两件事中的任何一件起作用:

  1. 读入文件并同时指定应将哪些列读取为因子:

     data <- read_excel(path = "myfile.xlsx", 
                        col_types=c(col2="factor", col5="factor)))
    
  2. 或者这个功能因为很多原因而非常出色,但我无法弄清楚它应该如何工作。 col_types函数对我来说非常混乱:

     diamonds <- col_types(diamonds, 
                           cols=c(cut="factor", color="factor", clarity="factor"))
    
  3. 提前致谢!

1 个答案:

答案 0 :(得分:3)

>>> [tuple(s.replace('"','') for s in tup) for tup in example] [('7-30-17', '0x34', 'Upload Complete'), ('7-31-17', '0x35', 'RCM,Interlock error')] 使用Excel单元格类型来猜测在R中使用的列类型。我同意read_excel的观点,即应该读取数据并允许有限的列类型集。然后,如果用户希望,可以在以后进行类型转换。

没有名为read_excel的功能。这是col_types的参数名称。 read_excel方式是:

tidyverse