Question

我有一个80列的Excel电子表格。我只想阅读四列。列的位置可能会更改，因此我想按列名选择它们。我是通过

df <- read_xlsx("dat")[c("a", "b", "c", "d")]

但是， d 被错误地认为是逻辑上的，而实际上却是四个层次的因素。可以通过col_type设置列的类型，但是此函数的参数引用原始的80列。因此，要设置正确的类型，我必须知道列位置，而我不知道。即使设置80种列类型（可能使用rep()）也很麻烦，尽管我只需要其中4种即可。以文本形式读取所有内容都不起作用，因为其中一列为date：time格式，因此受到干扰。有谁知道如何解决这个问题？

我的计算机上无法正常运行带有Java和Perl的软件包。

Answer 1

fread位于data.table包中，它将提供您正在寻找的功能。

被称为“快速友好的文件整理器”， data.table软件包非常有用且易于使用。它的fread（）函数旨在直接从常规定界文件中导入数据进入R，没有任何弯路或废话。 https://www.datacamp.com/community/tutorials/importing-data-r-part-two

df<-fread("path",select=c("col1","col2",..........))

R readxl：如何指定所选列的列类型

1 个答案: