我有一个80列的Excel电子表格。我只想阅读四列。列的位置可能会更改,因此我想按列名选择它们。我是通过
df <- read_xlsx("dat")[c("a", "b", "c", "d")]
但是, d 被错误地认为是逻辑上的,而实际上却是四个层次的因素。可以通过col_type
设置列的类型,但是此函数的参数引用原始的80列。因此,要设置正确的类型,我必须知道列位置,而我不知道。即使设置80种列类型(可能使用rep()
)也很麻烦,尽管我只需要其中4种即可。以文本形式读取所有内容都不起作用,因为其中一列为date:time格式,因此受到干扰。
有谁知道如何解决这个问题?
我的计算机上无法正常运行带有Java和Perl的软件包。
答案 0 :(得分:0)
fread
位于data.table包中,它将提供您正在寻找的功能。
被称为“快速友好的文件整理器”, data.table软件包非常有用且易于使用。它的fread() 函数旨在直接从常规定界文件中导入数据 进入R,没有任何弯路或废话。 https://www.datacamp.com/community/tutorials/importing-data-r-part-two
df<-fread("path",select=c("col1","col2",..........))