我是R的初学者,我一直在处理一个包含2075260行和10列的数据。该文件的扩展名为.txt。在通过read.csv或read.table读取数据集并在数据框上运行str时,我收到此消息。
data <- read.csv("mydata.txt")
str(data)
'data.frame': 2075260 obs. of 1 variable:
$ V1: Factor w/ 2075260 levels "1/1/2007;00:00:00;2.580;0.136;241.970;10.600;0.000;0.000;0.000",..: 2075260 491041 491042 491043 491044 491045 491046 491047 491048 491049 ...
我希望将这些数据存储在具有2075260个obs和10个变量的数据框中,但似乎存在一个我无法弄清楚的问题。我搜索了类似的问题,但无法找到答案。非常感谢您的回答!
问候,
答案 0 :(得分:2)
对于 .txt 文件,应使用 read.table ;对于 .csv,应使用 read.csv 而不是em>文件。但是使用 read.table :
data <- read.table("mydata.txt",sep=" ",header=T)
使用sep可以指定出现在两列之间的“字符”,例如','或空格(“”)或制表符(“ \ t”)。此外,您还可以使用标头指定在数据中是否存在包含每一列名称的行(这是第一行)。