Question

我是R的初学者，我一直在处理一个包含2075260行和10列的数据。该文件的扩展名为.txt。在通过read.csv或read.table读取数据集并在数据框上运行str时，我收到此消息。

data <- read.csv("mydata.txt")

 str(data)

'data.frame':   2075260 obs. of  1 variable:
 $ V1: Factor w/ 2075260 levels "1/1/2007;00:00:00;2.580;0.136;241.970;10.600;0.000;0.000;0.000",..: 2075260 491041 491042 491043 491044 491045 491046 491047 491048 491049 ...

我希望将这些数据存储在具有2075260个obs和10个变量的数据框中，但似乎存在一个我无法弄清楚的问题。我搜索了类似的问题，但无法找到答案。非常感谢您的回答！

问候，

Answer 1

对于 .txt 文件，应使用 read.table ；对于 .csv，应使用 read.csv 而不是em>文件。但是使用 read.table ：

data <- read.table("mydata.txt",sep=" ",header=T)

使用sep可以指定出现在两列之间的“字符”，例如'，'或空格（“”）或制表符（“ \ t”）。此外，您还可以使用标头指定在数据中是否存在包含每一列名称的行（这是第一行）。

将文本文件转换为R中的数据框

1 个答案: