如何在R中读取未格式化的txt文件

时间:2018-10-31 12:55:09

标签: r

我想阅读以下r中的数据示例。

第一列是国家/地区名称,但是当我在r中阅读时,它给出了sep的一些错误?

我的代码:

df <- read.table('df.txt', header=T)

我的数据看起来像

column1 column 2
spain      20
united kingdom 37
germany 97
republic of china 12

有什么建议吗?

1 个答案:

答案 0 :(得分:0)

问题是每行有不同的列数(使用定界符sep=" ")。试试

df = readLines("df.txt")

这将为您提供一个字符串向量,其中每个元素都是df.txt中的一行。您可以使用

进一步解析行
countries = strsplit(df, " ")
countries = sapply(countries, function(x) paste(x[-length(x)], collapse = " "))

获取国家/地区。

strsplit返回一个列表,sapply(...)删除列表中项目的最后一个元素,然后将它们全部粘贴回去。

您的问题可能是this question的重复项。