如何读取具有制表符行定界符和竖线“ |”的CSV文件列分隔符?

时间:2019-02-06 00:34:47

标签: r csv tab-delimited-text

我正在尝试将CS​​V文件读入具有行和列定界符的R中:

竖线或竖管|是行定界符。 Tab是列定界符。

示例数据集:

Column A      Column B      Column C|Red            Shorts            10|Blue            Shirt             7|Yellow          Skirt            15

我不确定如何在read.csv函数中同时指定这两者,因为带有'sep'的字段分隔符选项上已经存在。

2 个答案:

答案 0 :(得分:0)

如您所说,如果.csv|分隔。它应如下所示。例如;想象有一个名为foo.csv的文件,其中包含内容,

Column A|Column B|Column C
|Red|Shorts|10

读取它的R代码应该是

foo <- read.csv('<path to>/foo.csv', sep = "|")
head(foo)

如果定界符是制表符,则必须这样做;

foo <- read.csv('<path to>/foo.csv', sep = "\t")

但不能两者兼而有之。

希望这会有所帮助。

答案 1 :(得分:0)

在R中似乎不可能,所以我最终将数据读取到Python中,用换行符替换了管道定界符,然后能够读取R中的数据,因为它现在仅包含一个定界符。

感谢所有帮助。