使用不规则行格式读取.csv

时间:2016-04-01 16:13:23

标签: r csv

我已经获得了一堆.csv文件来读入R.不幸的是它们格式很差。从顶行向下格式化是这样的:

  1. 标题
  2. 空行
  3. 数据标题
  4. 5行数据
  5. 空行
  6. 另一个数据标题
  7. 另外5行数据
  8. 然后重复模式
  9. 以下内容可以粘贴到文本文件中并保存为.csv,以说明此问题:

    <h3>

    我的问题是我可以使用R来删除空行和数据标题行,以便.csv正确读入而不会让那些令人讨厌的奇怪行弄乱导入吗?

    我认为我不能直接添加.csv一个问题,但我为在此处添加额外步骤而道歉。

1 个答案:

答案 0 :(得分:2)

这可以解决您的问题吗?

na.omit(read.table(your_csv, skip=3, sep=","))

read.csv

na.omit(read.csv(your_csv, skip=3, header=FALSE))

我们跳过前三行,因为其中一些没有3列。第4行read.*实际读取的第一行有三列,与所有其他行一样。然后,我们删除包含至少一个NA的任何行,因为csv中的空白单元格已转换为NA

请注意,如果第一行(可能更正确)格式化为:

Parameter,Value,Category
 , , 
Class1, , 
Blue,50,Bright

然后na.omit(read.csv(your_csv))将完成作业保留标题。