我已经获得了一堆.csv文件来读入R.不幸的是它们格式很差。从顶行向下格式化是这样的:
以下内容可以粘贴到文本文件中并保存为.csv,以说明此问题:
<h3>
我的问题是我可以使用R来删除空行和数据标题行,以便.csv正确读入而不会让那些令人讨厌的奇怪行弄乱导入吗?
我认为我不能直接添加.csv一个问题,但我为在此处添加额外步骤而道歉。
答案 0 :(得分:2)
这可以解决您的问题吗?
na.omit(read.table(your_csv, skip=3, sep=","))
或read.csv
:
na.omit(read.csv(your_csv, skip=3, header=FALSE))
我们跳过前三行,因为其中一些没有3列。第4行read.*
实际读取的第一行有三列,与所有其他行一样。然后,我们删除包含至少一个NA
的任何行,因为csv
中的空白单元格已转换为NA
。
请注意,如果第一行(可能更正确)格式化为:
Parameter,Value,Category
, ,
Class1, ,
Blue,50,Bright
然后na.omit(read.csv(your_csv))
将完成作业并保留标题。