朱莉娅解析CSV

时间:2014-03-23 01:21:30

标签: parsing csv io julia

希望晚会不仅好客,而且你已经将你的emacs终端换成了一些生活方式很好的Ralph Lauren目录晚宴派对类型的场景。至于我,我试图在Julia中解析CSV并且事情正在恶化。这是我的代码:

f2 = open("/Users/MacBookPro15/testnovo.csv", "r")

skip(f2, 736)

for line in eachline(f2)
    string_split = split(line, ",")
    println(string_split[1])      
end

现在,如果我替换string_split[2][1]以外的任何内容,我会得到一个BoundsError,而且相当令人沮丧,因为我需要这些项目。谁能告诉我如何避免这种情况?

2 个答案:

答案 0 :(得分:6)

每次我听到"解析CSV"在我得到一个缺失的引用的闪回之前,我想要躲避我的耳朵,或者通过一个33列,10GB的csv文件获得98列的32列线。

幸运的是,有两个有用的功能会阻止您滚动自己的csv解析器:

答案 1 :(得分:3)

不幸的是,看起来你需要DataStream抽象,我们停止在DataFrame中包含它,因为没有足够的人使用它来使其健壮。 https://github.com/JuliaStats/DataFrames.jl/blob/master/prototypes/datastream.jl的前100行应该为您提供足够的信息来编写您自己的流式算法,以便使用CSV。