Question

希望晚会不仅好客，而且你已经将你的emacs终端换成了一些生活方式很好的Ralph Lauren目录晚宴派对类型的场景。至于我，我试图在Julia中解析CSV并且事情正在恶化。这是我的代码：

f2 = open("/Users/MacBookPro15/testnovo.csv", "r")

skip(f2, 736)

for line in eachline(f2)
    string_split = split(line, ",")
    println(string_split[1])      
end

现在，如果我替换string_split[2]或[1]以外的任何内容，我会得到一个BoundsError，而且相当令人沮丧，因为我需要这些项目。谁能告诉我如何避免这种情况？

Answer 1

每次我听到＆＃34;解析CSV＆＃34;在我得到一个缺失的引用的闪回之前，我想要躲避我的耳朵，或者通过一个33列，10GB的csv文件获得98列的32列线。

幸运的是，有两个有用的功能会阻止您滚动自己的csv解析器：

阅读Julia的标准库http://docs.julialang.org/en/release-0.2/stdlib/base/?highlight=readcsv#Base.readcsv
可在Dataframe.jl http://juliastats.github.io/DataFrames.jl/io.html

Answer 2

不幸的是，看起来你需要DataStream抽象，我们停止在DataFrame中包含它，因为没有足够的人使用它来使其健壮。 https://github.com/JuliaStats/DataFrames.jl/blob/master/prototypes/datastream.jl的前100行应该为您提供足够的信息来编写您自己的流式算法，以便使用CSV。

朱莉娅解析CSV

2 个答案: