是否可以使用F#deedle直接读取zipped csv,就像read_csv
中的pandas
函数一样?如果这是不可能的,可以使用csv类型提供程序来执行此操作吗?
答案 0 :(得分:3)
如果您使用ICSharpCode.SharpZipLib NuGet包,您可以使用Deedle从zip中读取CSV,如下所示:
open ICSharpCode.SharpZipLib.Zip
open System.IO
open Deedle
[<EntryPoint>]
let main argv =
use fs = new FileStream(@"mycsv.zip", FileMode.Open, FileAccess.Read)
use zip = new ZipFile(fs)
use csv = zip.GetInputStream(0L)
let frame = Frame.ReadCsv(csv)
答案 1 :(得分:1)
为什么需要直接读取zipfile csv?您始终可以使用System.IO.Compression访问文件,然后将其提供给Deedle或CSVProvider甚至FileHelper:
open System.IO.Compression
open System.IO
let zipfile = @"C:\tmp\zipFile1.zip"
let unzip (zipfile:string) =
let zipf = new FileStream(zipfile,FileMode.Open,FileAccess.Read)
let zip = new ZipArchive(zipf)
zip
let unzipFile = unzip zipfile
let stream = new StreamReader(unzipFile.GetEntry("zipFile1.csv").Open())
let txt = stream.ReadToEnd()
如果您的输入可以获取流(如上面的库),那么此实用程序函数将执行此操作(直接在zipfile上使用OpenRead):
//string * string -> StreamReader
let getFromZip(entry,zip) =
ZipFile.OpenRead(zip)
|> (fun x -> x.GetEntry(entry))
|> (fun x -> new StreamReader(x.Open()))
您可能还需要引用System.IO.Compression.FileSystem
,但无需打开它。