CSV类型提供者和访问数据

时间:2019-02-12 01:33:33

标签: f# f#-data

晚上好!我是一个非常新的程序员,对F#颇有兴趣。我正在尝试进行一些简单的数据分析和绘图,但是我无法弄清楚如何正确访问数据。我已完成所有设置并使用CSVProvider,它可以完美运行:

#load @"packages\FsLab\FsLab.fsx"
#load @"packages\FSharp.Charting\FSharp.Charting.fsx"

open Deedle
open FSharp.Data


type Pt = CsvProvider<"C:/Users/berkl/Test10/CGC.csv">
let data = Pt.Load("C:/Users/berkl/Test10/CGC.csv")

然后,我提取特定条目的数据:

let test = data.Rows |> Seq.filter (fun r -> r.``Patient number`` = 2104)

这可以按预期工作,并将以下内容打印到FSI:

test;;
val it : seq<CsvProvider<...>.Row> =
  seq
    [(2104, "Cita 1", "Nuevo", "Femenino", nan, nan, nan);
     (2104, "Cita 2", "Establecido", "", 18.85191818, 44.0, 103.0);
     (2104, "Cita 3", "Establecido", "Femenino", 17.92617533, 46.0, 108.0);
     (2104, "Cita 4", "Establecido", "Femenino", nan, nan, nan); ...]

这是我不知所措的地方。我想取出第五列并将其与第六列相对应。而且我不知道如何访问它。

到目前为止,我所能做的就是在其中一列中访问单个值:

let Finally = Seq.item 1 test
let PtHt = Finally.Ht_cm

非常感谢您的帮助!

2 个答案:

答案 0 :(得分:2)

我可能建议使用XPlot库而不是F#图表,因为从长远来看,这将是FsLab中可用的库(它是跨平台的)。

要使用XPlot创建图表,您需要为其提供一系列具有X和Y值的对:

#load "packages/FsLab/FsLab.fsx"
open XPlot.Plotly

Chart.Scatter [ for x in 0.0 .. 0.1 .. 10.0 -> x, sin x ]

在您的示例中,您可以使用序列理解(如上例中)或使用Seq.map来获得所需的格式,如现有答案中所示-这两个选项都做同样的事情:

// Using sequence comprehensions
Chart.Scatter [ for row in test -> row.Ht_cm, row.Wt_kg ]

// Using Seq.map and piping
test |> Seq.map (fun row -> row.Ht_cm, row.Wt_kg) |> Chart.Scatter

关键是您需要生成一个包含X和Y值作为元组的序列(或列表)(而不是生成两个单独的序列)。

答案 1 :(得分:1)

您想要做的是将行序列转换为列中的值序列。您可以使用Seq.map进行任何此类转换。

您可以这样做(对我没有的正确列名取模)

let col5 =
    test
    |> Seq.map (fun row -> row.Ht_cm)

let col6 =
    test
    |> Seq.map (fun row -> row.Wt_kg)