无法绘制共同基金的数据框架

时间:2017-09-24 21:30:10

标签: python pandas plot cluster-analysis

首先,这是我的数据框:

[HttpPost]
[Route("api/{ClassID}/AddUsers")]
public IHttpActionResult AddUsers([FromUri] int ClassID, [FromBody] Models.UserInfo userInfo)
{
    Foo result = new Foo();
    result = doSometStuff(userInfo);

    return ???(HelperPages.FooHelper.Get(result));
}

这有点难以阅读,但基本上这些只是几个共同基金(638)的收盘价,其中最后一栏是Date 2012-09-04 00:00:00 2012-09-05 00:00:00 2012-09-06 00:00:00 2012-09-07 00:00:00 2012-09-10 00:00:00 2012-09-11 00:00:00 2012-09-12 00:00:00 2012-09-13 00:00:00 2012-09-14 00:00:00 2012-09-17 00:00:00 ... 2017-08-22 00:00:00 2017-08-23 00:00:00 2017-08-24 00:00:00 2017-08-25 00:00:00 2017-08-28 00:00:00 2017-08-29 00:00:00 2017-08-30 00:00:00 2017-08-31 00:00:00 2017-09-01 00:00:00 Type AABTX 9.73 9.73 9.83 9.86 9.83 9.86 9.86 9.96 9.98 9.96 ... 11.44 11.45 11.44 11.46 11.46 11.47 11.47 11.51 11.52 Hybrid AACTX 9.66 9.65 9.77 9.81 9.78 9.81 9.82 9.92 9.95 9.93 ... 12.32 12.32 12.31 12.33 12.34 12.34 12.35 12.40 12.41 Hybrid AADTX 9.71 9.70 9.85 9.90 9.86 9.89 9.91 10.02 10.07 10.05 ... 13.05 13.04 13.03 13.05 13.06 13.06 13.08 13.14 13.15 Hybrid AAETX 9.92 9.91 10.07 10.13 10.08 10.12 10.14 10.26 10.32 10.29 ... 13.84 13.84 13.82 13.85 13.86 13.86 13.89 13.96 13.98 Hybrid AAFTX 9.85 9.84 10.01 10.06 10.01 10.05 10.07 10.20 10.26 10.23 ... 14.09 14.08 14.07 14.09 14.11 14.11 14.15 14.24 14.26 Hybrid 标签。我想在一个绘图上绘制所有这些,并有一个图例标记每个绘图的类型。

我想看看我可能需要多少潜在的群集。这是我的第一个虽然可视化数据,但如果您有任何其他建议,请随时提出建议。

另外,在我的第一次尝试中,我尝试过:

Type

它只是显示为黑色斑点,经过一些研究后我发现它并没有很好地处理大量功能。

2 个答案:

答案 0 :(得分:2)

我的建议是转置数据框,因为时间戳更自然地作为索引,您将能够将单个时间序列称为df.AABTXdf['AABTX']

使用较少的时间序列你可以尝试df.plot(),但是当它在相当大的时候你不应该被惊吓最初看到一些混乱。

尝试绘制数据的子集,但请确保时间在索引中,而不是列名称。

答案 1 :(得分:1)

您可能正在寻找像scikit-learn机器学习库中实现的silhouette analysis之类的东西。它应该允许找到要为您的数据考虑的最佳数量的簇。