在没有熊猫的情况下清理CSV中的数据

时间:2019-12-17 06:35:08

标签: python numpy

我正在尝试绘制带有以下数据(csv格式)的折线图。

  1. 我想替换整个季度并将其合并为一年 例如:1990-Q1、1990-Q2、1990-Q3、1990-Q4到1990年。

  2. 基于年份,我想合并指标,例如一年中所有4个指数。

  3. 我想仅将年份过滤为2007年至2017年。由于数据集具有1990年至2019年的年/季度。

不使用熊猫怎么办?

我已经在我的部分代码中添加了内容,但似乎我可能走错了方向。有人可以引导我吗?

1 个答案:

答案 0 :(得分:1)

您对data感到满意吗?像这样的结构化数组应该几乎与pandas DataFrame一样有用。它具有相同的信息。

看起来genfromtxt,看起来这些季度是连续的,没有间隔。如果是这样。

.png

应给出一个(n,4)数组,每行一年。

data1 = data.reshape(-1,4)

应该是每年的索引值之和。 (或者您可能需要data1['index'].sum(axis=1) )。

您可以使用meandata1中选择年份范围,通过计算/计算甚至分析年份字符串来选择范围。

您可以坚持在“年”和“季度”上分割data1[n:m],依此类推,但是我认为重新设计可以节省很多工作。