我有一个数据集:
a b c
11/01/1999 8 367235
11/01/1999 5 419895
11/01/1999 1 992194
23/03/1999 4 419895
30/04/1999 1 992194
02/06/1999 9 419895
08/08/1999 2 367235
12/08/1999 3 419895
17/08/1999 10 992194
22/10/1999 3 419895
04/12/1999 4 992194
04/03/2000 2 367235
29/09/2000 9 367235
30/09/2000 9 367235
我正在尝试制作一个可视化,显示随时间变化的值集(“b”列)(列“a”):
*请注意,这只是描绘我想要的一般情况 - 它不是我的数据集。
我将数据集更改为数据透视表,其中列出了第一列中的列“c”值,沿着顶行的“a”值以及数据帧中的“b”值。令人高兴的是,我已经能够从数据透视表中提取值的行,并使用它作为matplotlib图的输入(表示我的图表上的y值)。不幸的是,我无法以可接受的格式提取数据透视表的标题,这是一个问题,因为标题代表我的图表上的x值。
以下是有效的代码部分:
from matplotlib import pyplot as plt
import numpy as np
import pandas as pd
from datetime import datetime
df = (pd.read_csv('orcs.csv'))
df_wanted = pd.pivot_table(
df,
index='c',
columns='a',
values='b')
lala = df_wanted.as_matrix()
x=np.array(lala[1,:])
y = (df_wanted.columns.astype(str).tolist())
以下是代码中不起作用的部分。
我尝试了几种替代方法(包括错误信息):
1
plt.plot(x,y)# error: could not convert string to float: '02/06/1999'
2
for i in range(len(y)):
c= (y[i])
print(c) #no error message, but gives me an output I don't know how to capture for the plt.plot input.
3
for i in range(len(y)):
c= (y[i])
f = datetime.strptime(c, '%d/%m/%Y')
v=list(f)
plot.plot(x,v) # error message:'datetime.datetime' object is not iterable
任何帮助表示赞赏
答案 0 :(得分:1)
您必须交换index
和columns
,然后将index
转换为datetime
。然后只需.plot()
。
df_wanted = pd.pivot_table(df, columns='c',
index='a', values='b')
df_wanted.index = pd.to_datetime(df_wanted.index)
df_wanted.plot()
答案 1 :(得分:0)
如果您想使用matplotlib.pyplot
进行绘图,则只能指定数字坐标(即非字符串)。但您可以为这些坐标指定str
个标签
所以你可能想要考虑这种代码:
from matplotlib import pyplot as plt
import datetime
yValues = [10,15,8,7,1]
xLabels = ['a', datetime.datetime.now().strftime("%Y-%M-%d"),
'b', 'c', 'd']
fig = plt.figure()
ax = fig.add_axes([0.1, 0.2, 0.8, 0.7])
ax.plot(yValues)
ax.set_xticks(range(len(yValues)))
ax.set_xticklabels(xLabels, rotation = 'vertical')
fig.show()