我正在使用python notebook v2.7,我正在尝试执行以下操作:我创建了这个RDD对象,其中的数据如图所示
现在,我想为每个referrer_category绘制多年来访问者的进化情况。在我想创建绘图之前,我要做的最后一步是使用以下代码行将每列堆叠到一个单独的列表中:
x, y , z = zip(*total_real_yearly_visits_per_referrer_Category.collect())
我使用pyplot(matplotlib)作为绘图包。
更新
我设法找到了几乎完成的方式:
`import pandas as pd
df = pd.DataFrame(tab)
df.columns = {'y' , 'x' , 'z'}
fig , ax = plt.subplots()
labels = []
for key, grp in df.groupby(['y']) :
ax = grp.plot(ax = ax , kind = 'line' , x = 'x' , y = 'z' , c = key)
labels.append(key)
lines, _ = ax.get_legend_handles_labels()
ax.legend(lines, labels, loc = 'best')
plt.show()`
然而,我仍然没有得到任何情节,但有一堆错误:
ValueError:to_rgba:无效的rgba arg" NA" to_rgb:无效的rgb arg " NA"无法将字符串转换为float:na
任何人都知道如何解决这个问题?
如果需要更多内容或数据,请告诉我