我有以下数据(以下代码中的数据集名称为“ data”)和代码。到目前为止,我的代码一次绘制了一个散点图。如果要获取特定公司的特定散点图,则需要手动更改公司名称。我希望能够快速浏览下面的数据集,以便我的预期代码读取公司名称并执行下面现有代码中捕获的操作,并最终为Company1和Company2两家公司分别生成散点图(即子图),而不会一个散点图覆盖或叠加在另一个散点图上。我当时以为我可以使用for循环遍历下面的代码行,但是我错过了一些东西。有人可以提供一些见识吗?
谢谢。
数据集:
Date Company Cum_FootTraffic
1/1/2015 Company1 450
1/3/2015 Company1 464
1/4/2015 Company1 481
1/5/2015 Company1 500
1/8/2015 Company1 508
………………………………………………………………
6/30/2015 Company1 810
4/2/2015 Company2 203
4/3/2015 Company2 208
4/4/2015 Company2 211
4/5/2015 Company2 218
4/8/2015 Company2 223
4/10/2015 Company2 234
…………………………………………………………………
8/10/2015 Company2 498
代码:
data2=data.loc[data['username']=='Company1']
data2['Cum_FootTraffic_lag']=data2['Cum_FootTraffic'].shift(1)
data2['count']=data2['Cum_FootTraffic']-data2['Cum_FootTraffic_lag']
data2=data2.loc[data2['count']>=0]
data2=data2[['username','Date','Cum_FootTraffic','Cum_FootTraffic_lag','count']]
#Plotting data and manipulating plot size
#Scatterplot
dates = matplotlib.dates.date2num(data2['Date'])
matplotlib.pyplot.scatter(dates, data2['count'])
matplotlib.pyplot.show()