我想为数据绘制直方图,看起来像这样:
id date purchase visit
id1 date1 $10 0
id1 date1 $50 0
id1 date2 $30 1
id2 date1 $10 0
id2 date2 $10 1
id2 date3 $10 2
基本上,每一行一天都是客户的一笔交易。 “访问”列以累积方式跟踪每天的先前访问。每天同一天,同一位客户访问的次数每次增加1。
如何创建直方图来显示每个客户的不同访问次数。一次不重复造访是指客户在两天之内造访该商店。
唯一身份客户总数= 1215 总行数= 1135067
我尝试运行以下命令:
import random
import numpy
from matplotlib import pyplot
bins = df['visit'].unique()
uniq_id = df['id'].unique()
pyplot.hist(df['date'], bins, alpha=0.5, label=df['id'])
pyplot.legend(loc='upper right')
pyplot.show()
从此处绘制多个直方图可以得出直觉:Plot two histograms at the same time with matplotlib