我目前正在为一个问题而苦苦挣扎,我不确定如何描述它。
我有两列,其中一列显示两位数字的小时数(例如,上午10点至10.59am为10,下午17点至17.59pm为17。
第二列显示了KIOSK ID所对应的小时。信息亭ID的每次出现都代表客户拜访。
我需要绘制每个信息亭的高峰时间。
我尝试使用pd.crosstabs连接两列,但不幸的是,我不知道如何获取每小时的最大值以及如何将每小时的最大值分配给相应的信息亭。到目前为止,我得到的只是以下内容:
感谢您添加图片的提示。 任何帮助将不胜感激!
答案 0 :(得分:0)
尝试按小时和信息亭分组,
import pandas as pd
df = pd.DataFrame({'hour': [10,10,10,10,12,12,12],
'kiosk': ['A','A','A','B','A','A','C']})
df.groupby(['hour','kiosk']).size().unstack()
kiosk A B C
hour
10 3.0 1.0 NaN
12 2.0 NaN 1.0