我正在尝试比较python在一个周末和一个工作日的平均销售额。
假设我有一个数据集
Order Date Units Sold day_week
2017-07-01 100 Sat
2017-07-02 100 Sun
2017-07-03 90 Mon
2017-07-04 90 Tue
2017-07-05 90 Wed
2017-07-06 90 Thu
2017-07-07 90 Fri
2017-07-08 80 Sat
2017-07-09 80 Sun
2017-07-10 100 Mon
2017-07-11 100 Tue
2017-07-12 100 Wed
2017-07-13 100 Thu
2017-07-14 100 Fri
我想将(坐和日休的周末的平均销售额)与(工作日的平均销售额)进行比较,但分别比较(第1和第2个销售额分别为3、4、5、6、7销售额)和(8,9与10,11,12,13,14)
因此,在第1周,周末的平均销售额(100)会比平日的平均销售额(90)大,而在第2周,周末的平均销售额(80)将小于平日的平均销售额(100)
答案 0 :(得分:0)
好的,这里假设您的数据采用DataFrame
格式,但是日期/时间很简单str
(即不是datetime
):
import pandas as pd
# setting up part of your dataset
df = pd.DataFrame.from_dict({
'date':['2017-07-01','2017-07-02','2017-07-03','2017-07-04'],
'units_sold': [100,100,90,90],
'day_week': ['Sat','Sun','Mon','Tue']}
)
# defining a new column to help us, grouping by it and then summing:
df['is_weekend']=df['day_week'].apply(lambda x: x in {'Sat','Sun'})
df.groupby('is_weekend').mean()
此外,在将来,编写生成数据集(或数据集的一小部分)的代码也是一种好习惯,否则读者必须自己做。