我有一个表,其中的数据列包括ID,域,目标和日期(如下表所示)。我目前正在对此进行分析,无法找到哪些ID一直未能达到目标。
我找到了所有日期列的平均值,并基本上将其与目标值进行了手动比较。我不太确定这样做是否正确。
# importing pandas as pd
import pandas as pd
# Create sample dataframe
raw_data = {'ID': ['A1', 'B1', 'C1', 'D1'],
'Domain': ['Finance', 'IT', 'IT', 'Finance'],
'Target': [1, 2, 3, >1],
"1/01":[0.9, 1.1, 2.1, 1],
"1/02":[0.4, 0.3, 0.5, 0.9],
"1/03":[1, 1, 0.5, 1.1],
"1/04":[0.7, 0.7, 0.1, 1],
"1/05":[0.7, 0.7, 0.1, 1],
"1/06":[0.9, 1.1, 2.1, 1]}
df = pd.DataFrame(raw_data, columns = ['ID', 'Domain', 'Target', '1/01',
'1/02','1/03', '1/04','1/05', '1/06'])
# Create avg of 1/01 to 1/06 columns
df["avg"]=df.iloc[:,3:9].mean(axis=1)
# Select required columns/rows
print (df[(df.Domain == 'Finance')].loc[:,
['ID','Domain','Target','avg']])
我必须回答的主要问题是
1)哪个ID一直失败?
2)我一直在开会,很舒服地击败了目标?