我正在为此目的使用spyder IDE。目的是创建跨行业细分市场的固定平均价格为30-50美元的存储桶,每个存储桶仅2个顶级客户,它应该在扩展了系列1,2的同一行业细分下创建一个新存储桶。拆分应该以这种方式实现自动化(例如[Aluminium-1,Aluminium-2],依此类推。如果5个客户的平均销售额为50 $,则下一个客户应属于具有相同行业类别名称的新存储桶,扩展系列的变化。例如Aluminium-1,Aluminium-2等。)
import os
os.getcwd()
os.chdir("E:/TNVB1/regression/files")
import numpy
import matplotlib.pyplot as plot
import pandas
data= pandas.DataFrame.from_csv('abc_segment.csv')
print(data)
str(data)
data['Industry_Segment'].value_counts()
n = data.groupby(['Industry_Segment'])['Sales','Top_Cust_count'].agg('sum')
dn =pandas.DataFrame(n)
print(dn)
我已按销售和没有客户的行业分组。输出是
Sales Top_cust_count
Industry_Segment Customer_Name
ALUMINIUM Customer1 56 0
Customer2 8 0
Customer3 21 0
Customer4 280 1
Customer5 20 0
Customer6 297 1
Customer7 14 0
现在所需的输出是
Sales Top_Cust_count
Aluminium-1 Customer1 12 1
Aluminium-1 Customer2 6 0
Aluminium-1 Customer3 13 0
Aluminium-1 Customer4 8 1
Aluminium-1 Customer5 11 0
Aluminum-2 Customer6 16 1
Aluminium-2 Customer7 34 1
上面是所需拆分的示例
它必须自动拆分为固定条件,然后继续操作直到无法进一步拆分为止。条件是每个存储分区的max_top_cust_count应为2,平均$销售值应为30-50。