我只是想获取每个产品ID的每列的值计数(请参阅附件中的img)。我正在尝试查看将其放入ID 12和ID 24的产品名称的含义。因此,我已经拆分了产品名称(通过在空间上拆分),然后我希望计算每个ID每列每个单词的出现频率。
data=pd.read_csv(r'C:\Users\products.csv') #already split on space
ids=data.productID.unique().tolist()
cols=['1','2','3']
dflist=[]
for instid in ids:
filtdata=data.loc[data['productID']==instid]
dflist.append(filtdata)
然后我这样做:
[![for idxdf in range(len(dflist)):
for colid in cols:
print("====",dflist\[idxdf\]\['productID'\].unique(),":",dflist\[idxdf\]\[colid\].value_counts())][1]][1]
所以从本质上来说,我正在为每个列的每个ID获取一个值计数。.唯一的事情是,采用这种格式很难,因为我希望在某种表中使用它。有什么建议吗?