从数据集创建交叉表时出错

时间:2018-03-27 10:47:06

标签: python pandas numpy dataframe machine-learning

我想将两个列名称customerid(cid)和州:

聚类
cid = np.array(b.customerID)
state = np.array(b.State)
pd.crosstab(ind, [cid, state], rownames=['cid'], colnames=['state'], dropna = False)

当我尝试在Python中创建交叉表时,它向我显示

  

数组和名称必须具有相同的长度

任何人都可以帮助我。

2 个答案:

答案 0 :(得分:0)

我认为不需要转换为numpy数组,colnames需要2个值:

df = pd.crosstab(df.ind, [df.customerID, df.State], 
                 rownames=['ind'], 
                 colnames=['cid','state'], dropna = False)

答案 1 :(得分:0)

CRT = pd.crosstab(b.State,b.customerID,利润率=真)