我正计算df
中每个序列的频率:
VD_1 VD_2 VD_2
35000 35090 31550
35000 35090 31550
35099 45097
35099 45097
35099 45097
如果我运行下面给出的代码,我会收到错误TypeError: ('sequence item 0: expected string, numpy.int64 found', u'occurred at index 1')
。事实上,代码在其他数据集上运行良好,但在这里它失败了:
df['data'] = df.apply(lambda x: '/'.join(x.dropna()), axis=1)
df = df.data.value_counts().rename_axis('count').reset_index()
df
结果应该是这个:
data count
35000/35090/31550 2
35099/45097 1
答案 0 :(得分:2)
您似乎需要为astype(str)
向int
添加string
:
df['data'] = df.apply(lambda x: '/'.join(x.dropna().astype(str)), axis=1)