如何从数据框中的特定字段创建唯一组合?

时间:2019-07-30 16:16:03

标签: python pandas dataframe

我正在尝试从数据框中的四个字段创建项目的所有组合。我正在测试下面的代码,有些问题是因为我不断遇到“内存不足”错误。

import itertools
A = df['ID']
B = df['PRICE']
C = df['YIELD']
D = df['SCORE']
a = [A, B, C, D]

data = list(itertools.product(*a))
idx = ['c{}'.format(i) for i in range(1, len(data)+1)]
df = pd.DataFrame(data, index=idx, columns=list('abc')).T

df

在此示例中,我有10,000行数据。在其他数据框中,将有更多的行。这可能吗,还是生成的对象太大?

0 个答案:

没有答案