我正在使用python中的mlxtend包中的association_rules。
结果输出为df,而antecedants / consequents列可以用逗号分隔多个结果。
以下是用于生成输出的代码:
rules = association_rules(frequent_items, metric='lift',min_threshold=0.5)
这会产生以下标题:
antecedants
consequents
antecedent support
consequent support
support
confidence
lift
leverage
conviction
因此,使用带有初步数据的列(也包含结果)可以在列中有多个结果,如下所示:
Antecedants
(SKU1, SKU2, SKU3)
(SKU1, SKU2)
(SKU1)
(SKU1, SKU2, SKU3, SKU4)
但是,我想基于逗号分隔并使用更多列扩展现有df
期望的输出:
antecedants antecedants2 antecedants3 antecedants4
SKU1 SKU2 SKU3
SKU1 SKU2
SKU1
SKU1 SKU2 SKU3 SKU4
我尝试过使用这行代码 -
rules['antecedants'].str.split(',', expand=True)
- 但我得到了一堆NaNs。
任何帮助或指导都会受到赞赏 - 这是Python新手。