使用featuretools指定有趣的变量不起作用

时间:2018-10-05 21:52:14

标签: python machine-learning feature-engineering featuretools

我目前正在使用自己的数据来研究feature tools docs。到目前为止,一切工作正常,但我一直坚持添加有趣的变量。由于某些原因,我无法使其正常运行,并且不确定为什么。文档中的示例可以正常工作。

创建实体集后,我试图获取特定产品Classic Cars的功能:

## Add interesting values
es["products"]["PRODUCTLINE"].interesting_values=["Classic Cars"]

## Get features
feature_defs = ft.dfs(entityset=es,
                            target_entity="customers",
                            agg_primitives=["count"],
                            where_primitives=["count"],
                            trans_primitives=[],
                            features_only=True))

## Show features
feature_defs


OUT[1]: [<Feature: COUNTRY>, <Feature: CUSTOMERNAME>, <Feature: COUNT(transactions)>]

我期望的是一个功能,它可以计算包括Classic Cars在内的交易数量。不幸的是,它没有做到这一点。它也不适用于我尝试过的任何其他变量或值。

正如您在这里看到的那样,作业确实起作用。

es["products"]["PRODUCTLINE"].interesting_values

OUT[2]: ['Classic Cars']

Classic Cars是变量PRODUCTLINE的有效值:

es["products"].variables

OUT[3]: [<Variable: PRODUCTCODE (dtype = index)>,
 <Variable: PRODUCTLINE_ID (dtype = numeric)>,
 <Variable: PRODUCTLINE (dtype = categorical)>,
 <Variable: MSRP (dtype = numeric)>]

es["products"].df.PRODUCTLINE.head(2)

OUT[4]: S10_1678     Motorcycles
S10_1949    Classic Cars
Name: PRODUCTLINE, dtype: object

不确定我做错了什么,我们将不胜感激!

如果要重现,则为数据和代码:https://drive.google.com/open?id=1NOeudbCkeZ66nSOZrhhBdd1jcAa1LDco

0 个答案:

没有答案