我目前正在使用自己的数据来研究feature tools docs。到目前为止,一切工作正常,但我一直坚持添加有趣的变量。由于某些原因,我无法使其正常运行,并且不确定为什么。文档中的示例可以正常工作。
创建实体集后,我试图获取特定产品Classic Cars
的功能:
## Add interesting values
es["products"]["PRODUCTLINE"].interesting_values=["Classic Cars"]
## Get features
feature_defs = ft.dfs(entityset=es,
target_entity="customers",
agg_primitives=["count"],
where_primitives=["count"],
trans_primitives=[],
features_only=True))
## Show features
feature_defs
OUT[1]: [<Feature: COUNTRY>, <Feature: CUSTOMERNAME>, <Feature: COUNT(transactions)>]
我期望的是一个功能,它可以计算包括Classic Cars在内的交易数量。不幸的是,它没有做到这一点。它也不适用于我尝试过的任何其他变量或值。
正如您在这里看到的那样,作业确实起作用。
es["products"]["PRODUCTLINE"].interesting_values
OUT[2]: ['Classic Cars']
Classic Cars是变量PRODUCTLINE的有效值:
es["products"].variables
OUT[3]: [<Variable: PRODUCTCODE (dtype = index)>,
<Variable: PRODUCTLINE_ID (dtype = numeric)>,
<Variable: PRODUCTLINE (dtype = categorical)>,
<Variable: MSRP (dtype = numeric)>]
es["products"].df.PRODUCTLINE.head(2)
OUT[4]: S10_1678 Motorcycles
S10_1949 Classic Cars
Name: PRODUCTLINE, dtype: object
不确定我做错了什么,我们将不胜感激!
如果要重现,则为数据和代码:https://drive.google.com/open?id=1NOeudbCkeZ66nSOZrhhBdd1jcAa1LDco