我如何解释这个特殊功能

时间:2019-02-23 20:39:35

标签: featuretools

让我说我有3个实体:parent1 <-child-> parent2。我使用了dfs()并获得了我无法理解的功能MEAN(child.parent2.MEAN(child.num_feature))。阅读我认为any_entity.MEAN功能为“按实体分组然后应用MEAN”的文档,但是现在这种方法不起作用

1 个答案:

答案 0 :(得分:0)

深度特征合成通过“堆叠”现有特征来创建新特征。要了解此功能,让我们逐步了解它的计算方式。

  1. 计算特征MEAN(child.num_feature)并将其添加到parent2
  2. 将该功能(在parent2上定义)加入child。这将在parent2.MEAN(child.num_feature)上定义一个新功能child。对于{parent1}具有相同值的child行将对此功能具有相同的值。
  3. childparent分组,并取其平均值。这将创建MEAN(child.parent2.MEAN(child.num_feature))

为澄清起见,让我们看一个具体的例子

假设parent1是客户表,child是客户在列transactions的{​​{1}}表中,而amount是表您销售的每个独特产品中的一个。

为客户实体创建的功能parent2可以解释为“此客户购买的产品的平均总销售额是多少”,例如“此客户是否购买了销量很高的产品”。