featuretools last_time_index未设置

时间:2018-04-18 12:35:40

标签: featuretools

我已经构建了一个实体集,并且该实体集中的一个表称为“检查”。我已为此表设置了time_index列,但在运行dfs时,我收到警告“使用training_window但未在实体检查中设置last_time_index”。文档显示应将其设置为一系列:last_time_index(pd.Series) - 所有子实体中每个实例的最后一个事件的时间索引。

有人可以提供一个示例,说明我应该如何设置last_time_index以及将其设置为什么值?

注意,计算仍然正确,但我担心警告信息。

1 个答案:

答案 0 :(得分:3)

您可以通过调用last_time_index自动将your_entityset.add_last_time_indexes()添加到所有实体。配置完整个实体集后,将其作为最后一步运行。

last_time_index仅在使用培训窗口计算要素时使用,因此我们不会花时间默认创建它。如果您运行该命令,警告将消失。

使用了last_time_index,因此我们可以排除在训练数据窗口的 start 之前具有最后数据的行。这与time_index不同,后者确保行已知或在训练数据窗口的 end 之前有第一个数据。