计算特征矩阵时提高性能?

时间:2018-03-11 01:00:38

标签: data-science featuretools

{{1}}是否使用任何库(如numba)来提高性能?

1 个答案:

答案 0 :(得分:3)

我是Featuretools的维护者之一。 calculate_feature_matrix目前仅使用Pandas / Numpy / Scipy中的函数来提高原始Python的性能。有几个区域使用numba或Cython可能会有所帮助,特别是在PandasBackend类和单个特征计算函数中。

但是,这样做需要C编译器或编译的C代码,因此增加了安装的额外复杂性。由于这种复杂性,目前我们的优先级列表并不高,但我们可能会考虑在将来添加它。

相反,我们更关注大型数据集的可扩展性,这涉及并行化而不是子程序优化。