python - 缓存结果的管道

缓存结果的管道

时间：2019-10-20 03:20:17

标签： python python-3.x pandas scikit-learn feature-extraction

我使用熊猫进行机器学习的特征提取。我希望实现以下目标：考虑到我有五个顺序执行的数据处理步骤，并且执行一次，结果将自动保存。下次，如果我执行第四步，该库将自动从第三步开始。在Pandas或sklearn.pipeline.Pipeline或其他数据处理库中自然支持这种缓存功能，而无需我们显式保存它们吗？

1 个答案:

答案 0 :(得分：0)

MLFlow Tracking具有Dagster似乎缺少的一些不错的功能（当前git commit，ML指标等的记录）。它们还与Databricks很好地集成，可以轻松地进行集群部署。但是，他们确实缺乏构建复杂的管道的方法，而Dagster擅长于此。

有没有办法获得“世界上最好的”？也就是说，将Dagster与MLFlow集成在一起，然后使其在Databricks上运行？

还是有很好的选择？

Roles.GetRolesForUser（）结果被缓存
LINQPad中的非缓存结果
backbone.js获取缓存的结果
是否缓存了is_dir的结果？
Linq查询中的缓存结果
PFQuery从未缓存过结果
Hiberanate禁用缓存结果
ElasticSearch查询结果是否已缓存？
BigQuery不使用缓存的结果
缓存结果的管道

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？