有没有一种方法可以使用MLflow记录数据集的描述性统计信息?

时间:2019-04-24 04:52:10

标签: python mlflow

是否有一种方法可以使用MLflow记录数据集的描述性统计信息?如果可以,请您分享详细信息?

1 个答案:

答案 0 :(得分:1)

通常来说,您可以使用mlflow_log_artifact()函数记录代码中的任意输出。来自the docs

  

mlflow.log_artifact(local_path,artifact_path =无)   将本地文件或目录记录为当前活动运行的工件。

     

参数:
   local_path –要写入的文件的路径。    artifact_path –如果提供的话,artifact_uri中要写入的目录。

例如,假设您将统计信息存储在熊猫数据框stat_df中。

## Write csv from stats dataframe
stat_df.to_csv('dataset_statistics.csv')

## Log CSV to MLflow
mlflow_log_artifact('dataset_statistics.csv')

这将显示在“跟踪UI”中运行的此MLflow的“工件”部分下。如果进一步浏览文档,您会发现还可以记录整个目录及其中的对象。通常,MLflow为您提供了很大的灵活性-可以使用MLflow跟踪的任何写入文件系统的内容。当然,这并不意味着您应该这样做。 :)