Question

是否有一种方法可以使用MLflow记录数据集的描述性统计信息？如果可以，请您分享详细信息？

Answer 1

通常来说，您可以使用mlflow_log_artifact（）函数记录代码中的任意输出。来自the docs：

mlflow.log_artifact（local_path，artifact_path =无）   将本地文件或目录记录为当前活动运行的工件。

参数：
   local_path –要写入的文件的路径。    artifact_path –如果提供的话，artifact_uri中要写入的目录。

例如，假设您将统计信息存储在熊猫数据框stat_df中。

## Write csv from stats dataframe
stat_df.to_csv('dataset_statistics.csv')

## Log CSV to MLflow
mlflow_log_artifact('dataset_statistics.csv')

这将显示在“跟踪UI”中运行的此MLflow的“工件”部分下。如果进一步浏览文档，您会发现还可以记录整个目录及其中的对象。通常，MLflow为您提供了很大的灵活性-可以使用MLflow跟踪的任何写入文件系统的内容。当然，这并不意味着您应该这样做。：）

有没有一种方法可以使用MLflow记录数据集的描述性统计信息？

1 个答案: