读取由StatisticsGen生成的数据集统计信息

时间:2019-04-02 23:14:48

标签: tensorflow-data-validation

我查看了TFX指南(https://www.tensorflow.org/tfx/guide),并且能够运行管道。 StatisticsGen组件将数据集统计信息写入磁盘上的文件。如何可视化存储在文件中的统计信息?

谢谢

1 个答案:

答案 0 :(得分:0)

StatisticsGen组件将统计协议缓冲区写入TFRecord文件中。您可以按以下方式在Jupyter笔记本中可视化统计信息:

import tensorflow_data_validation as tfdv
STATS_OUTPUT_PATH = ''
stats = tfdv.load_statistics(STATS_OUTPUT_PATH)
tfdv.visualize_statistics(stats)