如何存储数据框引用列表供以后使用?

时间:2018-10-30 20:04:47

标签: scala apache-spark

我试图持久保存Spark数据框对象引用的集合,以便以后可以迭代该集合。具体来说,我正在尝试动态地取消缓存我保留在代码中的数据帧。

这是我到目前为止所拥有的:

var transform = await _client.Transforms.GetAsync(ResourceGroup, AccountName, TranscribeTransformName);

if (transform == null)
{
    var output = new[]
    {
        new TransformOutput
        {
            Preset = new BuiltInMediaIndexerPreset
            {
                PresetName = "Azure Media Indexer 2 Preview"
            }
        }
    };

但是,当我对已传递给AddToCache()函数的数据帧执行任何类型的操作时,“我正在使任务无法序列化”异常

那是为什么?

1 个答案:

答案 0 :(得分:0)

请在下面尝试并查看。

|