Google Colab中的apache-beam [gcp]问题

时间:2020-06-22 19:35:30

标签: google-colaboratory apache-beam apache-beam-pipeline

我在Google colab上运行apache-beam [gcp]时遇到问题。

如果我运行以下单元格

!pip install -q apache-beam[gcp]

import apache_beam as beam

with beam.Pipeline() as p:
  p | beam.Create([1, 2, 3]) | beam.Map(print)

我有错误:

FileNotFoundError: [Errno 2] No such file or directory: '/usr/local/lib/python3.6/dist-packages/cachetools-4.1.0.dist-info/METADATA'

第二次运行:

AttributeError: module 'apache_beam' has no attribute 'pipeline'

几周前,我在合作实验室中与Beam一起工作,以下流程工作正常。我尝试将其重置为2.21.0和2.20.0-祝您好运。

谢谢!

UPD。使用%%writefile魔术,它似乎可以正常工作。看起来问题出在colab导入

1 个答案:

答案 0 :(得分:1)

尝试升级cachetools:

!pip install cachetools --upgrade

它会提示您重新启动实例,所以继续并重新启动它。

重试该操作。