如何为简单的mapreduce作业指定BlobstoreOutputWriter的文件名?

时间:2011-10-10 09:38:31

标签: python google-app-engine mapreduce

我如何或在何处为GAE mapreduce作业指定output_writer文件名和内容类型?下面的配置对我来说很好,但是每次运行作业时它都会创建一个带有新文件名的新blobstore条目。我希望能够指定每次运行mapreduce作业时要覆盖/替换的文件名和内容类型。

我的处理程序正在为csv文件写出文本行。

mapreduce:
- name: Export a model
  mapper:
    input_reader: mapreduce.input_readers.DatastoreInputReader
    output_writer: mapreduce.output_writers.BlobstoreOutputWriter
    handler: export_model
    params:
    - name: entity_kind
      default: models.MyModel 

1 个答案:

答案 0 :(得分:1)

output_writer的东西仍然是实验性的。还没有规定输出文件名的规定。您可以按照demo app中的示例进行操作并使用间接:将输出博客的BlobKey附加到您选择的包含所需名称的实体。

寻找

yield StoreOutput("WordCount", filekey, output)
main.py

中的