我如何或在何处为GAE mapreduce作业指定output_writer文件名和内容类型?下面的配置对我来说很好,但是每次运行作业时它都会创建一个带有新文件名的新blobstore条目。我希望能够指定每次运行mapreduce作业时要覆盖/替换的文件名和内容类型。
我的处理程序正在为csv文件写出文本行。
mapreduce:
- name: Export a model
mapper:
input_reader: mapreduce.input_readers.DatastoreInputReader
output_writer: mapreduce.output_writers.BlobstoreOutputWriter
handler: export_model
params:
- name: entity_kind
default: models.MyModel
答案 0 :(得分:1)
output_writer的东西仍然是实验性的。还没有规定输出文件名的规定。您可以按照demo app中的示例进行操作并使用间接:将输出博客的BlobKey附加到您选择的包含所需名称的实体。
寻找
yield StoreOutput("WordCount", filekey, output)
main.py
中的