我正在开发一个Python网络应用程序,需要定期从第三方网站导入大量(根据GAE限制)gzip文件。想想rdf导出DMOZ项目定期生成。
这意味着每天获取一个500多MB的gzip文件,进行解压缩,解析,处理并将结果存储在GAE的数据存储区中供以后使用。
考虑到最大下载,处理时间等限制,在GAE上实现此功能的正确方法是什么?
答案 0 :(得分:1)
App Engine中下载文件大小的限制目前为64MB。因此,您有两个选择:
答案 1 :(得分:0)
我最初的直觉反应(不知道gzip文件中的内容)是在其他地方进行处理(AWS?),然后将处理后的数据推送到GAE应用程序中。