Amazon CloudSearch忽略更新

时间:2014-09-08 19:18:54

标签: amazon-cloudsearch

我使用CloudSearch根据表达式的值和一些业务逻辑索引需要定期更新的大量小型json数据对象(我有5分钟的cron作业)。

直到上周,一切都在运作。我看到cron作业仍在运行而没有遇到任何错误消息,S3中的对象仍在正确更新,但是当我执行排名属性命令的CloudSearch请求时,我得到过时的搜索数据。不只是几分钟,而是几周。

我尝试重新编制索引,但这并未导致任何更改。 CloudSearch是否有某种更新阈值,阻止您在一天的特定数量的请求后发布更新?我想每5分钟更新一次就会远远低于这个数字。

我还没有在AWS的文档中找到任何关于他们是否进行某种更新限制的指示

1 个答案:

答案 0 :(得分:3)

我最终找到的是在CloudSearch的常见问题中提及:http://aws.amazon.com/cloudsearch/faqs/

  

问:我可以将多少数据上传到我的搜索域?

     

您需要的分区数量取决于您的数据和配置,因此您可以上传的最大数据>是应用搜索配置时产生10>搜索分区的数据集。当您超出搜索分区限制时,您的域名将停止>接受上传,直到您删除文档并重新索引您的域名为止。如果您需要超过> 10个搜索分区,请与我们联系。

我从CloudSearch中删除了大量不再使用的数据,并发现我的更新再次正常运行。我无意中遇到了CloudSearch索引中的数据限制。在我提交批量更新时,CloudSearch仍然取得了成功,但它默默地忽略了更新操作。