模式匹配在Google AppEngine上搜索不同的文档类型

时间:2013-03-15 00:08:50

标签: regex google-app-engine full-text-search

我有一个问题,如果你能回答我,我将不胜感激。

我需要实现模式匹配搜索不同类型的文档(包括Google Docs,PDF,DOC等)。从我在这方面的研究来看,似乎这种模式匹配在GAE上并不是直截了当的。

我是否可以请您指导我如何在GAE上实现模式匹配? 您是否建议为GAE上的模式匹配搜索自定义任何开源搜索引擎或原生Google搜索API?

如果你能回答我,我将不胜感激。 非常感谢。

此致 Sargol

1 个答案:

答案 0 :(得分:1)

AFAIK AppEngine旨在在将数据写入数据库之前而不是在读取数据库之前/之后非常喜欢数据处理。虽然这通常会导致更多存储数据,但它通常可以显着提高应用程序性能。

应用于您的情况,我会说您应该尝试在将文档写入数据存储区时为文档构建和存储某种索引。然后使用此索引进行模式匹配。

由于您的问题不清楚您所谈论的模式匹配的确切类型,因此很难提供更具体的建议。但是,例如,如果您只是在谈论关键字搜索,那么对于每个文档,您可以在数据存储区中拥有第二个实体,该实体存储文档的数据存储区键并包含具有多个值(App Engine datastore: How to set multiple values on properties?)列表的属性文档中存在的所有关键字。然后,您可以对这些“索引对象”执行简单的等于查询,以查找与搜索条件匹配的所有文档。