在App Engine上使用StringListProperty查找类似的单词列表

时间:2010-07-14 08:34:52

标签: google-app-engine search list google-cloud-datastore

我有一个StringListProperty()中定义的标签列表。

数据库包含大约1百万个条目,每个条目在列表中有大约20个不同的值。

e.g。

a = ['ab','bc','ca','x',....]

b = ['x','m','a',....]

我正在使用Google App Engine,因此我对运行批处理作业有限制...(仅允许30秒)

这是我的问题:

给定一个列表a,我想找到所有列表中包含大多数元素的列表...按照公共元素数量的降序... ...

我怎么能用app引擎做到这一点?

***更新

我正在存储网址标签 - [购物,购物,社交购物......]

基本上,我想通过

查找内容相似的网址

(1)匹配标签 (2)查看每个URL的标签频率,以确定哪些URL是“更多”相关内容

1 个答案:

答案 0 :(得分:0)

我认为在App Engine中没有任何简洁的方法可以做到这一点 - 或者在任何只提供标准一维索引的DBMS中。

也许如果你扩展你想要实现的目标,有人可以建议一个替代方案吗?