我有一个StringListProperty()中定义的标签列表。
数据库包含大约1百万个条目,每个条目在列表中有大约20个不同的值。
e.g。
a = ['ab','bc','ca','x',....]
b = ['x','m','a',....]
我正在使用Google App Engine,因此我对运行批处理作业有限制...(仅允许30秒)
这是我的问题:
给定一个列表a,我想找到所有列表中包含大多数元素的列表...按照公共元素数量的降序... ...
我怎么能用app引擎做到这一点?
***更新
我正在存储网址标签 - [购物,购物,社交购物......]
基本上,我想通过
查找内容相似的网址(1)匹配标签 (2)查看每个URL的标签频率,以确定哪些URL是“更多”相关内容
答案 0 :(得分:0)
我认为在App Engine中没有任何简洁的方法可以做到这一点 - 或者在任何只提供标准一维索引的DBMS中。
也许如果你扩展你想要实现的目标,有人可以建议一个替代方案吗?