从互联网上收获关键词

时间:2011-03-03 00:02:53

标签: java spring neo4j

您能否建议一些可能的来源来收集相关的关键字。一个建议是使用谷歌并输入查询并返回和响应页面并筛选HTML以获得一些相关的关键字。 (虽然它可能会破坏一些EULA)

使用API​​可以做得更好,但我在http://code.google.com/apis/customsearch/v1/overview.html看到的还不够。

您能否推荐一些其他资源以及设计可以使用多个资源的系统的好策略。我正在考虑使用策略模式以及一些集成模式(Spring Integration)来构建可修改的体系结构。

我选择的平台是Spring / Spring ROO。我正在考虑给neo4j一个尝试,因为图形数据库可能是一个很好的候选问题,其中关系更像是图形而不是物理意义上的表格。

2 个答案:

答案 0 :(得分:1)

您正在描述Google Sets

Here是非正式的API。

答案 1 :(得分:1)

您可以使用Google AdWords关键字工具。可以使用AdWords API对其进行查询,而不会违反任何EULA。

http://code.google.com/apis/adwords/

我用它的另一个工具是Big Huge Thesaurus。

http://words.bighugelabs.com/