我希望生成一个混凝土名词列表....与图片和相关的句子

时间:2012-11-11 15:54:03

标签: c# java android python dictionary

我希望生成programmaticaly一个具体名词列表,一个相关的图片,如果可能的话,还有一个描述专有名词的句子。

我尝试了各种字典API - 但问题的第一部分 - 获取具体名词列表给我带来了困难。任何人都可以想到实现这个目标的好方法我会非常有兴趣听到它!

请注意我知道干扰图是什么 - 存储这些数据不是我的问题 - 更多的数据来源是我需要帮助的 - 我在哪里得到一个我可以逐步迭代的具体名词列表。

干杯

2 个答案:

答案 0 :(得分:2)

NLTK有一个词性标注器。您可以在一段文本上运行它并将它标识的所有名词存储为您的列表。

如果你想要一份所有名词的列表,你可能需要进行长时间的搜索 - 你必须浏览英语中的每本字典,百科全书,地图集和婴儿名字。一个更合理的起点是各种2336 nouns列表。他们认为它缺少了大约50,000个左右的完整列表 - 我的赌注是低估了。

答案 1 :(得分:-1)

如果你想用Java做 您可以使用HashMap存储数据;其中key可以是专有名词,也可以是具有其他细节的对象

    HashMap<String, ProperNounObj> obj = new HashMap<String, ProperNounObj>();
    where ProperNounObj class has attributes like picutureUrl and description

专有名词列表可以通过hashmap方法生成obj.keySet();这将返回一组所有专有名词。