完全可解析的字典/词库

时间:2011-05-23 22:50:13

标签: python parsing macos dictionary words

我正处于设计一系列简单文字游戏的早期阶段,希望能帮助我学习新单词。我所拥有的一个关键部分是完全可解析的字典;我希望能够使用正则表达式搜索字典中的给定单词并提取某些其他信息(例如定义,类型(名词/动词......),同义词,反义词,演示正在使用的单词的引号等) 。我目前有Wordbook(mac app),我发现没问题,但还没弄明白我是否可以使用python脚本解析它。我假设我不能,并且想知道是否有人知道一个合理的字典将允许这个。理想情况下,我会完全独立于互联网。

由于

3 个答案:

答案 0 :(得分:7)

nltk wordnet corpus提供了一个“大型词汇英语单词数据库”的程序化界面。您可以根据各种关系导航字图。它符合显示“定义,词性,同义词,反义词,引号”和“从理想情况下可下载的词典”的要求。

另一种选择是下载recent snapshot of Wiktionary data并将其解析为您可以使用的格式,但这可能有点涉及(unless a decent Python Wiktionary parser already exists)。

以下是使用Wordnet打印出一些属性的示例:

import textwrap
from nltk.corpus import wordnet as wn

POS = {
    'v': 'verb', 'a': 'adjective', 's': 'satellite adjective', 
    'n': 'noun', 'r': 'adverb'}

def info(word, pos=None):
    for i, syn in enumerate(wn.synsets(word, pos)):
        syns = [n.replace('_', ' ') for n in syn.lemma_names]
        ants = [a for m in syn.lemmas for a in m.antonyms()]
        ind = ' '*12
        defn= textwrap.wrap(syn.definition, 64)
        print 'sense %d (%s)' % (i + 1, POS[syn.pos])
        print 'definition: ' + ('\n' + ind).join(defn)
        print '  synonyms:', ', '.join(syns)
        if ants:
            print '  antonyms:', ', '.join(a.name for a in ants)
        if syn.examples:
            print '  examples: ' + ('\n' + ind).join(syn.examples)
        print

info('near')

输出:

sense 1 (verb)
definition: move towards
  synonyms: approach, near, come on, go up, draw near, draw close, come near
  examples: We were approaching our destination
            They are drawing near
            The enemy army came nearer and nearer

sense 2 (adjective)
definition: not far distant in time or space or degree or circumstances
  synonyms: near, close, nigh
  antonyms: far
  examples: near neighbors
            in the near future
            they are near equals
...

答案 1 :(得分:4)

Wordnik有一个Python API

答案 2 :(得分:2)

据我所知,dictionary.com提供免费的非商业用途API here。您可以从互联网上提取一些数据。