使用API​​和Python查找所有可能的字母组合

时间:2011-03-22 22:51:14

标签: javascript python html api scripting

我正在尝试整理一个小型网络应用,用户输入其电话号码的最后4位数字,点击提交,然后显示可以在键盘上使用他们的所有单词(如果有的话) 4个数字。因此,如果用户输入“ 2287 ”,则会显示“行为”“蝙蝠”“”和任何其他可以通过“ a / b / c ”和“ a / < strong> b / c “和” t / u / v “和” p / q / r / s “。

我是网络应用和网络脚本的新手,但我已经想出了如何完成大部分相关步骤。我遇到的问题是:

  1. 创建所有可能的字母组合

  2. 确定哪些组合实际上是单词

  3. 我认为你可以使用API​​做一些,但我不知道在哪里寻找类似的东西。如果我使用某种排序字典API,我可以一次输入所有可能的组合,或者我是否必须(大致)进行81次不同的API调用来检查每种组合是否是真正的单词。

    当涉及到这样的东西时,我显然是一个非常大的菜鸟,但我试图从这样简单的事情开始尝试让自己熟悉服务器端的网页脚本。另外,如果可能的话,如果我用Python完成所有内容都会很棒,因为这是我们在我的互联网应用程序类中使用的语言,并且最初只使用一种语言是有意义的。无论如何,提前谢谢。

2 个答案:

答案 0 :(得分:3)

阅读字典,只保留4个字母的单词,用四个字母的数字代码将它们附加到defaultdict(列表),当用户输入的数字为他们提供该数字的就绪列表或说“没有该单词的单词”时

import itertools
letters = ('',' ', 'abc','def','ghi','jkl','mno','pqrs','tuv','wxyz')
reverse_dict = dict((str(ind), group)
                    for ind,group in enumerate(letters)
                    for c in group
                    if letters)

print reverse_dict
end_nums = '3965'
print end_nums, 'can produce', tuple(''.join(w) for w in itertools.product(*map(reverse_dict.get, end_nums)))
word = 'word'
print('%r = %s' % (word,''.join(key for c in word for key, item in reverse_dict.items() if c in item)))

答案 1 :(得分:2)

一种天真的方法是

import itertools

letters = ('','','abc','def','ghi','jkl','mno','pqrs','tuv','wxyz')
good_words = set(['wall','base','cats'])  # etc

def allWords(s):
    s = [int(ch) for ch in s.zfill(4)]
    for word in itertools.product(letters[s[0]], letters[s[1]], letters[s[2]], letters[s[3]]):
        word = ''.join(word)
        if word in good_words:
            yield word

words = list(allWords('2297'))

一个更有效的方法是将所有好词预处理成每个电话号码列表的字典,然后进行查找:

import string
import collections

class CodingError(Exception):
    pass

class TelephoneWords(object):
    numbers = {
        'a': '2', 'b': '2', 'c': '2', 'd': '3',
        'e': '3', 'f': '3', 'g': '4', 'h': '4',
        'i': '4', 'j': '5', 'k': '5', 'l': '5',
        'm': '6', 'n': '6', 'o': '6', 'p': '7',
        'q': '7', 'r': '7', 's': '7', 't': '8',
        'u': '8', 'v': '8', 'w': '9', 'x': '9',
        'y': '9', 'z': '9', '0': '0', '1': '1',
        '2': '2', '3': '3', '4': '4', '5': '5',
        '6': '6', '7': '7', '8': '8', '9': '9'
    }
    wordlen = 4

    def __init__(self, wordlist=None, fname=None):
        super(TelephoneWords,self).__init__()
        self.words = collections.defaultdict(list)
        if wordlist:
            self.addwords(wordlist)
        if fname:
            with open(fname) as inf:
                filestr = ' '.join(inf.readlines()).replace(string.punctuation, ' ')
                self.addwords(filestr.split())

    def addwords(self, words):
        _wordlen = TelephoneWords.wordlen
        _words   = self.words
        _encode  = self.encode
        for word in words:
            if len(word)==_wordlen:
                word = word.lower()
                try:
                    _words[_encode(word)].append(word)
                except CodingError:
                    pass

    def addword(self, word):
        self.addwords((word,))

    def encode(self, s):
        _numbers = TelephoneWords.numbers
        res = []
        for ch in s:
            try:
                res.append(_numbers[ch])
            except KeyError:
                # no corresponding value found
                raise CodingError("No value available for char '{0}'".format(ch))
        return ''.join(res)

    def seek(self, num):
        s = str(num).strip().zfill(TelephoneWords.wordlen)
        try:
            return self.words[s]
        except KeyError:
            raise ValueError("No words found for '{0}'".format(s))

    def find(self, num, onErr=None):
        try:
            return self.seek(num)
        except ValueError:
            return [] if onErr is None else onErr

def main():
    tw = TelephoneWords(fname='four_letter_words.txt')

    for word in tw.find('2287'):
        print word

if __name__=="__main__":
    main()

使用Scrabble词表,这给了我

acts
bats
baur
cats
caup