我的程序需要很长时间才能查找文件中所有词汇列表,以便打印可以创建的所有可能单词。 如何通过不使用任何导入更快地读取它?顺便说一句,我是python的新手:( 例如,我有超过4000多个词汇/字母/单词包含在1个文件中 如果您输入任何字母,它将在该文件中找到所有可能的结果。
if the user enter: a c t b
它将显示:(假设4000+中的所有这3个字母/单词都在该文件中,可以创建)
ab
abc
act
这是我的程序
def scramble(r_letters, s_letters):
"""
Output every possible combination of a word.
Each recursive call moves a letter from
r_letters (remaining letters) to
s_letters (scrambled letters)
"""
if len(r_letters) == 0: # Base case: All letters used
words.add(s_letters)
else: # Recursive case: For each call to scramble()
# move a letter from remaining to scrambled
for i in range(len(r_letters)):
# Move letter to scrambled
tmp = r_letters[i]
r_letters = r_letters[:i] + r_letters[i+1:]
s_letters += tmp
scramble(r_letters, s_letters)
# Put letter back in remaining letters
r_letters = r_letters[:i] + tmp + r_letters[i:]
s_letters = s_letters[:-1]
if s_letters:
words.add(s_letters)
答案 0 :(得分:1)
似乎你想要生成所有可以从给定字母创建的排列,然后检查它们是否对应于某些字典中的任何“真实”单词,有点像查找可以在游戏中创建的单词拼字游戏。
通过交换递归调用的参数中的字母,可以使scramble
函数更快(并且更短)。这样,您就不必将它们交换回来:
def scramble(r_letters, s_letters):
if s_letters:
words.add(s_letters)
for i in range(len(r_letters)):
scramble(r_letters[:i] + r_letters[i+1:], s_letters + r_letters[i])
您可以也使用itertools.permutations
,例如像这样,使用给定的字母生成不同字长的所有排列:
def scramble2(letters):
for i in range(1, len(letters) + 1):
for p in itertools.permutations(letters, i):
words.add(''.join(p))
根据IPython的%timeit
,这比你的实施快三倍:
In [3]: %timeit test.scramble("test", "")
10000 loops, best of 3: 50.4 µs per loop
In [4]: %timeit test.scramble2("test")
100000 loops, best of 3: 16.7 µs per loop
但是,您无需生成所有的所有排列!只计算单词中的字母,并将它们与您可用字母的计数进行比较。您可以使用collections.Counter
来创建,或创建自己的类似计数器的字典。
import collections
letters = "abctk"
words = "cat back track tact".split()
letter_counts = collections.Counter(letters)
for word in words:
word_counts = collections.Counter(word)
if all(letter_counts.get(c, 0) >= n for c, n in word_counts.iteritems()):
print word
这将打印"cat"
和"back"
如果你想避免使用图书馆(可以练习,但不要坚持这个习惯)你可以创建自己的计数器,例如像这样:
def count(word):
d = {}
for c in word:
d[c] = d.get(c, 0) + 1
return d