我正在尝试查看英语词典中的标签列表。我正在使用pyenchant而且我一直在收到错误。它在读取“?”后似乎有错误。我试图通过使用字符串库和以下代码来取出所有标点符号:
for punc in string.punctuation:
title = title.replace(punc,'')
但是有些怎么看起来像这样的字符?正在扔掉字典。
代码段:
if word not in stopwords.words('english'):
print word, "=", d.check(word)
if d.check(word):
tags.append(word.lower())
响应:
Learning = True
Lens = True
Children = True
Pumkincom = False
Pumkin = False
** (process:49042): CRITICAL **: enchant_dict_check: assertion `g_utf8_validate(word, len, NULL)' failed
? =
我正在使用Python 2.7.3和pyenchant-1.6.5-py2.7
编辑:我想通过检查是否len(word)== 1解决了这个问题,但我想知道为什么会这样。答案 0 :(得分:3)
之前我遇到过这个问题,但这是因为文中存在非英文字母 我建议你确保这个单词只包含英文字母