我正在处理一个案例,我想创建自己的词干算法。我知道有一些优秀的库,但这不适用于这个用例。
本质上我想导入一个字典,这样我就可以循环翻译一个句子中的单词,如果列表中有单词,则将其缩小为基本形式。
所以万一,fe减少'银行家'到银行。我已经制作了这个,但这不可扩展。
list_bank = ('banking', 'banker' )
sentence = ("There's a banker")
banker_tags = []
for word in sentence.split():
print(word)
所以万一,fe减少'银行家'到银行 如果list_bank中的单词: #replace word
有关如何使其正常工作的任何建议吗?
答案 0 :(得分:2)
将单词及其词干放在dictionary中,然后用它来查找词干形式:
dictionary = { 'banker' : 'bank', 'banking': 'bank' } # Add the rest of your words and stems
sentence = "There's a banker"
for word in sentence.split():
if word in dictionary:
word = dictionary[word]
print(word)
There's a bank