创建一个词干分析器以将单词缩减为基本形式

时间:2017-01-28 13:53:21

标签: python text-mining

我正在处理一个案例,我想创建自己的词干算法。我知道有一些优秀的库,但这不适用于这个用例。

本质上我想导入一个字典,这样我就可以循环翻译一个句子中的单词,如果列表中有单词,则将其缩小为基本形式。

所以万一,fe减少'银行家'到银行。我已经制作了这个,但这不可扩展。

list_bank = ('banking', 'banker' )
sentence = ("There's a banker")
banker_tags = []

for word in sentence.split():
 print(word)

所以万一,fe减少'银行家'到银行      如果list_bank中的单词:         #replace word

有关如何使其正常工作的任何建议吗?

1 个答案:

答案 0 :(得分:2)

将单词及其词干放在dictionary中,然后用它来查找词干形式:

dictionary = { 'banker' : 'bank', 'banking': 'bank' } # Add the rest of your words and stems
sentence = "There's a banker"
for word in sentence.split():
    if word in dictionary:
        word = dictionary[word]
    print(word)
There's
a
bank