Textacy - Vectorizer加权错误

时间:2018-03-12 14:42:34

标签: textacy

我最近发现了Textacy,当我浏览API参考指南时,我遇到了Vectorizer的错误。如果我从API引用添加任何选项,我会得到一个TypeError:unexpected关键字参数。除了加权之外,我还为其他选项收到此错误。

我使用pip安装了textacy,我在Ubuntu上使用Python3。任何帮助表示赞赏。谢谢!

vectorizer = textacy.vsm.Vectorizer(weighting='tfidf')

TypeError: __init__() got an unexpected keyword argument 'weighting'

1 个答案:

答案 0 :(得分:2)

遇到同样的问题。 API文档不反映当前的Vectorizer关键字参数。 Vectorizer现在提供不同的关键字参数,以便更好地控制TF * IDF的应用方式。

vectorizer = textacy.Vectorizer(tf_type='linear', apply_idf=True, idf_type='smooth')

tf_type应用标准术语频率(TF),apply_idf=True应用逆文档频率(IDF)。从回购评论中,idf_type='smooth'为每个文档频率添加一个,以避免零分割。

要查看有关这些选项的更多信息,请查看存储库中第182行的注释:https://github.com/chartbeat-labs/textacy/blob/master/textacy/vsm/vectorizers.py