我想使用大多数开箱即用的分类器,而不是TextBlob提供的,但我还想添加自己的一小组训练数据。这是因为我正在分析的文本中有一些我想确保将其纳入训练集的利基词。
因此,在TextBlob中,他们说你可以像这样扩充现有的分类器
>>> new_data = [('She is my best friend.', 'pos'),
("I'm happy to have a new friend.", 'pos'),
("Stay thirsty, my friend.", 'pos'),
("He ain't from around here.", 'neg')]
>>> cl.update(new_data)
True
>>> cl.accuracy(test)
1.0
但是,它没有说明将此数据添加到默认分类器。有谁知道这是否可行?
修改
或者,是否有可以获得足够训练数据的地方,以便我可以反过来训练我的分类器?