我正在使用图书馆TextBlob来分析法律文本。我真的很喜欢TextBlob,但我正在努力解决一些功能。当我创建一个TextBlob
对象时,它会自动缩小我的整个文本。
from textblob import TextBlob
text_blob = TextBlob(input_text)
这对我来说很不方便,因为我想使用实体识别方法在法律文本中查找条目,其中许多都是大写的(例如LEI,ISO,成员国等......)。我想把它们留下来,大写。任何其他方式实体识别器将找不到所有可能的实体(或者我必须小写所有内容,这不是我的计划)。
有没有办法不使用TextBlob小写整个文本,比如传递一个参数:
from textblob import TextBlob
text_blob = TextBlob(input_text, lower=False)
我尝试过几件事,但没有取得好成绩。我也没有在TextBlob的文档中找到答案。也许这是一项非常简单的任务。