我正在尝试搜索大量的医疗报告。我想确定用于说没有发现的语言类型。例如“没有blabla”或“在这里看不到blabla和bleble”。有很多变化。
我最初的想法是将文本划分为三元组,然后对三元组进行情感分析,然后查看负三元组并手动选择表示缺少某些内容的三元组。然后我想围绕这些缺席三元组设计一些正则表达式。
然而,我感觉到我并不是真的在寻找情感分析,而是更多的否定搜索。我可以,我想只是寻找所有带有'not'或'none'或'nor or'no'的句子,但我确信我会陷入某种语言陷阱。有没有人对我的情绪方法发表评论,如果这是正确的,我可以得到一些关于三元组(或者我认为是双字母组合)的情绪分析的指导,因为我发现的所有教程都展示了单字组情绪分析