我对可能有或没有某些疾病的患者有一套医生的意见。
我们说医生对患者A的看法是:
患者未出现ms征兆
或
未发现局灶性或癫痫样特征
对于患者B是
患者出现ms征兆
或
复杂的部分性癫痫发作
我想将A归类为病,而不是B。
是否可以使用NLTK
lib?
我尝试使用以下代码提取句子的标签,但不知道从这里开始!
text = 'No focal or epileptiform features were noted'
tokens = nltk.word_tokenize(text)
tagged = nltk.pos_tag(tokens)
print(tagged)
[('No', 'DT'), ('focal', 'JJ'), ('or', 'CC'), ('epileptiform', 'JJ'), ('features', 'NNS'), ('were', 'VBD'), ('noted', 'VBN')]
答案 0 :(得分:0)
希望您熟悉ML。使用与垃圾邮件检测相同的技术,并创建一组限制词。然后将其应用于您的文本文件,并为每个文件建议一个标签,即pos或neg。您可以看看以下内容:https://towardsdatascience.com/spam-classifier-in-python-from-scratch-27a98ddd8e73
答案 1 :(得分:0)
与nag suggests一样,您可以基于表示否定的关键字和短语来创建基于规则的系统,也可以尝试训练监督统计模型来预测类别(对于给定疾病为阳性或阴性)
我也鼓励您在使用结果系统时要格外小心,因为错误的预测可能会对医疗领域的人们产生巨大影响。