标签: python nlp modeling data-manipulation
我有一套医疗记录,我需要对症状进行分类。症状的写法不同,例如:“胸部疼痛”,“胸痛”,“胸部不适”等。还有一些医学术语,我必须用其含义替代,例如:“C / O-投诉“,”SOB - 缺乏呼吸“等。我如何对这些术语进行分类?
我的更大目标是建立一个概率模型,帮助我根据历史数据趋势确定患者是否患有疾病A以及他或她是否患有疾病B.提前感谢您的回答。