标签: python nltk
我正在从患者写的癌症故事中提取疾病,治疗,身体部位,这样做的方法一般分为三类:基于词典,基于规则和基于统计,我试图使用nltk但我目前没有语料库,请告诉我最好的前进方向。目前我正在考虑使用基于词典的方法,创建所有类别,疾病,治疗的词汇,但它会很潮湿。