根据字典中未列出的新单词列表检测拼写错误?(例如药物名称)

时间:2019-03-07 10:24:31

标签: python nlp spell-checking

我有一个毒品清单:

['EXEMESTANE', 'FILGRASTIM', 'FLUCONAZOLE', 'FLUDARABINE', 'FLUOROURACIL', 'FOLINIC ACID', 'FULVESTRANT', 'GANETESPIB', 'GEFETINIB', 'GEFITINIB', 'GEMCITABINE','GEMTUZUMAB', 'GEMTUZUMAB OZOGAMICIN', 'GEMTUZUMAB OZOGAMYCIN', 'GONADORELIN', 'GOSERELIN', 'HERCEPTIN', 'HYDROCORTISONE', 'HYDROXYCARBAMIDE', 'HYDROXYCARBIMIDE', 'IBANDRONATE', 'IBRITINIB', 'IBRUTANIB', 'IBRUTINIB', 'IDARUBICIN']

有人知道任何可以快速检测到'GEFETINIB''GEFITINIB'之一是错误拼写的库/算法吗?

输出应返回一个列表,该列表没有任何拼写错误,例如:

['EXEMESTANE', 'FILGRASTIM', 'FLUCONAZOLE', 'FLUDARABINE', 'FLUOROURACIL', 'FOLINIC ACID', 'FULVESTRANT', 'GANETESPIB', 'GEFETINIB', 'GEMCITABINE', 'GEMTUZUMAB', 'GEMTUZUMAB OZOGAMYCIN', 'GONADORELIN', 'GOSERELIN', 'HERCEPTIN',
 'HYDROCORTISONE', 'HYDROXYCARBAMIDE', 'IBANDRONATE', 'IBRUTANIB', 'IDARUBICIN']

哪一个是正确的拼写都没关系,我只想最后列出一串独特的药品,没有相同药物的重复但有不同的拼写。

原始列表中约有1000项。

0 个答案:

没有答案