假设我在Pandas DataFrame中有数据集:
Sr.No|query
-----------
1. tiger
2. tigers
3. lion
4. lionx
5. ilion
6. 56tigers
结果数据集应包含:
Sr.No|query
-----------
1. tiger
2. tiger
3. lion
4. lion
5. lion
6. tiger
我不知道该怎么做,所以如果你能给任何链接/书名以及首选的代码。我知道这是一个广泛的主题,可能会使用像kNN这样的nltk和聚类算法。但是,任何形式的帮助都将受到赞赏。