在python中将类似的查询命名为单个标准查询

时间:2016-08-03 12:36:20

标签: python pandas nlp knn

假设我在Pandas DataFrame中有数据集:

Sr.No|query
-----------
1. tiger
2. tigers
3. lion
4. lionx
5. ilion
6. 56tigers

结果数据集应包含:

Sr.No|query
-----------
1. tiger
2. tiger
3. lion
4. lion
5. lion
6. tiger

我不知道该怎么做,所以如果你能给任何链接/书名以及首选的代码。我知道这是一个广泛的主题,可能会使用像kNN这样的nltk和聚类算法。但是,任何形式的帮助都将受到赞赏。

0 个答案:

没有答案