标签: python-3.x
我是这个问题的新手,所以希望您了解问题所在。
我有一个包含许多列的数据集。每行都是由人工手动添加的,并且每个输入均以文本形式给出。 列之一是国家。让我们以英格兰为例:
这将导致一列具有不同的国家名称,而意味着同一国家。我有36个不同的国家/地区,他们知道适合他们多少种文字。
是否有一种技术可以将不同的国家/地区文本分类为一个国家/地区,以便进行一些分析?
例如:
如果我的问题和/或问题不清楚,请告知我,以便我进一步说明。
最诚挚的问候