如何从python文本文件中的字典中删除不属于城市的那些关键字?

时间:2019-02-28 12:02:17

标签: python python-3.x dictionary text

我有Dictionary.txt个城市名称词典文件,并且在CSV文件中匹配了城市名称,并计算了每一行中的“匹配项”数。

我的Dictionary.txt文件有问题,它包含一些不属于城市名称的关键字。因此,我想从字典文件中删除所有这些不相关的关键字。我不知道如何解决。

例如Dictionary.txt的一些关键字是:

Nowy Dworek
Dar Bel Amri
Abaren
Hassi blal
Ambodivona
Chakla
Ippatam
Suti
Via
Zingeyskiy
Luesslingen
Bolshaya Markha
Ard Na Greine
Raskhovets
Ksizovo
Rock Elm
Batnahit

在此文件中,我有很多不相关的关键字,例如,在给定的样本via中关键字不属于城市,与下面给出的输出结果相同,您可以看到有很多不相关的关键字匹配在说明中

Sr_Num |    Description Cities  |matched Keywords    |Cities Total matches
1      | any description........|temple , via , Thai |3
2                                last , canada , give , on| 4
3                                this , is , on , louis |4
4                                Ocean , I , US , a , is , Southern , huge , of , this , War|   10
5                                queen  |1
6                                But , is , me , cole|  4
7                                all , Lester , Mason , is , on , us , long , of|   8
8                                Wallach , Bad , Good , Sanchez |4

那么,如何从dictionary.txt文件中删除所有不属于城市名称的不相关关键字?

1 个答案:

答案 0 :(得分:1)

我不会提供代码,因为我认为您可以自己做,但是这是我的方法:

首先,将您的foreach(file in files) UsualCompilingRoutinesForSingleFile(file) 拆分成一个列表。

然后,拆分CSV文件,以将每个城市名称分成一个列表。

然后,循环浏览最后一个列表,以检查它是否是词典列表中的单词,如果不是,请将其从列表中删除。

最后,从获得的最终列表中重写CSV。

编辑:这是向您显示的一些代码:

Dictionary.txt