我有Dictionary.txt
个城市名称词典文件,并且在CSV文件中匹配了城市名称,并计算了每一行中的“匹配项”数。
我的Dictionary.txt
文件有问题,它包含一些不属于城市名称的关键字。因此,我想从字典文件中删除所有这些不相关的关键字。我不知道如何解决。
例如Dictionary.txt的一些关键字是:
Nowy Dworek
Dar Bel Amri
Abaren
Hassi blal
Ambodivona
Chakla
Ippatam
Suti
Via
Zingeyskiy
Luesslingen
Bolshaya Markha
Ard Na Greine
Raskhovets
Ksizovo
Rock Elm
Batnahit
在此文件中,我有很多不相关的关键字,例如,在给定的样本via
中关键字不属于城市,与下面给出的输出结果相同,您可以看到有很多不相关的关键字匹配在说明中
Sr_Num | Description Cities |matched Keywords |Cities Total matches
1 | any description........|temple , via , Thai |3
2 last , canada , give , on| 4
3 this , is , on , louis |4
4 Ocean , I , US , a , is , Southern , huge , of , this , War| 10
5 queen |1
6 But , is , me , cole| 4
7 all , Lester , Mason , is , on , us , long , of| 8
8 Wallach , Bad , Good , Sanchez |4
那么,如何从dictionary.txt
文件中删除所有不属于城市名称的不相关关键字?
答案 0 :(得分:1)
我不会提供代码,因为我认为您可以自己做,但是这是我的方法:
首先,将您的foreach(file in files)
UsualCompilingRoutinesForSingleFile(file)
拆分成一个列表。
然后,拆分CSV文件,以将每个城市名称分成一个列表。
然后,循环浏览最后一个列表,以检查它是否是词典列表中的单词,如果不是,请将其从列表中删除。
最后,从获得的最终列表中重写CSV。
编辑:这是向您显示的一些代码:
Dictionary.txt