我试图获得伦敦所有地铁站的准确清单及其相应的线路。我从维基百科那里获取了这些信息,在那里我复制了文章源文本并使用正则表达式搜索并替换为只保留地铁站的名称及其在文件每行上的行名称
我已经设法将地铁站名称分开到他们自己的线路上。所以现在我一直试图找到一个正则表达式,它只匹配不在文件行内的伦敦地铁线名称的字符并删除它们。然后它会更容易过滤掉。
我在Vim和Sublime Text中尝试了各种方法,但我不确定哪些方法有效。
(?!Bakerloo|Central|District|Hammersmith & City|Jubilee|Metropolitan|Northern|Piccadilly|Victoria|Waterloo & City).*
上述比赛太贪婪了。有什么帮助吗?
编辑:我已将文件缩小为仅包含行名称的行。该文件的一行如下所示:
| [[File:ActonTown1.jpg|100px|alt=A brown-bricked building with a flat-slabbed roof and six columns of windows on the front face standing below a blue sky with white clouds|Acton Town]] || [[District line|District]]<br>[[Piccadilly line|Piccadilly]] || [[London Borough of Ealing|Ealing]] || {{ctr|[[Travelcard Zone 3|3]]}} || {{ctr|{{dts|format=dmy|1879|July|1}}}} || {{sort|z|}} || Mill Hill Park: 1879–1910 || {{ctr|{{nts|5.75}}}}
答案 0 :(得分:0)
我的PatternsOnText plugin提供:DeleteExcept
命令可能对您有所帮助(如果我理解您的要求):
:%DeleteExcept /Bakerloo\|Central\|District\|Hammersmith & City\|Jubilee\|Metropolitan\|Northern\|Piccadilly\|Victoria\|Waterloo & City/