如何删除包含类似重复项的行?

时间:2014-01-09 11:28:22

标签: php notepad++

我有一个包含网址的文本文件。如何删除带有www和非www的重复地址? 例如,我有两个网址:

example.com
www.example.com

我想删除一个,或从www.example.com删除'example.com'然后我可以删除所有www。的

文件包含大约8k网址,因此我无法手动执行此操作

用新行分隔网址,或者以某种方式在PHP中进行分解,将每个数据分解为数组然后进行比较? (这将耗费大量时间)

2 个答案:

答案 0 :(得分:1)

在Notepad ++中搜索“www。”然后用空格替换所有。 然后创建一个PHP文件并将它们分解为一个数组,然后使用array_unique()

答案 1 :(得分:0)

我已经删除了所有www。 - >取代所有www。至 '' 然后删除重复: Regex: Remove lines containing