Notepad ++ - 删除动态类中包含重复URL的行

时间:2014-11-01 22:43:25

标签: url duplicates notepad++ lines

这是关于Notepad ++的一个非常具体的问题,或者你认为我可以将这些分开的任何其他方式,坦率地说。我会给你一个简单的例子:

<div class="image" style="position: absolute; left: 260px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 520px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 180px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 210px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>

尽管它们具有样式和位置,但如何在保留第一个重复行的同时删除所有这些行(由于ImageLink URL相同)。如果不是这些职位,而且其中一些职位具有相同的链接,那么只需“搜索和替换”就很容易。

比这复杂得多,但是你会怎么做呢?

1 个答案:

答案 0 :(得分:0)

如果我理解正确,那么网址应该是唯一的? 我这样做的方法是将URL与HTML的其余部分分开,例如使用正则表达式并替换所有不是URL的内容,或者在Notepad ++中使用块选择并选择所有网址。

然后,我将网址粘贴到Excel的一列中,然后将整行(包括HTML)粘贴到第二列。 然后只需按唯一性过滤第一列:

  • 选择包含网址
  • 的第一列
  • 点击数据标签
  • 有一个按钮&#34;删除重复项&#34;。点击它。
  • 它会询问您是要扩展选择还是仅使用所选列。告诉Excel扩展选择(因为我们要过滤所有列)
  • 然后会弹出一个窗口,询问哪个列包含重复值。只选择A列,因为它是包含网址的列。
  • 如果您然后单击“确定”(或任何按钮的名称),它将删除重复项。

然后将第二列复制回Notepad ++并且您拥有唯一的行。