Question

这是关于Notepad ++的一个非常具体的问题，或者你认为我可以将这些分开的任何其他方式，坦率地说。我会给你一个简单的例子：

<div class="image" style="position: absolute; left: 260px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 520px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 180px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 210px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>

尽管它们具有样式和位置，但如何在保留第一个重复行的同时删除所有这些行（由于ImageLink URL相同）。如果不是这些职位，而且其中一些职位具有相同的链接，那么只需“搜索和替换”就很容易。

比这复杂得多，但是你会怎么做呢？

Answer 1

如果我理解正确，那么网址应该是唯一的？我这样做的方法是将URL与HTML的其余部分分开，例如使用正则表达式并替换所有不是URL的内容，或者在Notepad ++中使用块选择并选择所有网址。

然后，我将网址粘贴到Excel的一列中，然后将整行（包括HTML）粘贴到第二列。然后只需按唯一性过滤第一列：

选择包含网址
点击数据标签
有一个按钮＆＃34;删除重复项＆＃34;。点击它。
它会询问您是要扩展选择还是仅使用所选列。告诉Excel扩展选择（因为我们要过滤所有列）
然后会弹出一个窗口，询问哪个列包含重复值。只选择A列，因为它是包含网址的列。
如果您然后单击“确定”（或任何按钮的名称），它将删除重复项。

然后将第二列复制回Notepad ++并且您拥有唯一的行。

Notepad ++ - 删除动态类中包含重复URL的行

1 个答案: