这是关于Notepad ++的一个非常具体的问题,或者你认为我可以将这些分开的任何其他方式,坦率地说。我会给你一个简单的例子:
<div class="image" style="position: absolute; left: 260px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 520px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 180px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
<div class="image" style="position: absolute; left: 210px; top: 0px;"><img src="http://www.Imagelink1.com/1"></div>
尽管它们具有样式和位置,但如何在保留第一个重复行的同时删除所有这些行(由于ImageLink URL相同)。如果不是这些职位,而且其中一些职位具有相同的链接,那么只需“搜索和替换”就很容易。
比这复杂得多,但是你会怎么做呢?
答案 0 :(得分:0)
如果我理解正确,那么网址应该是唯一的? 我这样做的方法是将URL与HTML的其余部分分开,例如使用正则表达式并替换所有不是URL的内容,或者在Notepad ++中使用块选择并选择所有网址。
然后,我将网址粘贴到Excel的一列中,然后将整行(包括HTML)粘贴到第二列。 然后只需按唯一性过滤第一列:
然后将第二列复制回Notepad ++并且您拥有唯一的行。