我有两列,每列包含一个URL列表(超过50,000),其中一些是重复的。包含简化网址的屏幕截图:http://tinypic.com/r/nevmzn/8。
请注意,第一行有两个略有不同的网址,但每个网址都包含相同的网址:www.apple.com
和http://www.apple.com
指向同一网站,因此第三列应该反映出来。
有没有办法我可以设置它,第三列(两个列)将自动排序哪些网址是重复的,哪些不是?&? 有没有我可以使用的公式,或者Excel功能可以帮助我自动执行此操作?
答案 0 :(得分:2)
如果您只想从比较中去除http://部分,可以使用
= IF(SUBSTITUTE(A1, “HTTP://”, “”)= SUBSTITUTE(B1, “HTTP://”, “”),替代(B1, “HTTP://”, “”) , “否”)
答案 1 :(得分:0)
您可以使用=IF(RIGHT(A1,LEN(A1)-FIND(".",A1))=RIGHT(B1,LEN(B1)-FIND(".",B1)),RIGHT(A1,LEN(A1)-FIND(".",A1)),"No")
=RIGHT(A1,LEN(A1)-FIND(".",A1))
将从单元格返回website.com
,即使它以http://
或http://www.
或www.
以上公式只是比较每列的网站,如果匹配,则会返回网站,否则返回"否"