我对Java编程很新,还在学习。我成功删除了“?”通过正则表达式捕获url的im。但是,我从中提取图像的网站有多个具有相同名称的图像实例,因此返回重复的字符串。
如何删除重复的字符串?
我从网站上捕获图像和名称的代码:
String result = null;
try {
result = task.execute("https://www.therichest.com/top-lists/top-100-richest-celebrities").get();
String[] splitResult = result.split("<div class='wp-pagenavi'>");
Pattern p = Pattern.compile("srcset=\"(.*?)\\?q");
Matcher m = p.matcher(splitResult[0]);
while (m.find()) {
celebURLs.add(m.group(1));
System.out.println(m.group(1));
}
p = Pattern.compile("alt=\'(.*?)Net");
m = p.matcher(splitResult[0]);
while(m.find()) {
celebNames.add(m.group(1));
System.out.println(m.group(1));
}
答案 0 :(得分:1)
最简单的方法是将所有名称粘贴在一个集合中,然后在完成后移动该集合。集合的功能将过滤掉欺骗。