删除重复字符串|正则表达式模式匹配

时间:2018-01-16 20:29:46

标签: java android string

我对Java编程很新,还在学习。我成功删除了“?”通过正则表达式捕获url的im。但是,我从中提取图像的网站有多个具有相同名称的图像实例,因此返回重复的字符串。

如何删除重复的字符串?

我从网站上捕获图像和名称的代码:

String result = null;

    try {
        result = task.execute("https://www.therichest.com/top-lists/top-100-richest-celebrities").get();
        String[] splitResult = result.split("<div class='wp-pagenavi'>");

        Pattern p = Pattern.compile("srcset=\"(.*?)\\?q");
        Matcher m = p.matcher(splitResult[0]);


        while (m.find()) {
            celebURLs.add(m.group(1));
            System.out.println(m.group(1));
        }

        p = Pattern.compile("alt=\'(.*?)Net");
        m = p.matcher(splitResult[0]);

        while(m.find()) {
            celebNames.add(m.group(1));
            System.out.println(m.group(1));
        }

1 个答案:

答案 0 :(得分:1)

最简单的方法是将所有名称粘贴在一个集合中,然后在完成后移动该集合。集合的功能将过滤掉欺骗。