查找网站上发生的次数

时间:2015-11-10 20:53:39

标签: java

我制作的程序可以在网站上搜索目标词。我已经能够加载网站,但我不知道如何使方法searchHits找到并计算其目标。帮助将不胜感激。

public String[] searchHits(String target){
        String[] out = new String[0];
            }

public static void main(String[] args) throws IOException {
    String AFTEN = "https://theguardian.com/";
    String TARGET = "and";

我也没有太多运气试过这个:

 public int searchHits(String target, String aften){ 
    String[] out = new String[0];
    int occurrences = 0;

    if (aften.contains(target)) {
       occurrences++;
    }
    return occurrences;
    }

1 个答案:

答案 0 :(得分:0)

哼......当在输入文本中查找字符串时,你必须处理这些问题:

  1. 如果目标字符串必须按字面匹配,或者无论是大写还是小写或其他惯用符号(重音符号等)都必须匹配。
  2. 如果目标字符串已完成,或者可能是单词的一部分。
  3. 在第一种情况下,您必须首先预处理输入文本并将其转换为小写,并且(取决于目标语言)甚至取出重音符号并将其转换为纯文本小写文本。所以目标文本。

    在第二种情况下(完整的单词),您还必须首先将输入文本标记为单个单词,用逗号,句号,冒号,分号等分隔。还有目标串。然后,迭代完整的单词列表,查找目标单词。

    如果您想要一种简单的方法,至少应该以不区分大小写的方式比较文本。就此而言,您可以使用String.regionMatches代替contains