带有数据集Java Eclipse的Ngrams

时间:2019-02-27 22:43:04

标签: java eclipse

嗨,我正在尝试在此数据集上使用ngram(攻击次数),但我对如何将这两种方法合并在一起感到困惑,以便n-gram可以发现它们出现多少次的频率。我只是想进行数据处理,但我很困惑。任何帮助,将不胜感激,谢谢。 这是我到目前为止所做的。如您所见,主要方法保存数据集,但如何将所有方法合并在一起,以便Ngrams在数据上运行。谢谢

    public class MainProcess {


    public static void main(String args[]) throws IOException
    {
       FileReader readhandle = new 
       FileReader("/Users/muhammad/Desktop/ADFA- 
       LD/Attack_Data_Master/Adduser_1/UAD-Adduser-1-=1.txt");
       BufferedReader br = new BufferedReader(readhandle);
       String line = null;
       while((line = br.readLine()) != null)
       {
          System.out.println(line);
       }
       br.close();
       readhandle.close();
    }

    public class Ngrams {


        ArrayList<String> nGrams = new ArrayList<String>();

        public void generateNGrams(String str, int n) {

          if (str.length() == n ) {
              int counter = 0;
              while (counter < n) {
                nGrams.add(str.substring(counter));
                counter++;
              }
              return;
          }

          int counter = 0;
          String gram = "";
          while (counter < n) {
              gram += str.charAt(counter);
              counter++;
          }
          nGrams.add(gram);
          generateNGrams(str.substring(1), n);
        }

        public void printNGrams() {



          for (String str : nGrams) {
              System.out.println(str);
          }
        }}








}

0 个答案:

没有答案