嗨,我正在尝试在此数据集上使用ngram(攻击次数),但我对如何将这两种方法合并在一起感到困惑,以便n-gram可以发现它们出现多少次的频率。我只是想进行数据处理,但我很困惑。任何帮助,将不胜感激,谢谢。 这是我到目前为止所做的。如您所见,主要方法保存数据集,但如何将所有方法合并在一起,以便Ngrams在数据上运行。谢谢
public class MainProcess {
public static void main(String args[]) throws IOException
{
FileReader readhandle = new
FileReader("/Users/muhammad/Desktop/ADFA-
LD/Attack_Data_Master/Adduser_1/UAD-Adduser-1-=1.txt");
BufferedReader br = new BufferedReader(readhandle);
String line = null;
while((line = br.readLine()) != null)
{
System.out.println(line);
}
br.close();
readhandle.close();
}
public class Ngrams {
ArrayList<String> nGrams = new ArrayList<String>();
public void generateNGrams(String str, int n) {
if (str.length() == n ) {
int counter = 0;
while (counter < n) {
nGrams.add(str.substring(counter));
counter++;
}
return;
}
int counter = 0;
String gram = "";
while (counter < n) {
gram += str.charAt(counter);
counter++;
}
nGrams.add(gram);
generateNGrams(str.substring(1), n);
}
public void printNGrams() {
for (String str : nGrams) {
System.out.println(str);
}
}}
}