朋友们,我正在做最后一年的句子语义相似性项目。 所以我使用word-net 2.1数据库来检索含义。我必须分开任何单词。在每个单词中我都有意义并存储到数组中。但它只能得到第一句话的含义。
String[] sentences = result.split("[\\.\\!\\?]");
for (int i=0;i<sentences.length;i++)
{
System.out.println(i);
System.out.println(sentences[i]);
int wcount1 = sentences[i].split("\\s+").length;
System.out.println(wcount1);int wcount1=wordCount(w2);
System.out.println(wcount1);
String[] word1 = sentences[i].split(" ");
for (int j=0;j<wcount1;j++){
System.out.println(j);
System.out.println(word1[j]);
}
}
IndexWordSet set = wordnet.lookupAllIndexWords(word1[j]);
System.out.println(set);
IndexWord[] ws = set.getIndexWordArray();
**POS p = ws[0].getPOS();///line no 103**
Set<String> synonyms = new HashSet<String>();
IndexWord indexWord = wordnet.lookupIndexWord(p, word1[j]);
Synset[] synSets = indexWord.getSenses();
for (Synset synset : synSets)
{
Word[] words = synset.getWords();
for (Word word : words)
{
synonyms.add(word.getLemma());
}
}
System.out.println(synonyms);
输出:
只有sentences[o]
(第一句话单词才有意义......所有其他单词都没有循环...)
它显示了这个错误..
**java.lang.ArrayIndexOutOfBoundsException: 0
at first_JWNL.main(first_JWNL.java:102)**
答案 0 :(得分:0)
声明变量wcount1
时,您可以指定值sentences[i].split("\\s+")..
。但是,当您分配变量word1
时,会为其分配sentences[i].split(" ")
。
是否可能,因为您正在使用两个正则表达式,第二个拆分(分配给word1
变量)未正确拆分?因此,当您访问值(System.out.println(word1[j]);
)时,它会抛出ArrayIndexOutOfBoundsException
。由于wcount1
的值可能大于word1
的长度。