如何在java代码中修改weka中的tfidf矩阵?

时间:2014-01-05 16:52:36

标签: java weka tf-idf

我想在tfidf过滤器的输出Weka中修改stringtowordvector矩阵。 如何在java代码中访问这个矩阵?有什么方法可以改变它吗?

1 个答案:

答案 0 :(得分:1)

查看Stringtowordvector代码,方法convertInstancewoDocNorm我认为矩阵未存储。

//Doing IDFTransform
    if(m_IDFTransform==true) {
      Iterator it = contained.keySet().iterator();
      for(int i=0; it.hasNext(); i++) {
        Integer index = (Integer)it.next();
        if( index.intValue() >= firstCopy ) {
          double val = ((Double)contained.get(index)).doubleValue();
          val = val*Math.log( m_NumInstances /
            (double) m_DocsCounts[index.intValue()] );
          contained.put(index, new Double(val));
        }
      }        
    }