在Java

时间:2016-03-03 07:09:04

标签: java information-retrieval

案例正在构建term-document matrix,但这里的情况是行是documentIds,列是术语。

如何使用Java泛型集合实现此目的? 到目前为止,我已经尝试过了:

class Matrix { 
    HashMap<Point, Integer> map = new HashMap<>();
    Matrix(row, col, frequency) {
        map.put(new Point(row, col), frequency);
    }
}

,其中

class Point { Document row, Term col; }
class Document { String documentId }
class Term { String term }

术语按字母顺序排序。通过使用这些代码,我认为如果某些文档中有新术语,则很难同步每个Point。

所以我的问题是,如何构建能够实现此类行为的集合?

1 个答案:

答案 0 :(得分:0)

不要重新发明轮子。这一切都已经完成了。请参阅Guava Table interface and implementations