如何读取包含2个以奇怪格式编写的文档的txt文件?

时间:2017-03-20 15:12:27

标签: java hashtable bufferedreader information-retrieval inverted-index

这就是我的txt文件的样子:text file

我做了什么来阅读" .i"和" .m"来自2份文件 但我没有得到任何结果,哈希表结果= null。 还有其他方法可以读取这个txt文件吗?

while(br.ready())
{
    String line = "" ; // br.readLine();
    while ( (line= br.readLine()) != null)
    {
        //if line contains .I
        if (line.contains(".I"))
        {   //read the id and save it in id var
            String[] result = line.split("\\s");
            id = result [result.length - 1];
        }
        else if(line.contains(".M ")){
            String[] result = line.split("\\s");
            for(int i = 0; i < result.length; i++){
                if(!ht.containsKey(result[i]))
                {
                    ArrayList<tuple> temp = new ArrayList<tuple>();
                    int index = line.indexOf(result[i]);
                    tuple tmpTupl = new tuple(id+"", index+"");
                    temp.add(tmpTupl);
                    ht.put(result[i], temp);
                }
            }

0 个答案:

没有答案