有关在github上实现Double Array Trie的问题

时间:2018-12-18 13:24:42

标签: java arrays double trie

我正在GitHub上研究有关Double Array Trie的项目。the GitHub link。我对AhoCorasickDoubleArrayTrie.java有一些疑问。


    private int insert(List<Map.Entry<Integer, State>> siblings)
    {
        int begin = 0;
        int pos = Math.max(siblings.get(0).getKey() + 1, nextCheckPos) - 1;
        int nonzero_num = 0;
        int first = 0;

        if (allocSize <= pos)
            resize(pos + 1);

        outer:
        while (true)
        {
            pos++;

            if (allocSize <= pos)
                resize(pos + 1);

            if (check[pos] != 0)
            {
                nonzero_num++;
                continue;
            }
            else if (first == 0)
            {
                nextCheckPos = pos;
                first = 1;
            }

            begin = pos - siblings.get(0).getKey(); 
            if (allocSize <= (begin + siblings.get(siblings.size() - 1).getKey()))
            {
                // progress can be zero 
                double l = (1.05 > 1.0 * keySize / (progress + 1)) ? 1.05 : 1.0 * keySize / (progress + 1);
                resize((int) (allocSize * l));
            }

            if (used[begin])
                continue;

            for (int i = 1; i < siblings.size(); i++)
                if (check[begin + siblings.get(i).getKey()] != 0)
                    continue outer;

            break;
        }

        if (1.0 * nonzero_num / (pos - nextCheckPos + 1) >= 0.95)
            nextCheckPos = pos;

        used[begin] = true;

        size = (size > begin + siblings.get(siblings.size() - 1).getKey() + 1) ? size : begin + siblings.get(siblings.size() - 1).getKey() + 1;

        for (Map.Entry<Integer, State> sibling : siblings)
        {
            check[begin + sibling.getKey()] = begin;
        }

        for (Map.Entry<Integer, State> sibling : siblings)
        {
            List<Map.Entry<Integer, State>> new_siblings = new ArrayList<Map.Entry<Integer, State>>(sibling.getValue().getSuccess().entrySet().size() + 1);

            if (fetch(sibling.getValue(), new_siblings) == 0)
            {
                base[begin + sibling.getKey()] = (-sibling.getValue().getLargestValueId() - 1);
                progress++;
            }
            else
            {
                int h = insert(new_siblings);   // dfs
                base[begin + sibling.getKey()] = h;
            }
            sibling.getValue().setIndex(begin + sibling.getKey());
        }
        return begin;
    }

在提取方法中, 有一个if语句“ isAcceptable()”,该语句检查该节点是否为终端节点。 如果该节点是终端节点,则new_siblings将插入一个新的伪节点。 最后,返回new_siblings的大小。

我认为, 如果该节点不是终端节点,则必须有一个子节点, 并将子节点添加到new_siblings中。 如果该节点是终端节点,则将添加一个伪节点。 因此,在两种情况下,提取方法的返回值都不能为零。

,但是在插入方法的末尾, 语句“ if(fetch(sibling.getValue(),new_siblings)== 0)” 将检查此返回值是否为零。 这不应该在任何时候发生。 我很困惑, 而且我不知道fakeNode的用途是什么。 请指导我,谢谢!

0 个答案:

没有答案