如何在Java中将文件路径列表转换为分层树

时间:2013-09-03 11:05:46

标签: java algorithm recursion tree nio

有人可以给我一些指示。我想要一个文件路径列表(只是字符串)并转换为类似结构的层次结构树。因此,有两个任务,解析字符串以创建树,以及创建树或某种映射结构以实际将结果放入。 (然后第三个任务是解析树以显示为html中的树)

我正在使用Java 7,所以我假设我可以使用Paths来完成第一部分,但是努力获得一个清晰的算法。

C:\Music\Blur\Leisure
C:\Music\KateBush\WholeStory\Disc1
C:\Music\KateBush\WholeStory\Disc2
C:\Music\KateBush\The Kick Inside   
C:\Music\KateBush\The Dreaming
C:\MusicUnprocessed\Blue\ParkLife

所以它给出了

C:\
   Music
      Blur 
          Leisure
      Kate Bush
          Whole Story
               Disc 1
               Disc 2
          The Kick Inside
          The Dreaming
    MusicProcessing
      Blur
         ParkLife

2 个答案:

答案 0 :(得分:5)

这是一个非常简单的实现,它可以让您了解从哪里开始。 : - )

import java.io.PrintStream;
import java.util.Collections;
import java.util.Map;
import java.util.Scanner;
import java.util.TreeMap;
import java.util.regex.Pattern;

public class PathWalker {
    public static class Node {
        private final Map<String, Node> children = new TreeMap<>();

        public Node getChild(String name) {
            if (children.containsKey(name))
                return children.get(name);
            Node result = new Node();
            children.put(name, result);
            return result;
        }

        public Map<String, Node> getChildren() {
            return Collections.unmodifiableMap(children);
        }
    }

    private final Node root = new Node();

    private static final Pattern PATH_SEPARATOR = Pattern.compile("\\\\");
    public void addPath(String path) {
        String[] names = PATH_SEPARATOR.split(path);
        Node node = root;
        for (String name : names)
            node = node.getChild(name);
    }

    private static void printHtml(Node node, PrintStream out) {
        Map<String, Node> children = node.getChildren();
        if (children.isEmpty())
            return;
        out.println("<ul>");
        for (Map.Entry<String, Node> child : children.entrySet()) {
            out.print("<li>");
            out.print(child.getKey());
            printHtml(child.getValue(), out);
            out.println("</li>");
        }
        out.println("</ul>");
    }

    public void printHtml(PrintStream out) {
        printHtml(root, out);
    }

    public static void main(String[] args) {
        PathWalker self = new PathWalker();
        Scanner scanner = new Scanner(System.in);
        while (scanner.hasNextLine())
            self.addPath(scanner.nextLine());
        self.printHtml(System.out);
    }
}

最初,我考虑过为目录和常规文件创建单独的类,但我觉得在这种情况下,因为您只想打印名称,所以使用统一节点类可以使代码更简单,尤其是因为您可以避免实施访客模式。

输出没有以任何特别好的方式格式化。如果你愿意的话,你可以调整代码;或者,如果你想要更好看的东西,你可以通过HTML Tidy运行输出。

我选择使用TreeMap,因此目录条目按字典顺序排列。如果您想使用广告订单,只需更改为使用LinkedHashMap

答案 1 :(得分:0)

你能更具体地了解一下你正在努力解决的问题吗?在我看来,你已经设法将任务分成了很好的块(解析,创建树,并显示它)。

如果你想了解更多关于树的信息,那么我会推荐斯坦福的优秀CS库(http://cslibrary.stanford.edu/),这就是我学习链表和二叉树的方法。 我想想出一个我自己的二进制树的lisp实现和插入新元素的函数,并解析它,真的帮助我解决了这些问题。

请注意,在您的示例中,二叉树足以表示数据,因为每个父级最多只有两个子级,但我认为您可能会遇到不是这种情况的情况。

但是一旦你了解了二元树,那么理解任意数量的孩子的树木应该不会太难。

至于解析,我不确定你真的需要Paths。由于您已经获得了一个文件,其中每一行都是一个具有完全限定路径名的文件,因此自己编写一个简单的解析函数应该不会太困难。

我的意思是,基本上你想要在斜杠“\”上拆分,所以每次看到斜杠时,都会创建一个新节点,前一个节点作为其父节点。如果节点已存在,则只需附加到该节点即可。 对于每一行,您都从树的根部开始。

将树输出为html主要是树遍历。