我想为我的网站生成图形站点地图。据我所知,有两个阶段:
有没有人有这方面的建议或经验,或者知道我可以构建的现有工作(理想情况下是Python)?
我遇到了一些用于渲染树的nice CSS,但它只适用于3个级别。
由于
答案 0 :(得分:4)
创建站点地图的唯一自动方法是了解站点的结构并编写基于该知识的程序。只是抓取链接通常不会起作用,因为链接可以在任何页面之间,因此您可以获得图形(即节点之间的连接)。在一般情况下,无法将图形转换为树。
因此,您必须自己识别树的结构,然后抓取相关页面以获取页面的标题。
至于“但它仅适用于3个级别”:三个级别绰绰有余。如果您尝试创建更多级别,您的站点地图将变得无法使用(太大,太宽)。没有人会想下载1MB的站点地图,然后滚动100'000页的链接。如果您的网站变得那么大,那么您必须实施某种搜索。
答案 1 :(得分:3)
Here is a python web crawler,这应该是一个很好的起点。你的总体战略是:
正如leonm所说,你需要做到这一切的原因是,网站是图形,而不是树木,而布局图形比在简单的javascript和css中做的更难。 Graphviz擅长它的功能。
答案 2 :(得分:1)
请参阅http://aaron.oirt.rutgers.edu/myapp/docs/W1100_2200.TreeView 关于如何格式化树视图。您也可以修改示例应用程序 http://aaron.oirt.rutgers.edu/myapp/DirectoryTree/index刮你的 页面如果被组织为HTML文件的目录。