使用ASP </title>在HTML文件中查找<title>的值

时间:2012-05-31 15:08:25

标签: asp-classic

我正在尝试为具有可变数量的HTML文件的目录创建一个自动生成目录页面。我创造了这个:

<ul>
    <%
    dim fs,fo,x
    set fs=Server.CreateObject("Scripting.FileSystemObject")
    set fo=fs.GetFolder("c:\test\html\")

    for each x in fo.files
        newName=Split(x.Name, ".")
        'Print the name of all files in the test folder
        for each y in newName
            Response.write("<li><a href='" & x.Name & "'>" & y & "</a></li>")
        next
    next

    set fo=nothing
    set fs=nothing
    %>
</ul>

这里的问题是链接是使用文件名生成的,所以我得到了“引言”而不是“这个主题的介绍”。每个HTML文档中的html > head > title元素是我想要使用的链接文本。有没有办法从每个文件中提取它?

(我对一个不使用ASP的解决方案持开放态度。我之所以创建它只是因为它是我可以使用的。我不太熟悉ASP或它的功能,因此可能会更高效解决这个问题的方法。)

1 个答案:

答案 0 :(得分:0)

毫无疑问,文件夹中的所有文件都是实际使用的,并且是网站的一部分,或者这些文件在站点地图结构中的关联方式。最好从外部的爬虫上进行处理,而不是内部的文件系统。

您可以使用网络上的各种sitemap generating services。您可以获取结果并根据需要进行编辑,并将其作为您自己的目录发布。