我正在尝试为具有可变数量的HTML文件的目录创建一个自动生成目录页面。我创造了这个:
<ul>
<%
dim fs,fo,x
set fs=Server.CreateObject("Scripting.FileSystemObject")
set fo=fs.GetFolder("c:\test\html\")
for each x in fo.files
newName=Split(x.Name, ".")
'Print the name of all files in the test folder
for each y in newName
Response.write("<li><a href='" & x.Name & "'>" & y & "</a></li>")
next
next
set fo=nothing
set fs=nothing
%>
</ul>
这里的问题是链接是使用文件名生成的,所以我得到了“引言”而不是“这个主题的介绍”。每个HTML文档中的html > head > title
元素是我想要使用的链接文本。有没有办法从每个文件中提取它?
(我对一个不使用ASP的解决方案持开放态度。我之所以创建它只是因为它是我可以使用的。我不太熟悉ASP或它的功能,因此可能会更高效解决这个问题的方法。)
答案 0 :(得分:0)
毫无疑问,文件夹中的所有文件都是实际使用的,并且是网站的一部分,或者这些文件在站点地图结构中的关联方式。最好从外部的爬虫上进行处理,而不是内部的文件系统。
您可以使用网络上的各种sitemap generating services。您可以获取结果并根据需要进行编辑,并将其作为您自己的目录发布。