应用错误收集

使用ColdFusion解析导出的书签文件

时间：2010-08-17 01:39:16

标签： regex parsing coldfusion

我需要解析从Chrome，Firefox和IE等浏览器导出的书签列表。也许甚至谷歌等。

我玩过并做了类似这个reMatchNoCase("(<h3)(.*?)(</dl>)",myfile1)循环的事情。然后我在reMatchNoCase("(<dt[>])(.*?)(</a>)",i) / h3中使用dl 标签，然后很多清理，但它真的不可靠。

问题在于，他们使用h3标记包围的dl标记，然后是其中的书签。我不能只解析所有网址，因为我想在浏览器中获取类别。

感谢。

1 个答案:

答案 0 :(得分：3)

如果是XHTML，请使用XPath

如果不是，那就不容易了。搜索https://stackoverflow.com/search?q=parse+html

你能考虑使用混合方法，首先在客户端解析jQuery并发布到CF吗？