使用ColdFusion解析导出的书签文件

时间:2010-08-17 01:39:16

标签: regex parsing coldfusion

我需要解析从Chrome,Firefox和IE等浏览器导出的书签列表。也许甚至谷歌等。

我玩过并做了类似这个reMatchNoCase("(<h3)(.*?)(</dl>)",myfile1)循环的事情。然后我在reMatchNoCase("(<dt[>])(.*?)(</a>)",i) / h3中使用dl 标签,然后很多清理,但它真的不可靠。

问题在于,他们使用h3标记包围的dl标记,然后是其中的书签。我不能只解析所有网址,因为我想在浏览器中获取类别。

感谢。

1 个答案:

答案 0 :(得分:3)

如果是XHTML,请使用XPath

如果不是,那就不容易了。搜索https://stackoverflow.com/search?q=parse+html

你能考虑使用混合方法,首先在客户端解析jQuery并发布到CF吗?