我正在使用ROME库来解析供稿。我想知道如何将链接标识为XML链接或普通链接。在ROME中是否支持此功能。
答案 0 :(得分:0)
听起来你说你将从某个地方获得一堆链接(RSS提要内容或其他内容)。然后,您想要浏览它们并确定它们是RSS / Atom订阅源还是常规HTML页面。
您可能尝试使用Rome获取它,然后查看它是否会引发异常。一个更好的选择可能是在每个链接的末尾拉入文档并查看标题所说的内容。
请记住,如果有人链接到一个非常大的文件,检索每个链接可能会遇到问题。
您可以查看使用HEAD命令查找在下载整个内容之前您将在链接末尾获得的文件类型。