我正在解析网页并收集href。由于网页是不受信任的来源,因此它可以保存带有无效语法或非ascii符号的链接。所以,据我所知,我需要
1)转换空格和非ascii符号以及其他符号
2)验证由步骤1生成的字符串(有效性标准:此URL可以在浏览器中输入,并且它将能够检索由url表示的页面,这样的url可以由URL / URI构造函数和适当的页面构造检索 - 我可以在firefox中键入一些url但不能在java中构造实例
3)如果有效,则从(1)构造java.net.URL / URI
我找到了两个验证库:1和2(您更喜欢哪一个?)但是第一个子句没有足够的库(java.net.URLDecoder / URLEncoder之类的工具)不是用于此目的。
答案 0 :(得分:1)
你不能尝试在try / catch语句中从中创建一个URL / URI吗?我认为类'构造函数自动处理验证