对于一个程序即时编写ive存储信息来自字符串中的html文件。 html文件是一个导出的书签文件,我需要我的程序搜索html文件,并将每个实例存储一个书签到特定的网站,以便我可以进行进一步的处理。
书签具有一致的开头但不具有一致的结果,例如https://www.example.net/e/1111111/1/example
https://www.example.net/e/2222222/1/
https://www.example.net/e/3333333/1
https://www.example.net/e/4444444
在url是引号之后的html文件中的但我不确定如何使用它来获取网址。
如果有人能指出我正确的方向,请欣赏它
@mafagafogigante thx的帮助,它允许我生成以下代码:
public static void FileforURL(String content){
int first, second;
while(content.indexOf("https://www.example.net/e/") != -1){
first = content.indexOf("https://www.example.net/e/");
if(content.indexOf("\"",first) != -1){
second = content.indexOf("\"",first);
try {
URL(content.substring(first, second));
} catch (Exception e) {
e.printStackTrace();
}
content = content.substring(second,content.length());
}
}
}
答案 0 :(得分:0)
使用String.indexOf(...)获取下一个“https:// [...]”子串开始。
重复查找所需的下一个子字符串的开头。
在两者之间获取文字。
重复直到你得到-1,剩下的就是你的最后一个URL。