获取以下内容以返回具有特定格式的文本文件中的所有URL

时间:2014-08-27 17:12:58

标签: java gdata

这更多关于我之前发布的代码。

我有以下内容返回我从YouTube gdata中提取的所有XML数据中包含的单个网址。我现在无法让它返回属于指定布局的所有网址。

这是返回单个网址的代码

while ((inputLine = sc.findWithinHorizon("www.youtube.com/watch?v=9HJ2fl4zbx0&feature=youtube_gdata", 0)) != null)
    {
        System.out.println(inputLine);
    }

现在,我需要它返回以" www.youtube.com/watch?v ="开头的所有网址。并以"& feature = youtube_gdata"

结束

或者,如果我可以在" www.youtube.com/watch?v ="

之后只返回接下来的11个字符,它会完美地工作

1 个答案:

答案 0 :(得分:0)

如果我理解你,你可以使用类似

的东西
Scanner sc = new Scanner(
        "www.youtube.com/watch?v=9HJ2fl4zbx0&feature=youtube_gdata");
String openStr = "www.youtube.com/watch?v=";
while (sc.hasNextLine() && (inputLine = sc.nextLine()) != null) {
    int pos = inputLine.indexOf(openStr);
    if (pos > -1) {
        pos += openStr.length();
        System.out.println(inputLine.substring(pos, pos + 11));
    }
}

请注意,上面使用了一个String扫描仪,但输出是

9HJ2fl4zbx0