Java .split()超出范围

时间:2018-10-07 22:02:56

标签: java file split

我的代码有问题。

我正在尝试从.txt文件中提取频道名称。 我不明白为什么方法line.split()给我返回长度为0的数组:

有人可以帮助我吗?

这是.txt文件:

------------ [channels.txt] ---------------------

...
#CH id="" tvg-name="Example1" tvg-logo="http... 
#CH id="" tvg-name="Example2" tvg-logo="http...
#CH id="" tvg-name="Example3" tvg-logo="http...
#CH id="" tvg-name="Example4" tvg-logo="http...
...

这是我的代码:

try {
    FileInputStream VOD = new FileInputStream("channels.txt");
    BufferedReader buffer_r = new BufferedReader(new InputStreamReader(VOD));
    String line;
    ArrayList<String> name_channels = new ArrayList<String>();

    while ((line = buffer_r.readLine()) != null ) {
        if (line.startsWith("#")) {
            String[] first_scan = line.split(" tvg-name=\" ", 2);
            String first = first_scan[1];               // <--- out of bounds

            String[] second_scan = first.split(" \"tvg-logo= ", 2);
            String second = second_scan[0];

            name_channels.add(second);

        } else {
            //...           
        }
    }
    for (int i = 0; i < name_channels.size(); i++) {
        System.out.println("Channel: " + name_channels.get(i));
    }
} catch(Exception e) {
    System.out.println(e);
}

2 个答案:

答案 0 :(得分:1)

所以你有这样的例子

#CH id="" tvg-name="Example1" tvg-logo="http... 

并尝试拆分这些字符串

" tvg-name=\" "
" \"tvg-logo= "

这些字符串都不在示例中。附加了一个虚假的空格,第二个开头的空格放在错误的位置。

修复字符串,这是一个简洁但完整的程序演示

interface Split {
    static void main(String[] args) {
        String line = "#CH id=\"\" tvg-name=\"Example1\" tvg-logo=\"http...";

        String[] first_scan = line.split(" tvg-name=\"", 2);
        String first = first_scan[1];               // <--- out of bounds

        String[] second_scan = first.split("\" tvg-logo=", 2);
        String second = second_scan[0];

        System.err.println(second);
    } 
}

当然,如果您有任何以'#'开头但不匹配的行,您也会遇到类似的问题。

使用正则表达式和捕获组可能会做得更好。

答案 1 :(得分:0)

tvg-name=\"中最后一个双引号后面有一个空格,该空格与您示例中的数据不匹配。

当对line.split(" tvg-name=\"", 2)使用split时,返回数组的第一项将是#CH id="",第二部分将是Example1" tvg-logo="http..."

如果要获取tvg-name=的值,则可以将正则表达式与捕获组一起使用,在该捕获组中,使用否定字符类[^"]+

不能捕获双引号。

tvg-name="([^"]+)"

try {
    FileInputStream VOD = new FileInputStream("channels.txt");
    BufferedReader buffer_r = new BufferedReader(new InputStreamReader(VOD));
    String line;
    ArrayList<String> name_channels = new ArrayList<String>();

    while((line = buffer_r.readLine()) != null ){
        if(line.startsWith("#")){
            String regex = "tvg-name=\"([^\"]+)\"";
            Pattern pattern = Pattern.compile(regex);
            Matcher matcher = pattern.matcher(line);

            while (matcher.find()) {
                name_channels.add(matcher.group(1));
            }
        } else {
            // ...
        }
    }
    for(int i = 0; i < name_channels.size(); i++){
        System.out.println("Channel: " + name_channels.get(i));
    }
}catch(Exception e){
    System.out.println(e);
}