在n个数字出现后拆分字符串

时间:2015-02-19 18:32:43

标签: java regex digits

我在这里解析一些文件夹名称。我有一个程序,列出文件夹的子文件夹并解析文件夹名称。

例如,一个文件夹可以这样命名:

  

" Folder.Name.1234.Some.Info.Here-ToBeParsed"

我想解析它,因此名称将是"文件夹名称"。目前,我首先使用string.replaceAll()来删除特殊字符,然后有这个4位数的序列。我想在那一点上拆分字符串。我怎样才能做到这一点?

目前我的代码看起来像这样:

// Parsing string if regex p matches folder's name
if(b) {
    //System.out.println("Folder: \" " + name + "\" contains special characters.");
    String result = name.replaceAll("[\\p{P}\\p{S}]", " "); // Getting rid of all punctuations and symbols.
    //System.out.println("Parsed: " + name + " > " + result);

    // If string matches regex p2
    if(b2) {
        //System.out.println("Folder: \" " + result + "\" contains release year.");
        String parsed_name[] = result.split("20"); // This is the line i would like to split when 4-digits in row occur.
        //System.out.println("Parsed: " + result + " > " + parsed_name[0]);
        movieNames.add(parsed_name[0]);
    }

或许有更简单的方法可以做到这一点?提前谢谢!

1 个答案:

答案 0 :(得分:1)

你应该保持这样简单:

String name = "Folder.Name.1234.Some.Info.Here-ToBeParsed";
String repl = name.replaceFirst( "\\.\\d{4}.*", "" ).
         replaceAll( "[\\p{P}\\p{S}&&[^']]+", " " );
//=> Folder Name
  • replaceFirst正在删除DOT和4位数后的所有内容
  • replaceAll正在用一个空格替换所有标点符号和空格(撇号除外)