我在这里解析一些文件夹名称。我有一个程序,列出文件夹的子文件夹并解析文件夹名称。
例如,一个文件夹可以这样命名:
" Folder.Name.1234.Some.Info.Here-ToBeParsed"
我想解析它,因此名称将是"文件夹名称"。目前,我首先使用string.replaceAll()来删除特殊字符,然后有这个4位数的序列。我想在那一点上拆分字符串。我怎样才能做到这一点?
目前我的代码看起来像这样:
// Parsing string if regex p matches folder's name
if(b) {
//System.out.println("Folder: \" " + name + "\" contains special characters.");
String result = name.replaceAll("[\\p{P}\\p{S}]", " "); // Getting rid of all punctuations and symbols.
//System.out.println("Parsed: " + name + " > " + result);
// If string matches regex p2
if(b2) {
//System.out.println("Folder: \" " + result + "\" contains release year.");
String parsed_name[] = result.split("20"); // This is the line i would like to split when 4-digits in row occur.
//System.out.println("Parsed: " + result + " > " + parsed_name[0]);
movieNames.add(parsed_name[0]);
}
或许有更简单的方法可以做到这一点?提前谢谢!
答案 0 :(得分:1)
你应该保持这样简单:
String name = "Folder.Name.1234.Some.Info.Here-ToBeParsed";
String repl = name.replaceFirst( "\\.\\d{4}.*", "" ).
replaceAll( "[\\p{P}\\p{S}&&[^']]+", " " );
//=> Folder Name
replaceFirst
正在删除DOT和4位数后的所有内容replaceAll
正在用一个空格替换所有标点符号和空格(撇号除外)