解析java的doc文件的文件名

时间:2013-06-04 16:04:55

标签: java string-parsing

我想使用java解析多个doc文件(MS office)的文件名。 我该怎么做呢?

我能够找到一个从文档本身提取信息的API,但我不能 找到有关文件名本身的信息。

所以说我有一个doc文件XX_232312_22,我想解析文件名(即232312部分)。

编辑:如果我们需要解析的不仅仅是一个文件,我们会怎么做? 例如,一个目录中的所有1000个文件?

2 个答案:

答案 0 :(得分:1)

String[] parts = filename.split("-");
parts[0] // part before dash
parts[1] // part after dash

您可以在java docs:http://docs.oracle.com/javase/6/docs/api/java/lang/String.html#split%28java.lang.String%29

中查找String.split

编辑:

OP将文件名的格式更改为XX_filename__00。

然后是

String[] parts = filename.split("_");
parts[0] // part before first _
parts[1] // part between two _
parts[2] // part after second _

答案 1 :(得分:0)

这应该适合你。

fileName.split("-")[0]