如何在Java中有效地管理文件系统上的文件?

时间:2010-06-11 11:08:29

标签: java web-services file save filesystems

我正在创建一些JAX-WS端点,为此我想保存收到和发送的消息以供以后检查。为此,我计划将消息(XML文件)保存到文件系统中,在一些合理的层次结构中。每天将有数百甚至数千个文件。我还需要为每个文件存储元数据。

我正在考虑将元数据(只是几个字段)放入数据库表中,但是XML文件将内容本​​身放入文件系统中的文件中,以免数据库内容数据膨胀(很少读取)。 / p>

是否有一些简单的库可以帮助我保存,加载,删除等文件?自己实现它并不是那么棘手,但我想知道是否有现有的解决方案?只是一个简单的库,已经提供了对文件系统的轻松访问(最好是通过不同的操作系统)。

或者我是否需要它,我应该使用原始/自定义Java吗?

2 个答案:

答案 0 :(得分:6)

  

是否有一些简单的库   帮助我保存,加载,删除   等文件?这不是那么棘手   我自己实现它,但我想知道   如果有现有解决方案?只是   一个已经提供的简单库   轻松访问文件系统(最好   在不同的操作系统上)。

Java API

好吧,如果您需要做的事情非常简单,那么您应该能够使用java.io.File(删除,检查存在,读取,写入等)以及使用{{进行一些流操作来实现您的目标。 3}}和FileInputStream

您还可以使用Apache FileOutputStream及其便捷的commons-io来获取更多实用功能。

Java独立于操作系统。您只需确保使用File.pathSeparator,或使用构造函数File(File parent, String child),这样就不需要明确提及分隔符。

Java文件API相对较高,可以抽象出许多操作系统的差异。大部分时间都足够了。只有当您需要一些不在API中的相对特定于操作系统的功能时,它才有一些缺点,例如:检查磁盘上文件的物理大小(不是逻辑大小),* nix上的安全权限,硬盘驱动器的可用空间/配额等。

大多数操作系统都有内部缓冲区用于文件写入/读取。使用FileOutputStream.writeFileOutputStream.flush确保数据已发送到操作系统,但不必写入磁盘。 Java API还支持这种低级集成,以管理系统(如数据库)的这些缓冲问题(例如FileUtils)。

文件和目录都是File抽象的,您需要查看isDirectory。这可能会令人困惑,例如,如果您有一个文件x和一个目录/x(我不记得究竟如何处理这个问题,但有一种方法)。

网络服务

如果文件很大,Web服务可以使用xs:base64Binary传递数据,也可以使用here(消息传输优化机制)。

<强>交易

请注意,数据库是事务性的,而文件系统则不是。因此,如果操作失败并重新尝试,您可能需要添加一些检查。

您可以使用涉及某种形式的分布式事务的复杂设计(请参阅此MTOM),或尝试使用更简单的设计来提供您所需的稳健性级别。可能的设计可能是:

  • 更新。如果用户想要覆盖文件,则实际创建一个新文件。逻辑文件名和物理文件之间的间接级别存储在数据库中。这样,您一旦写入就不会覆盖物理文件,以确保回滚一致。
  • 创建的。用户想要创建文件时的相同故事
  • 删除的。如果用户想要删除文件,则只能在数据库中执行此操作。定期作业轮询文件系统以识别未在数据库中列出的文件,并将其删除。此两阶段删除可确保可以回滚删除操作。

这不像在实际事务数据库中写入BLOB那样健壮,但提供了一些健壮性。你可以看看answer,但我觉得这个项目已经死了(2007)。

答案 1 :(得分:0)

DataNucleus,一个Java持久性提供程序。这种情况有点太重,但它支持具有不同数据存储(RDBMS,对象存储,XML,JSON,Excel等)的JPA和JDO java标准。如果产品已经在使用JPA或JDO,则可能值得考虑使用NataNucleus,因为将数据保存到不同的数据存储区应该是透明的。我想DataNucleus支持将数据拆分成几个文件,创建我想要的合理目录/文件结构(在我的问题中),但这只是猜测。

对XML和JSON的支持似乎是实验性的。