大量文件的文件管理

时间:2013-09-10 20:07:55

标签: sql-server xml windows relational-database

在开始之前,我想对我在stackoverflow上获得的所有洞察力以及所有贡献者表示感谢。我有一个关于管理大量文件的一般问题。我试图确定我的选择,如果有的话。在这里。

目前,我有大量文件,我在Windows 7上。我一直在做的是根据需要一起处理的内容将文件复制到文件夹中对文件进行分类。所以,我有一个包含按日期(长期存储)的文件和另一个包含按类别的副本(用于处理和计算)的文件集。当然,这每次都会使我的数据翻倍。现在我不得不创建一组以上的类别;准确地说是3份。这使我的数据翻了两番。

对于处理方面的事情,数据最终以excel结尾。最初,所有的数据都是excel。然后在excel中执行所有组织和过滤。这是耗时的并且长期不易维护。后来工作负荷转移到文件系统本身,这减轻了excel的工作。

它的长短是因为磁盘空间的使用非常低效。什么是更好的处理方式?

想到的事情:

  1. 重叠文件夹
    • 有没有办法创建一个只保存文件地址的文件夹,而不是复制文件。这样我可以有两个文件夹引用同一个文件。
    • 据我了解,文件夹是列出其中文件内存地址的文件,但在Windows上,文件只能包含在一个文件夹中。
  2. Microsoft SQL Server
    • 不确定这里可以做些什么。
  3. 符号链接
    • 我不是管理员,所以我无法执行mklink命令。
    • 另外,我不确定这方面的任何性能问题。
  4. 一个交界处
    • 显然不允许单个文件,只允许使用Windows中的文件夹。
  5. 搜索文件夹(* .search-ms)
    • 也许我错过了什么,但据我所知,没有办法指定要列出的单个文件。
  6. 哈希文件
    • 为所有文件创建哈希标记,允许将文件存储一次。但后来我不知道如何处理哈希标签。
  7. XML
    • 也许我可以使用xml文件将元数据附加到文件中,并以某种方式使用它们进行搜索。
  8. 数据库文件系统
    • 我最近在搜索中遇到了这个概念。不确定它将如何应用Windows。

1 个答案:

答案 0 :(得分:0)

我找到了部分解决方案。首先,我发现我使用的笔记本电脑实际上是以管理员身份登录的。作为选项3和4的替代,我决定使用硬链接,它们是NTFS文件系统的一部分。但是,由于文件数量很大,使用提升的命令提示符中的以下命令无法管理:

mklink /h <source\file> <target\file>

幸运的是,Hermann Schinagl已经为Windows资源管理器创建了Link Shell Extension应用程序,并且非常有见地阅读了Junction,Symbolic Links和Hard Links的工作方式。这是目前部分解决方案的唯一原因是由于Windows资源管理器存在单独的问题,我打算将其作为单独的问题发布。谢谢赫尔曼。