大型存储解决方案

时间:2014-04-09 10:01:13

标签: storage

我们是第三世界国家的小型自助式ISP,其带宽通常昂贵且缓慢。我们最近有一个客户需要存储解决方案,主要是视频文件的TB(其电视台)。问题是我知道我的方式在Linux,但我从来没有做过这样的事情。我们有一个backblaze 3存储盒外壳,我们正考虑将其用作存储服务器。服务器将直接连接到客户,因此它不会通过互联网,因为在这个地区100 + mbps的速度闻所未闻。

我正在考虑使用全部使用ext4格式化的4TB HDD,并使用LVM使它们成为一个大容量(至少50-70tb)。因此,客户登录到类似客户端的FTP并转储他/她想要的任何文件。但客户只看到一个卷,我们可以随着需求的增加增加空间。当然,这只是初步研究的论文,因为我没有这种系统的先前经验。此外,我必须考虑成本,因此不能采用任何专有解决方案。

我的问题是:

  • 这可能是解决这个问题的最好办法吗?那里有同样好的或更好的解决方案吗?

  • 对于大型存储解决方案(至少对我来说很大),在处理数据损坏和HD故障时,我的成本效益选择是什么。

很想听到你们可能有的任何其他解决方案和提示。谢谢!

2 个答案:

答案 0 :(得分:1)

ZFS可能是一个不错的选择,但目前还没有针对Linux的原生无错解决方案。在这种情况下,我会推荐其他操作系统。

今天我推荐企业磁盘上的Linux MD raid5或消费者/桌面磁盘上的raid6。我不会将超过6个磁盘分配给一个数组。然后可以使用LVM将阵列绑定到适合ext4的逻辑卷。

ext4文件系统经过良好测试和稳定,而XFS可能更适合大文件存储。 XFS的缺点是无法缩小XFS文件系统。我更喜欢ext4,因为它更灵活。

请注意,即使您将数据存储在raid-arrays上,仍然需要备份。数据可能会无声地损坏或被意外删除。

最终,一切都取决于客户的需求。告诉客户服务价格通常会对要求产生影响。

答案 1 :(得分:1)

我想补充一下mingalsuo给出的答案。正如他所说,这实际上取决于客户的要求。您没有说明客户将对此数据执行哪些操作。它仅用于存档吗?他们会主动传输数据吗?你对这个项目的预算是多少?这些类型的答案将更好地确定建议的解决方案。以下是基于许多假设的一些选项。也许其中一个将非常适合您的项目。

CAPACITY: 在这种情况下,您并不关心性能,而是对容量更感兴趣。在这种情况下,锭子的数量并不重要。正如Mingalsuo所说,将一组RAID-6 SATA阵列组合在一起并使用LVM来产生大量音量。

小企业表现: 在这种情况下,您需要性能。客户将存储文件,但也需要能够同时存储少量数据流。在这里你需要尽可能多的锭子。对于流式传输,关注控制器缓存的大小几乎没有什么用处。只关注锭子的数量。你想要尽可能多的。请记住,重建故障驱动器的时间会随驱动器的大小而增加。并且,在重建期间,您的表现将受到影响。出于这些原因,我建议使用更小的驱动器。也许最多1TB驱动器。这将为您提供更快的重建时间和更多用于流式传输的主轴。

企业绩效: 在这里,您需要高性能 - 类似于企业所需的性能。您需要许多同步数据流,并且需要性能。在这种情况下,我会远离SATA驱动器,而是使用900G或1.2TB SAS驱动器。我还建议您考虑从服务器层抽象存储层。创建Linux服务器并使用iSCSI(或光纤)连接到存储设备。这将允许您在可能的情况下进行负载平衡,或者至少可以使灾难恢复变得更容易。

非传统解决方案: 您说环境与互联网的高速连接很少。同样,根据要求,您仍然可以考虑云存储。听我说:)让我们假设这些文件将在今天上传,用于下周或月份,然后很少阅读。在这种情况下,除了归档之外,这些文件无需任何理由就坐在(可能)昂贵的磁盘上。将这些活动文件保存在昂贵的(本地)磁盘上,直到它们退出"之后才会更好。然后将它们移到更便宜的磁盘上?有解决方案可以做到这一点。例如,一个叫做StorSimple。这是一个包含SAS(甚至是闪存)驱动器的设备,并使用云存储来自动迁移退役的#34;数据从本地存储到云存储。由于这些数据已经退役,因此将其移至云端的时间超过正常时间并不重要。并且,此设备在访问时会自动将其从云端恢复到本地存储。对于您的项目,此解决方案可能过于昂贵,但您可能会发现类似的解决方案对您有用。这样做的另一个好处是,您的数据会由云提供商自动备份,您可以随意使用无限量的存储空间。