最近,我读了一篇文章,题为 "SATA与SCSI的可靠性".它主要讨论了非常高的速率位翻转在消费者SATA驱动,并得出结论"一56%的机会,你可以不读的所有数据从一个特别的盘现在"。甚至Raid-5不能拯救我们,因为它必须不断进行扫描的问题和如果盘不会死的你是相当多的保证有一些翻位上你的重建文件系统。

考虑:

我听说伟大的事情关于太阳的 容量Raid-Z 但是Linux和BSD实现仍然是实验性的。我不确定它已经准备好为总理的时间。

我也读了不少的 Par2 文件格式。这似乎是一些额外的储存%奇偶校验每个文件会让你恢复最多的问题。然而,我不知道还有文件系统,该系统不会这一内部和它看来似乎可能会难以管理的单独的文件。

备份的(编辑):

我的理解是,备份是至关重要的。然而,如果没有某种检查的地方你可以很容易地被发送错误的数据给人们甚至不知道它。也弄清楚它备有良好的副本,数据可能是困难的。

例如,你有一个Raid-5阵列的运行了一年,你找到一个损坏的文件。现在你要回去检查你的备份,直到你找到一个很好的副本。理想情况下你会去的第一份,包含该文件,但可能很难弄清楚,特别是如果文件已经编辑了许多倍。更糟糕的是,如果考虑该文件是所附或编辑的后腐败的发生。这仅仅是有足够的理由为框级奇偶校验如Par2.

有帮助吗?

解决方案

容量是一个开始。许多储存的供应商提供520B驱动的额外数据保护。然而,这仅可以保护你的数据,尽快进入存储物。如果这是破坏在东道一级,然后你欺骗了。

在地平线上有一些有前途的基于标准的办法解决这个问题。终端到终端数据保护。

考虑T10DIF(数据的完整性场)。这是一个新出现的标准(这是起草了5年前)和新技术,但它具有的崇高目标的解决问题的数据的腐败。

其他提示

该条大大夸大了问题的误解,来源。它假定这些数据的损失事件是独立的,即,如果我拿一千盘,以及获得五百错误,这可能是一个每个月五百盘。但实际上,因为任何人已经盘麻烦知道,它可能是五百错误,在一个磁盘上(仍然很小一部分的磁盘的总容量),而其他九百九十九的罚款。因此,在实践中这是不是有56%的机会,你可以不读到的所有磁盘,相反,它可能是更多喜欢1%或更低,但大多数人中,1%将发现他们已经失去了几十个或几百个部门,即使磁盘作为一个整体并没有失败。

确保足够的、实用的实验反映这种理解,而不是提供在文章。

基本上这就是一个例子"中国的窃窃私语".文章链接,这里指的是另一篇文章,这又是指间接向出版的纸张。报纸上说,当然这些事件 不是独立的 但是,至关重要的事实上消失,在过渡到容易消化博格式。

56%的机会,我不能读的东西,我对此表示怀疑。我运行一个混合的袭5和其他东西,只是良好的备份的做法,但与袭5和一个热备我还没有数据丢失,所以我不知道有什么大惊小怪。如果你存储奇偶校验的信息...以及你正在创建一个RAID系统使用软件、磁盘故障在R5结果在一个偶像检查,以找回丢失的磁盘数据,所以...它已经存在。

运行突袭,将数据备份,你被罚款:)

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top