这个问题很常见。两个解决关键。第一,任何时候不使用不必要的raid(包括raid1);第二,定期备份,最好是排程异地备份。出错的时候步骤应该是直接将备份机切换为主机,主机离线检查硬盘,替换后重建raid,如果无法重建,替换掉坏盘后,将切为主机的备份机重新备份过来,完成后切换主机上线。数据安全靠的就是冗余,不仅仅是磁盘的冗余,重要的是系统的冗余(当然,不要求服务连续不中断的话,系统配置可以不一致,成本会降低很多,比如NAS就可以用DAS做冗余系统备份了),可以参考数据中心的机制(基于SAN的远程灾难恢复),基本也就是上面所说那样。至于对应NAS的功能,Rsync和RTRR,是比任何等级raid都可靠的功能。另外还可以将重要但不敏感的数据备份至数据备份服务提供商的数据中心服务器上(即所谓云备份),目前常见流行的有Amazon S3、ElephantDrive还有Symantec等提供这种服务(不是所谓网盘那种)。以上是在线备份,完整备份还要包括近线备份和离线备份,近线备份以DAS、离线备份以磁带、光盘形式保存。在线数据尤其是提供关键服务的数据,其成本是非常高的。但从另一个方面来说,与丢失数据后找数据恢复服务提供商恢复数据相比,任何形式与层级的备份,其成本都要低得多。
PS.这跟硬件raid还是软件raid无关,都一样的。你可以把整个NAS看成一张raid卡。即便是硬件raid,卡坏掉的时候也一样的情况。找不到一模一样的卡和固件的时候,多半就像楼主形容的情况了。raid与数据安全无关,raid从诞生那天起,关注的就不是数据安全,而是性能,以及如何降低提供连续无中断服务的成本,尤其是在提高性能与容量的同时。各级raid的区别,也仅仅是性能、成本与可维护性上的平衡而已。 |