U-NAS 硬盘检测及修复 |
U-NAS包含了硬盘检测功能,包括了SMART检测及坏道扫描。
S.M.A.R.T.机制能够监控硬盘的信息状态。坏道扫描可以对硬盘进行坏道扫描。 一、硬盘故障因素 硬盘的故障有很多种,但基本可以分为两类:渐进性和偶发性。 1、渐进性故障:是随着使用时间的推移而缓慢发生的,并且在使用期间会露出一定的蛛丝马迹。此类故障中包括软件故障和硬件故障。比如,硬盘的主轴马达是会逐渐磨损的,但远在彻底损坏之前,盘片运转时的声音肯定会出现异常。此外,磁盘介质的稳定性下降等故障也属于渐进性故障 。根据这一特点,可以通过S.M.A.R.T此类实时信息检测技术监测其属性来进行故障预测、分析和提供建议,从而加以防范。 2、偶发性故障:故障是偶然出现的,之前没有任何迹象。比如,电路板芯片烧毁,突发的撞击导致磁头、介质损坏等故障。通常是在S.M.A.R.T反映出性能下降之前,硬盘就已经不能工作。而这些只可通过质量、设计、工艺、制造等方面的改进以及使用过程中规范操作来降低不可预测故障的发生率(例如硬盘防震技术的开发和进展,有效降低了硬盘震动物理故障的概率)。 对于防止偶发性故障的发生,的确很难,现在比较认可的,就是硬盘读写操作时不要使硬盘受到振动或撞击,即使未通电状态下,也要尽可能避免震动;保证电源的功率以及电压的稳定;避免电路板上的芯片受静电击穿等等。即使做到了这些,有时仍然难以避免偶发性故障,主要原因在于其不可预知性。 # ![]() 相对来讲,渐进性故障因为有“蛛丝马迹”可循,从而具备一定的预知性,可以使重要数据的提前备份成为可能,避免了“灾难性”的后果。这就需要用到S.M.A.R.T的工作机理了。8 Y3 V9 y& | l" i1 n 8 B. Q6 I0 Z" h 二、S.M.A.R.T的构成 1、S.M.A.R.T在何处?如何工作? S.M.A.R.T信息保留在硬盘的系统保留区(Service Area)内,这个区域一般位于硬盘0物理面的最前面几十个物理磁道,由厂商写入相关内部管理程序。除了S.M.A.R.T信息表外还包括低级格式化程序、加密解密程序、自监控程序、自动修复程序等。监测软件通过一个名为“SMART Return Status”的命令(命令代码为:B0h)对S.M.A.R.T信息进行读取,且不允许最终用户对信息进行修改。 不过,S.M.A.R.T技术自身提供了访问指令,可以由主板BIOS程序以及一些工具软件通过执行该指令对硬盘的S.M.A.R.T状态进行访问,并输出结果。从而实现了对硬盘健康状态的监测,间接发挥了对数据的安全保护作用。5 s7 i' d& V( U' B 2、S.M.A.R.T信息表由什么组成?7 |+ c G4 e% T! o7 A/ M S.M.A.R.T标准中采用二进制代码作为S.M.A.R.T的基本指令,并规定写入标准的寄存器中,形成特定的S.M.A.R.T信息表,以供正常检测和运行。S.M.A.R.T指令分主指令(Command)和次指令(Subcommands)。主指令主要提供设备是否支持S.M.A.R.T或忽略某一次指令特征的信息。而次指令则提供支持S.M.A.R.T设备的检测信息。这些指令主要由设备厂商写入,一些专业硬盘维修软件可以通过这些代码进行设备的检测。 B$ w, U- Q; H & m& f" w9 J3 g S.M.A.R.T状态以表的形式输出结果,表中很直观的体现了S.M.A.R.T的构成。一幅完整的S.M.A.R.T表由以下几项构成: ID(属性标识码)、Attribute Description(属性描述)、Value(属性当前值)、Worst(属性最坏值)、Threshold(阈值)、Data(数据记录)、Status(状态)。; A# { V1 Z0 n$ N2 X! D$ y ![]() 根据S.M.A.R.T属性本身的含义以及对硬盘故障预知的重要性不同,可以分为关键属性(Critical Attributes)和资料属性(Informative Attribute)。1 v( J6 d: w# L ①关键属性(Critical Attributes):对硬盘的使用寿命、各机械组件的渐进性故障具有一定的监测作用。阈值(即U-NAS中的界限值)不是零的,属于关键属性 ②资料属性(Informative Attribute):反馈硬盘的相关运行记录供参考。阈值(即U-NAS中的界限值)是零的,则属于资料属性1 Q3 `6 z6 ]" ]2 T ID 属性描述 01 Raw Read Error Rate 底层数据读取出错率7 D' h# I, K1 c5 V. U' v* R # M! X% x4 n+ _4 Q( z ( }& p* v2 k1 O, z 03 Spin Up Time 主旋马达旋转到指定转速的时间 04 Start/Stop Count 主旋马达启动/停止次数 e; `) H3 M R: U 05 Reallocated Sector Count 重新分配扇区的数量 (此项中“原始资料”不为零时,说明此硬盘已存在不稳定扇区,即已经有物理坏道了,无法修复) 07 Seek Error Rate 寻道出错率 09 Power-On Time Count 加电累计时间! y. }1 V* M B1 o' S 10(0A) Spin Retry Count 主旋马达重新旋转到指定转速的累计次数4 b6 N2 v8 ~! n 11(0B) Calibration Retry Count 磁头校准重试次数 12(0C) Power Cycle Count 硬盘加电次数" z3 m2 F# B9 ? ` 192(C0) Power-Off Retract Count 硬盘断电回复次数 193(C1) Load/Unload Cycle Count 磁头载入、载出次数 194(C2 ) Temperature 温度 196(C4) Reallocation Event Count 重新映射扇区数据转移操作次数4 B) p. h1 k6 J* ] 197(C5) Current Pending Sector Count 当前待映射扇区数量 (此项中“原始资料”不为零时,说明硬盘已经有坏道,但多数情况为逻辑坏道,一般均可修复) 198(C6) Off-Line Uncorrectable Sector Count 离线不可纠正扇区数量 (此项中“原始资料”不为零时,说明硬盘已经有坏道,可尝试修复) 199(C7) Ultra ATA CRC Error Rate Ultra AT A数据传输出错率 (通信接口错误计数,数据线或接口接触不良的次数,对硬盘无影响) 200(C8) Write Error Rate 扇区写操作出错率+ a0 R* \9 U$ r: T# e) u: E! ? # e* Q3 ]! X8 e; G 9 }& Z E8 X F- p 三、尝试修复硬盘 当出现197(c5)、198(c6)警告时(即其原始资料数不为零),可以通过对此硬盘进行擦写来尝试修复。如果错误为物理坏道,那么将不会修复;如果为逻辑坏道,那么进行硬盘擦写可修复好硬盘。 对硬盘擦写是对全盘使用零来填充硬盘,若硬盘中存在数据,需进行备份。+ _' n5 B" Y7 J- m0 G/ i3 i 在Linux下进行硬盘修复: 通过SSH登录linux系统,然后使用dd命令来填充硬盘 例如,硬盘/dev/sdb出现197错误,那么使用零(zero)对硬盘进行擦写操作,注意备份硬盘中的数据。 # dd if=/dev/zero of=/dev/sdb & K; @4 R X& A% q 1 K1 P. F7 d, ^' H) n& `- G& H 在Windows下修复:& q/ w( R; @5 i9 Q' A- w 将待修复硬盘插入Windows PC机中,使用工具HD tune来对硬盘进行擦写。4 v0 m8 R# f8 I$ L ![]() |
哈哈,也是u-share的老帖子了,没看过? |