S.M.A.R.T

发布于 2020-02-13  409 次阅读


S.M.A.R.T(Self Monitoring Analysis and Reporting Technology / 自我监测、分析与报告技术) 是为了提高硬盘数据的安全性而开发的。它可以使硬盘实时检查自身的状态,通过一定机理及时分析出潜在的问题,报告给系统,有时甚至能给出预计的硬盘故障日期,实际就是一种预警技术。这个功能可以比较客观的反映硬盘目前的健康状况。

Value/Current(当前值) 当前硬盘改属性的值。
Worst(最坏值) 该属性出现过的峰值。
Threshold/Warn(阈值 / 临界 / 极限值) 硬盘厂商所规定的该属性峰值。如果某个属性超过 Threshold 规定的极限值时,就表示你的硬盘可能出现了问题。
Raw Values/Data (Raw 值 / 数据) 。和该属性有关联的数据总值。

怎么看这类属性?
主要是看 Raw 和 Worst 的值是否还在临界值之内 (> 或<临界值)
一般使用软件如 HDTune、CrystalDiskInfo 等,一般属性中有黄色或者红色你就要注意了,硬盘可能快坏了,要是还在保修期内,就赶紧备份数据,送去检修。
下面我们来介绍各个属性 (按 2010 年 2 月 11 日 维基百科 上的解释)
ID Hex = 英文属性名 / 中文属性名 属性描述


01 01 =Read Error Rate / (底层) 数据读取错误率
指从磁盘表面读取数据时发生的硬件读取错误的比率,Raw 值对于不同的厂商有着不同的体系,单纯看做 1 个十进制数字是没有任何意义的。

  • 以上为 Wiki 上的英文翻译版本,此属性貌似存在分歧,有的说值高了好,有的说低了好, 此处我们还是按照 Wiki 上的吧,反正只要 Worst 不小于 Threshold 就行了。
    ** 这里的 Raw 值也可能不同,比如我笔记本上的 ST 硬盘就 Raw 为 0,而台式机上 1.5T 的 ST 就为 227901540。

02 02 =Throughput Performance / 吞吐性能 (读写通量性能)
Raw 值越高越好
整体 (普通) 的硬盘驱动器的吞吐性能。如果这个属性的值一直在下降有很大的可能性是硬盘有问题了。

  • 一般在进行了人工 Offline S.M.A.R.T. 测试以后才会有值。

03 03 =Spin-Up Time / 马达旋转到标准转速所需时间
Raw 值越低越好
主轴旋转加速的平均时间 (从零转速到完全运转 (标准转速)[毫秒])。
单位也可能为秒。
如果是 0 的话证明这一项没有读对,或者是这一项的数据生成错误。不应该出现 0 的结果。

04 04 =Start/Stop Count / 启动 / 停止计数
马达 启动 / 停止 周期的计数。当马达启动或硬盘完全停止工作后 (断开电源) 启动和硬盘从睡眠模式回复到先前状态,计数都会增加。

  • 一般来说开机一次这个就加 1,也可以看做是通电次数,这一般是个寿命参考值,本身不具有任何指标性,购买硬盘时可以参考此值。

05 05 =Reallocated Sectors Count / 重新配扇区的计数
Raw 值越低越好
对重新分配的扇区的计数,当硬盘发现一个 读取 / 写入 / 校验 错误时它将这个扇区标示为 “重新分配”,并且将数据传输到一个特殊的保留区(空闲区)。这个过程也称为是“重定向”,这个重新分配的扇区叫做“重新映射”。这就是为什么,现在的硬盘当进行表面测试的时候是找不到“坏块” 的,所有的坏块都被隐藏在重新分配的扇区中。然而,随着重新定位的扇区增加,读取 / 写入速度趋向于降低。Raw 值通常代表一系列已经发现和重映射的坏扇区,因此,这个属性值越高,硬盘就有越多的扇区被重定位,所以这个值是越小越好。

  • 理想情况下这个值应该为 0,如果不为 0 也不要太惊慌,而是应该比较密切的关注这个值的变化情况:如果连续几周没有变化,那你应该可以放心的继续使用比较长的一段时间;如果这个值持续攀升,那么请尽快备份所有数据,并考虑购买新硬盘。

06 06 =Read Channel Margin / 读取通道边界
读取数据时通道的边界,这个属性的功能并不明确

07 07 =Seek Error Rate / 寻道错误率
磁头寻道错误的比率,如果机械定位系统中有局部的故障,那么寻道错误率会增加,这种故障是多种因素造成的。Raw 值对于不同的厂商有着不同的体系,单纯看做 1 个十进制数字是没有任何意义的

08 08 =Seek Time Performance / 寻道时间性能
Raw 值越高越好
磁头寻道操作的平均性能,如果这个属性的值持续下降,这是机械子系统有问题的标志

09 09 =Power-On Hours (POH) / 累计通电时间
Raw 值越低越好
通电时间计数,Raw 值显示在通电状态下的总小时数 (或者是 分钟,秒,取决于制造商)
磁盘加电时间。初始值的字段显示为此装置总开机时间的累计。

  • 参考磁盘厂家给的该款硬盘的 MTBF(平均故障间隔时间) 可以估计故障概率。但是也有可能超过 MTBF 而不会出现故障,因为统计数据对于个体来说是不精确的,是一个寿命参考值,本身不具任何指标性。
    ** 购买硬盘时可以看此值,新的硬盘一般为 0 或者几十以内,过分大的可能就是被人用过了。

10 0A =Spin Retry Count 或 Spin-up Retry Count / 旋转重试计数 或 马达重试计数
Raw 值越低越好
马达重试启动尝试的的总数,这个属性存储马达尝试启动的到全速运转 (第一次尝试失败的情况) 的总数,这个属性的值的上升,是硬盘机械子系统有问题的标志

  • 理想情况应该为 0,在某些情况下可能人为造成这个值的非故障升高,比如电压供给不足。

11 0B =Recalibration Retries / 校准重试
Calibration_Retry_Count / 校准重试计数
Raw 值越低越好
这个属性指被要求重新校验的次数 (第一次尝试失败的情况下)。这个属性的值的上升,是硬盘机械子系统有问题的标志

12 0C =Power Cycle Count / 通电周期计数
这个属性是指这个硬盘电源 开 / 关 周期的总数。
这是个寿命参考值,本身不具任何指标性。

13 0D =Soft Read Error Rate / 软件读出误码率 (可校正读出误码率)
Raw 值越低越好
报告给操作系统的未修正的读取错误。
高值暗示有扇区不稳定。

183 B7 =SATA Downshift Error Count / SATA 降档错误计数
西部数据和三星的属性。

184 B8 =End-to-End error / 端对端错误
Raw 值越低越好
这个属性是 HP 的 SMART IV 技术的一部分,它表示传输通过高速缓存内存数据缓冲区后主机和硬盘驱动器间的校验数据不匹配。

185 B9 =Head Stability / 头稳定性
西部数据的属性。

186 BA =Induced Op-Vibration Detection / 感应运算振动检测
西部数据的属性。

187 BB =Reported Uncorrectable Errors / 反馈无法校正的错误
Raw 值越低越好
不能使用硬件 ECC 恢复的错误总数。

188 BC =Command Timeout / 命令超时
Raw 值越低越好
因为 HDD 超时导致放弃操作的数量,通常情况下,这个属性值应该等于 0,如果这个只远远高于 0,那么,很可能电源供应有很严重的问题,或者数据线被氧化。

189 BD =High Fly Writes / 高飞写入
Raw 值越低越好
HDD 生产商实现 一个飞行高度监视器来尝试对于检测到记录头正在飞出它的正常操作范围时的写入操作提供额外的保护,如果发生不安全的飞行高度条件,写入进程停止工作,信息将被重写或者重定向到磁盘上一个安全的区域。这个显示在硬盘生命周期内检测到的这些错误的总数。这个特性实现在大多数现代的希捷驱动器和一些西部数据的驱动器中,西部数据驱动器开始于 WD 企业级 WDE18300 和 WDE9180 Ultra2 SCSI 硬盘驱动器,它将被包含在未来所有西部数据企业级产品中。

190 BE =Airflow Temperature (WDC) / 气流温度 (西部数据)
Raw 值越低越好
西部数据硬盘上的气流温度 (和[C2] 的 Temperature 数值一样,但是在有些型号上臂当前值会少 50. 此值已经废弃了)。

190 BE =Temperature Difference from 100 / 从 100 开始的温差
Raw 值越高越好
值和 (100 – 温度 °C) 相同, 允许制造商对于符合的最高温度设置一个最小限制 (可能是希捷专有?)。

191 BF =G-sense Error Rate / 加速度错误率 或 震动侦测错误率
Raw 值越低越好
因外来的冲击和震动导致的错误数。

192 C0 =Power-off Retract Count / 断电磁头缩回计数
Emergency Retract Cycle Count (Fujitsu) / 紧急回缩周期计数 (富士通)
Raw 值越低越好
磁头被载离媒体的次数计数。磁头能在没完全断电的前缩回。

  • 这个属性所显示的数字表示这块磁盘自动关机 (突然断电) 的次数。

193 C1 =Load Cycle Count / 磁头伸出周期计数
Load/Unload Cycle Count (Fujitsu) / 磁头升降周期计数 (富士通)
Raw 值越低越好
从磁头零区域加载 / 卸载 (升降) 周期的次数。通常的便携式电脑 (2.5 英寸) 加载 (伸出) 周期的寿命为 200,000 到 600,000 , 一些便携式电脑的驱动器被设计成当 5 秒内没有任何活动时就卸载 (缩回) 磁头。许多 Linux 安装程序后台 1 分钟内只写入文件系统几次。因此,每小时可能有 100 或更多次的磁头加载 (伸出) 周期,并且可能在 1 年之内就超出磁头伸出周期额定值。

  • 这是一个寿命参考值,本身不具任何指标性。

194 C2 =Temperature / 温度
Raw 值越低越好
当前的内部温度。

  • 具体温度极限参考硬盘厂家各款硬盘的技术指标。

195 C3 =Hardware ECC Recovered / 硬件 ECC 校正
Raw 值对于不同的厂商有着不同的体系,单纯看做 1 个十进制数字是没有任何意义的。

196 C4 =Reallocation Event Count / 重新分配事件计数
Raw 值越低越好
重新映射操作的计数。这个属性的 Raw 值显示了总的尝试从重新分配扇区转移数据到空闲空间的次数。不管成功与否都会被记录。

  • 这个计数就包含了上次读操作有错误的不稳定扇区。如果下次这些扇区读操作无错误,这个值可能减少。

197 C5 =Current Pending Sector Count / 目前待映射扇区数
Raw 值越低越好
“不稳定” 扇区总数 (因为读取错误,等待重新映射)。如果一个不稳定的扇区随后能成功写入或读取,这个值将降低,这个扇区将不被重新映射。一个读写错误的扇区不会被重新映射 (因为以后它有可能又能读写);取而代之的是,驱动器固件将记住此扇区需要被重新映射。并且会在当其被写入时重新映射。

  • 这里有个问题,即当被固件记录后,有些文章写到只有在写入出错的时候它才会被重新映射,而 Wiki 上的原文是 “and remaps it the next time it's written.” 故这里标记一下。

198 C6 =Uncorrectable Sector Count / 无法校正扇区数
Off-Line Scan Uncorrectable Sector Count (Fujitsu) / 脱机无法校正扇区数 (富士通)
Raw 值越低越好
读写错误不能被校正的扇区总数。这个属性值的升高意味着盘片表面有缺陷或者是机械子系统有问题。

  • 这些扇区目前已经不能读取,如果有文件使用这些扇区,则操作系统会返回读取错误;当下一次写操作发生时硬盘会对扇区自动重定位;同时,重定位扇区计数 (Reallocated Sector Count) 增加,这个值减少。

199 C7 =UltraDMA CRC Error Count / Ultra DMA CRC 错误计数
Raw 值越低越好
在数据传输错通过接口电缆时被 ICRC(接口循环冗余校验) 所确定的错误总数。

  • 如果这个值不为 0,而且继续增加,则表示 硬盘控制器 - 数据线 - 硬盘接口 有错误发生。可以检查一下接口和数据线。

200 C8 =Multi-Zone Error Rate (Western Digital) / 多区域错误率 (西部数据)
Raw 值越低越好

200 C8 =Write Error Rate (Fujitsu) / 写入错误率 (富士通)
Raw 值越低越好
当写入一个扇区时错误的总数。

  • 一般不为零也不要紧,但是如果持续快速升高,暗示盘体 / 磁头机械有问题。

201 C9 =Soft Read Error Rate / 软读出误码率 (可校正读出误码率)
Raw 值越低越好

202 CA =Data Address Mark errors / 数据地址标记错误
Raw 值越低越好
数据地址标记错误 (或供应商特有)

203 CB =Run Out Cancel / ECC 错误发生率
ECC Errors (Maxtor) / ECC 错误 (迈拓)
Raw 值越低越好
ECC 错误的数量。

204 CC =Soft ECC Correction / 软件 ECC 校正
Raw 值越低越好
因软件 ECC 导致的错误总数。

205 CD =Thermal Asperity Rate (TAR) / 过温率
Raw 值越低越好
因温度过高导致的错误数量。

  • 温度过高的频率,代表主轴马达可能受损,或是散热不良。

206 CE =Flying Height / 飞行高度
磁头离盘片表面的高度。太低将增加头部撞击机率,太高将增加读取错误机率。

207 CF =Spin High Current / 旋上高电流
Raw 值越低越好
当前用来使驱动器马达旋转所用的电涌 (电流) 量。

  • 也有资料写:主轴马达旋转时所使用的电流量,耗电量变大意味着轴承可能磨损。

208 D0 =Spin Buzz
因电力不足所启动马达所需的重试次数。

209 D1 =Offline Seek Performance / 离线寻轨性能
驱动器内部测试时的寻道性能。

211 D3 =Vibration During Write / 写入时震动
写入时震动。

212 D4 =Shock During Write / 写入时受冲击
写入时受冲击。

220 DC =Disk Shift / 磁盘移位
Raw 值越低越好
盘片对于轴心的位移距离 (通常是由于冲击或者热涨冷缩), 衡量单位未知。

  • 通常由强烈的撞击或坠落造成。

221 DD =G-Sense Error Rate / 加速度错误率 (震动侦测错误率)
Raw 值越低越好
因外来的冲击和震动导致的错误数。

222 DE =Loaded Hours / 作业时间
数据加载操作时所花费的时间。
(磁头电枢的运动)

223 DF =Load/Unload Retry Count / 磁头升降重试次数
磁头改变位置的次数。

224 E0 =Load Friction / 加载摩擦
Raw 值越低越好
在运行时因机械部分的摩擦而产生的阻力。

225 E1 =Load/Unload Cycle Count / 磁头升降周期计数
Raw 值越低越好
加载 (伸出) 周期总数。

226 E2 =Load 'In'-time / 载入时间
加载磁头的总时间 (不计在停放区所花费的时间)。

227 E3 =Torque Amplification Count / 扭矩放大计数
Raw 值越低越好
尝试弥补盘片速度变化的次数。

228 E4 =Power-Off Retract Cycle / 断电磁头缩回周期
Raw 值越低越好
磁头电枢因为断电自动缩回的次数。

230 E6 =GMR Head Amplitude / 巨磁电阻头振幅
“颠簸”(重复前进 / 后退磁头动作的距离) 的振幅。

231 E7 =Temperature / 温度
Raw 值越低越好
驱动器温度。

240 F0 =Head Flying Hours / 磁头飞行小时
磁头在定位的时间。

  • 这是一个寿命参考值,但本身不具任何指标性。

240 F0 =Transfer Error Rate (Fujitsu) / 传输错误率 (富士通)
数据传输时连接被重置的次数的计数。

241 F1 =Total LBAs Written / 总 LBAs 写入
总 LBAs 写入。

242 F2 =Total LBAs Read / 总 LBAs 读取
总 LBAs 写入。
有些 S.M.A.R.T. 工具报告它的 Raw 值是一个复数,实际是因为它是 48 位而不是 32 位的。

250 FA =Read Error Retry Rate / 读取错误重试率
Raw 值越低越好
从磁盘读取时出现错误的次数。

254 FE =Free Fall Protection / 自由落体保护
Raw 值越低越好
检测到 “自由落体” 的次数。


或许明日太阳西下倦鸟已归时