четверг, 3 мая 2012 г.

S.M.A.R.T. - здоровье жесткого диска

Жесткий диск - сложное электронно-механическое устройство, имеющее свою технологию самодиагностики, которая может предсказать о скором выходе из строя вашего жесткого диска. Что обычно является очень грустным событием...

Технология S.M.A.R.T. (англ. Self Monitoring Analysing and Reporting Technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

Мы не будем рассматривать данную технологию во всех подробностях, т.к. это слишком широкий вопрос и у каждого из производителей накопителей своё видение и количество отслеживаемых параметров. Рассмотрим наиболее важные с практической точки зрения.

Для этого нам потребуется программа для просмотра отслеживаемых параметров.

Скачать Everest

В ней на вкладке "Хранение данных->SMART" выбираем жёсткий диск и в окне показываются отслеживаемые параметры:

01 Raw Read Error Rate - количество ошибок при чтении. У современных дисков очень большая плотность хранения данных, поэтому с ошибками они считывают данные постоянно, а информация восстанавливается за счёт кода коррекции ошибок ECC. Именно эти ошибки и считает этот параметр. В жёстких дисках фирмы Seagate эти некритичные ошибки показываются, остальные производители предпочитают об этом скромно умалчивать. Для дисков Seagate можно считать очень хорошим состояние когда параметры Raw Read Error Rate и Hardware ECC Recovered равны. Это значит что сколько было ошибок столько и было исправлено с помощью кода коррекции. Если же эти значения не равны то всё же не стоит бояться. Это не критичный параметр и диск может прожить ещё годы без каких либо проблем.

03 Spinup Time - время раскрутки диска до рабочего состояния. Беспокоиться стоит только если значение меньше половины от начального. Но тут ещё есть несколько нюансов, таких как сколько пластин в жестком диске. Максимум в настоящее время это 5 пластин (Hitachi), разумеется для раскрутки такого пакета дисков понадобится времени больше чем для 1-ой пластины. Силу инерции никто не отменял.

04 Start/Stop Count - общее количество стартов/остановок шпинделя. Для Seagate количество остановок шпинделя при переходе в режим энергосбережения.

05 Reallocated Sector Count - число переназначенных секторов. То есть когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным», и переносит данные в специально отведённую резервную область. Вообще это страшный параметр, если значение его равно более 10 то это как минимум значит что пора вроверять всю поверхность диска чтобы понять будет ли этот процесс продолжаться. Судя по практике переназначенными секторами страдают ноутбучные диски гдето через год использования. Потому как они работают в очень жестких условиях. Я не говорю об ударах - большинство от этого более-менее защищены. Причина - температура. Корпус ноутбука обычно плохо продувается и диск перегревается, затем мы выключаем ноутбук и идём куда? Ну правильно, на улицу! А там -10 по цельсию. Вот как раз скорость нагрева-остывания и разрушает нежный магнитный слой на пластинах диска. По спецификациям всех производителей дисков так называемый "временной градиент температур", то есть скорость изменения температуры должна быть не более 20 град/час - в рабочем состоянии и не более 30 град/час в выключенном. Это правило нарушается всегда, но для ноутбуков особенно часто и жестоко.

09 Power-on Time Count (Power-on Hours) - количество времени проведённого во включённом состоянии. Обычно у современных дисков измеряется в часах (у Fujitsu в секундах). У старых дисков Maxtor, не у тех которые сейчас выпускаются Seagate под этой маркой, а у оригинальных Maxtor время изменяется в минутах. Это весьма полезный параметр если вы покупаете старый диск, то хочется же знать сколько он в своей жизни отработал. А кроме того обычно это время совпадает с временем работы компьютера и можно определить сколько человек проводит за компьютером в среднем. Как показывает практика и мой опрос на одном из крупных форумов посвящённых компьютерному железу диски с временем наработки более 20000 часов (примерно 2.5 года постоянной работы) уже имеют какие то дефекты, например те же "переназначенные" секторы и не так уж далеки от старческой смерти. Из тех же спецификаций производителей можно узнать что диски предназначенные для настольных компьютеров не предназначены для круглосуточной работы, а рассчитаны на работу в режиме 8/5, то есть 8 часов 5 дней в неделю. Это получается около 2400 часов в год. И получается что гарантия рассчитана для 3-х лет - 7200 часов, для 5 лет - 12000 часов. Не так то уж и много, учитывая что в году 8760 часов.

0A Spinup Retry Count - Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то вероятнее всего повреждение механической части/подшипников. Встречается очень редко, современные диски делают с гидродинамическими подшипниками и в случае неисправности такого подшипника он заклинивает сразу и намертво или работает долго и счастливо. Не так давно этим сильно страдали диски Toshiba и в меньшей степени Western Digital. Заклинивание происходит от перегрева.

0С Power Cycle Count - число циклов включения/выключения диска.

С2 Temperature - температура диска. К сожалению датчики температуры стоят у дисков разных производителей в разных местах, поэтому бывают и завышения и занижения реальной температуры. Но в среднем как показало недавнее исследование Google оптимальная рабочая температура находится в пределах от 35 до 45 градусов. Выше 50 градусов эксплуатация крайне не рекомендуется, но такую температуру и даже выше часто можно увидеть в ноутбуках.

C5 Current Pending Sector Count - число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, но считывание с них отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения. Значение не равное нулю встречается обычно если на диске уже есть переназначенные сектора. Если это так, то с высокой вероятностью можно сказать что диск активно "сыпется", то есть разрушается магнитный слой пластин жесткого диска.

С6 Offline Uncorrectable Sector Count - кол-во нескорректированных ошибок, то есть серьёзное повреждение поверхности диска. Появляются такие ошибки когда заканчивается место в резервной зоне диска для переназначения секторов. Так же могут появляться при резком отключении питания в момент когда диск записывает данные - это так называемые "программные бэд блоки". Если их количество один два, а остальные параметры касающиеся поверхности диска в норме то беспокоиться не стоит. Если же велико, то данные надо спасать и готовить "тело на вынос". :)

С7 Ultra ATA CRC Error Rate - количество ошибок при передаче во внешнем интерфейсе. Обычно в этом виноват кабель или плохой контакт кабеля с разъёмами, особенно проявляется на SATA дисках. Встречается весьма часто.

С8 Write Error Rate - ошибки при записи на диск. Встречается редко. Обычно на очень старых дисках. Если есть ошибки то это означает физический износ привода головок жесткого диска. Или же при серьёзных повреждения поверхности диска. (когда количество переназначенных секторов и нескоректированных ошибок превышают все разумные значения).


Вот мы и кратенько рассмотрели основные параметры системы самодиагностики жестких дисков. Если есть желание узнать об этом подробнее то можно обратиться к материалам википедии:

http://ru.wikipedia.org/wiki/S.M.A.R.T

К сожалению SMART не всегда может предсказать смерть диска. Как показало исследование всё того же Google около 50% дисков умирают резко и без видимых причин. Но в одном эта технология точно полезна. По ней можно быстро узнать состояние поверхности диска, то есть параметры:

05 Reallocated Sector Count

C5 Current Pending Sector Count

С6 Offline Uncorrectable Sector Count


И очень полезно знать время которое за свою жизнь проработал диск, чтобы примерно угадать что от него можно ждать.

А теперь немного о будущем. В продаже уже появилось достаточное количество предложений действительно "жестких дисков" . Они выполнены на микросхемах твердотельной памяти типа flash и гораздо более надёжны и по механическим воздействиям и по температуре. Однако производители ещё не договорились о стандарте системы самодиагностики для этого вида накопителей. Но она будет гораздо проще чем для старых добрых электромеханических дисков. И главное с гораздо более высокой вероятностью будет предсказывать возможность выхода из строя! Флэш память более предсказуема в этом смысле. Чтож, будем ждать этого светлого будущего!

Комментариев нет:

Отправить комментарий