Что такое s m a r t жесткого диска


Расшифровка SMART жесткого диска

№HexИмя атрибутаОписание01 01 Raw Read Error Rate Частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска.Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных до выдачи в интерфейс, следовательно на пугающе огромные цифры можно реагировать спокойно. 02 02 Throughput Performance Общая производительность диска. Если значение атрибута уменьшается, то велика вероятность, что с диском есть проблемы. 03 03 Spin-Up Time Время раскрутки пакета дисков из состояния покоя до рабочей скорости.Растет при износе механики (повышенное трение в подшипнике и т. п.), также может свидетельствовать о некачественном питании (например, просадке напряжения при старте диска). 04 04 Start/Stop Count Полное число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) — счётчик включения режима энергосбережения. В поле raw value хранится общее количество запусков/остановок диска. 05 05 Reallocated Sectors Count Число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным» и переносит данные в специально отведённую резервную область. Вот почему на современных жёстких дисках нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор — remap. Чем больше значение, тем хуже состояние поверхности дисков. Поле raw value содержит общее количество переназначенных секторов. Рост значения этого атрибута может свидетельствовать об ухудшении состояния поверхности блинов диска. 06 06 Read Channel Margin Запас канала чтения. Назначение этого атрибута не документировано. В современных накопителях не используется. 07 07 Seek Error Rate Частота ошибок при позиционировании блока магнитных головок. Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска. Также на значение параметра может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине). 08 08 Seek Time Performance Средняя производительность операции позиционирования магнитными головками. Если значение атрибута уменьшается (замедление позиционирования), то велика вероятность проблем с механической частью привода головок. 09 09 Power-On Hours (POH) Число часов (минут, секунд — в зависимости от производителя), проведённых во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF — mean time between failure). 10 0A Spin-Up Retry Count Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность неполадок с механической частью. 11 0B Recalibration Retries Количество повторов запросов рекалибровки в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность проблем с механической частью. 12 0C Device Power Cycle Count Количество полных циклов включения-выключения диска. 13 0D Soft Read Error Rate Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению. Все ошибки имеют не механическую природу и указывают лишь на неправильную размётку/взаимодействие с диском программ или операционной системы. 184 B8 End-to-End error Данный атрибут — часть технологии HP SMART IV, это означает, что после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают. 187 BB Reported UNC Errors Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами. 188 BC Command Timeout Количество прерванных операций в связи с HDD тайм-аут. Обычно это значение атрибута должно быть равно нулю, и, если значение гораздо выше нуля, то, скорее всего, там будут какие-то серьезные проблемы с питанием или окисленных кабеля для передачи данных. 190 BE Airflow Temperature (WDC) Температура воздуха внутри корпуса жёсткого диска. Для дисков Seagate рассчитывается по формуле (100 — HDA temperature). Для дисков Western Digital — (125- HDA). 191 BF G-sense error rate Количество ошибок, возникающих в результате ударных нагрузок. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера. 192 C0 Power-off retract count Число циклов выключений или аварийных отказов (включений/выключений питания накопителя). 193 C1 Load/Unload Cycle Количество циклов перемещения блока магнитных головок в парковочную зону / в рабочее положение. 194 C2 HDA temperature Здесь хранятся показания встроенного термодатчика для механической части диска — банки (HDA — Hard Disk Assembly). Информация снимается со встроенного термодатчика, которым служит одна из магнитных головок, обычно нижняя в банке. В битовых полях атрибута фиксируются текущая, минимальная и максимальная температура. Не все программы, работающие со SMART, правильно разбирают эти поля, так что к их показаниям стоит относиться критически. 195 C3 Hardware ECC Recovered Число коррекции ошибок аппаратной частью диска (чтение, позиционирование, передача по внешнему интерфейсу). На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины — SATA очень чувствителен к разгону. 196 C4 Reallocation Event Count Число операций переназначения. В поле «raw value» атрибута хранится общее число попыток переноса информации с переназначенных секторов в резервную область. Учитываются как успешные, так и неуспешные попытки. 197 C5 Current Pending Sector Count Число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, но считывание с них отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения (remaping).Рост значения этого атрибута может свидетельствовать о физической деградации жёсткого диска. 198 C6 Uncorrectable Sector Count Число неисправимых ошибок при обращении к сектору. {Возможно, имелось в виду «число некорректируемых (средствами диска) секторов», но никак не число самих ошибок!} В случае увеличения числа ошибок велика вероятность критических дефектов поверхности и/или механики накопителя. 199 C7 UltraDMA CRC Error Count Число ошибок, возникающих при передаче данных по внешнему интерфейсу в режиме UltraDMA (нарушения целостности пакетов и т. п.). Рост этого атрибута свидетельствует о плохом (мятом, перекрученном) кабеле и плохих контактах. Также подобные ошибки появляются при разгоне шины PCI, сбоях питания, сильных электромагнитных наводках, а иногда и по вине драйвера.Возможно причина в некачественном шлейфе. Для исправления попробуйте использовать SATA шлейф без защёлок, имеющий плотное соединение с контактами диска. 200 C8 Write Error Rate /Multi-Zone Error Rate Показывает общее количество ошибок, происходящих при записи сектора. Показывает общее число ошибок записи на диск. Может служить показателем качества поверхности и механики накопителя. 201 C9 Soft read error rate Частота появления «программных» ошибок при чтении данных с диска.

Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя.

202 CA Data Address Mark errors Number of Data Address Mark (DAM) errors (or) vendor-specific. 203 CB Run out cancel Количество ошибок ECC. 204 CC Soft ECC correction Количество ошибок ECC, скорректированных программным способом. 205 CD Thermal asperity rate (TAR) Number of thermal asperity errors. 206 CE Flying height Высота между головкой и поверхностью диска. 207 CF Spin high current Величина силы тока при раскрутке диска. 208 D0 Spin buzz Number of buzz routines to spin up the drive. 209 D1 Offline seek performance Производительность поиска во время офлайновых операций (Drive’s seek performance during offline operations.) 220 DC Disk Shift Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения. Единица измерения неизвестна. При увеличении атрибута диск быстро становится неработоспособным. 221 DD G-Sense Error Rate Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного датчика удара. 222 DE Loaded Hours Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область. 223 DF Load/Unload Retry Count Количество новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной области после неудачной попытки. 224 E0 Load Friction Величина силы трения блока магнитных головок при его выгрузке из парковочной области. 225 E1 Load Cycle Count Количество циклов перемещения блока магнитных головок в парковочную область. 226 E2 Load 'In'-time Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска. 227 E3 Torque Amplification Count Количество попыток скомпенсировать вращающий момент. 228 E4 Power-Off Retract Cycle Количество повторов автоматической парковки блока магнитных головок в результате выключения питания. 230 E6 GMR Head Amplitude Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок). 231 E7 Temperature Температура жёсткого диска. 240 F0 Head flying hours Время позиционирования головки. 250 FA Read error retry rate Число ошибок во время чтения жёсткого диска.

itcom.in.ua

S.M.A.R.T. - здоровье жесткого диска

Жесткий диск - сложное электронно-механическое устройство, имеющее свою технологию самодиагностики, которая может предсказать о скором выходе из строя вашего жесткого диска. Что обычно является очень грустным событием...

Технология S.M.A.R.T. (англ. Self Monitoring Analysing and Reporting Technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

Мы не будем рассматривать данную технологию во всех подробностях, т.к. это слишком широкий вопрос и у каждого из производителей накопителей своё видение и количество отслеживаемых параметров. Рассмотрим наиболее важные с практической точки зрения.

Для этого нам потребуется программа для просмотра отслеживаемых параметров.

Скачать Everest

В ней на вкладке "Хранение данных->SMART" выбираем жёсткий диск и в окне показываются отслеживаемые параметры:

01 Raw Read Error Rate - количество ошибок при чтении. У современных дисков очень большая плотность хранения данных, поэтому с ошибками они считывают данные постоянно, а информация восстанавливается за счёт кода коррекции ошибок ECC. Именно эти ошибки и считает этот параметр. В жёстких дисках фирмы Seagate эти некритичные ошибки показываются, остальные производители предпочитают об этом скромно умалчивать. Для дисков Seagate можно считать очень хорошим состояние когда параметры Raw Read Error Rate и Hardware ECC Recovered равны. Это значит что сколько было ошибок столько и было исправлено с помощью кода коррекции. Если же эти значения не равны то  всё же не стоит бояться. Это не критичный параметр и диск может прожить ещё годы без каких либо проблем.

03 Spinup Time - время раскрутки диска до рабочего состояния. Беспокоиться стоит только если значение меньше половины от начального. Но тут ещё есть несколько нюансов, таких как сколько пластин в жестком диске. Максимум в настоящее время это 5 пластин (Hitachi), разумеется для раскрутки такого пакета дисков понадобится времени больше чем для 1-ой пластины. Силу инерции никто не отменял.

04 Start/Stop Count - общее количество стартов/остановок шпинделя. Для Seagate количество остановок шпинделя при переходе в режим энергосбережения.

05 Reallocated Sector Count - число переназначенных секторов. То есть когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным», и переносит данные в специально отведённую резервную область. Вообще это страшный параметр, если значение его равно более 10 то это как минимум значит что пора вроверять всю поверхность диска чтобы понять будет ли этот процесс продолжаться. Судя по практике переназначенными секторами страдают ноутбучные диски гдето через  год использования. Потому как они работают в очень жестких условиях. Я не говорю об ударах - большинство от этого более-менее защищены. Причина - температура. Корпус ноутбука обычно плохо продувается и диск перегревается, затем мы выключаем ноутбук и идём куда? Ну правильно, на улицу! А там -10 по цельсию. Вот как раз скорость нагрева-остывания и разрушает нежный магнитный слой на пластинах диска. По спецификациям всех производителей дисков так называемый "временной градиент температур", то есть скорость изменения температуры должна быть не более 20 град/час - в рабочем состоянии и не более 30 град/час в выключенном. Это правило нарушается всегда, но для ноутбуков особенно часто и жестоко.

09 Power-on Time Count (Power-on Hours) - количество времени проведённого во включённом состоянии. Обычно у современных дисков измеряется в часах (у Fujitsu в секундах). У старых дисков Maxtor, не у тех которые сейчас выпускаются Seagate под этой маркой, а у оригинальных Maxtor время изменяется в минутах. Это весьма полезный параметр если вы покупаете старый диск, то хочется же знать сколько он в своей жизни отработал. А кроме того обычно это время совпадает с временем работы компьютера и можно определить сколько человек проводит за компьютером в среднем. Как показывает практика и мой опрос на одном из крупных форумов посвящённых компьютерному железу диски с временем наработки более 20000 часов (примерно 2.5 года постоянной работы) уже имеют какие то дефекты, например те же "переназначенные" секторы и не так уж далеки от старческой смерти. Из тех же спецификаций производителей можно узнать что диски предназначенные для настольных компьютеров не предназначены для круглосуточной работы, а рассчитаны на работу в режиме 8/5, то есть 8 часов 5 дней в неделю. Это получается около 2400 часов в год. И получается что гарантия рассчитана для 3-х лет - 7200 часов, для 5 лет - 12000 часов. Не так то уж и много, учитывая что в году 8760 часов.

0A Spinup Retry Count - Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то вероятнее всего повреждение механической части/подшипников. Встречается очень редко, современные диски делают с гидродинамическими подшипниками и в случае неисправности такого подшипника он заклинивает сразу и намертво или работает долго и счастливо. Не так давно этим сильно страдали диски Toshiba и в меньшей степени Western Digital. Заклинивание происходит от перегрева.

0С Power Cycle Count - число циклов включения/выключения диска.

С2 Temperature - температура диска. К сожалению датчики температуры стоят у дисков разных производителей в разных местах, поэтому бывают и завышения и занижения реальной температуры. Но в среднем как показало недавнее исследование Google оптимальная рабочая температура находится в пределах от 35 до 45 градусов. Выше 50 градусов эксплуатация крайне не рекомендуется, но такую температуру и даже выше часто можно увидеть в ноутбуках.

C5 Current Pending Sector Count - число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, но считывание с них отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения. Значение не равное нулю встречается обычно если на диске уже есть переназначенные сектора. Если это так, то с высокой вероятностью можно сказать что диск активно "сыпется", то есть разрушается магнитный слой пластин жесткого диска.

С6 Offline Uncorrectable Sector Count - кол-во нескорректированных ошибок, то есть серьёзное повреждение поверхности диска. Появляются такие ошибки когда заканчивается место в резервной зоне диска для переназначения секторов. Так же могут появляться при резком отключении питания в момент когда диск записывает данные - это так называемые "программные бэд блоки". Если их количество один два, а остальные параметры касающиеся поверхности диска в норме то беспокоиться не стоит. Если же велико, то данные надо спасать и готовить "тело на вынос". :)

С7 Ultra ATA CRC Error Rate - количество ошибок при передаче во внешнем интерфейсе. Обычно в этом виноват кабель или плохой контакт кабеля с разъёмами, особенно проявляется на SATA дисках. Встречается весьма часто.

С8 Write Error Rate - ошибки при записи на диск. Встречается редко. Обычно на очень старых дисках. Если есть ошибки то это означает физический износ привода головок жесткого диска. Или же при серьёзных повреждения поверхности диска. (когда количество переназначенных секторов  и нескоректированных ошибок превышают все разумные значения).

 

Вот мы и кратенько рассмотрели основные параметры системы самодиагностики жестких дисков. Если есть желание узнать об этом подробнее то можно обратиться к материалам википедии:

http://ru.wikipedia.org/wiki/S.M.A.R.T

К сожалению SMART не всегда может предсказать смерть диска. Как показало исследование всё того же Google около 50% дисков умирают резко и без видимых причин. Но в одном эта технология точно полезна. По ней можно быстро узнать состояние поверхности диска, то есть параметры:

05 Reallocated Sector Count

C5 Current Pending Sector Count

С6 Offline Uncorrectable Sector Count

И очень полезно знать время которое за свою жизнь проработал диск, чтобы примерно угадать что от него можно ждать.

А теперь немного о будущем. В продаже уже появилось достаточное количество предложений действительно "жестких дисков" . Они выполнены на  микросхемах твердотельной памяти типа flash и гораздо более надёжны и по механическим воздействиям и по температуре. Однако производители ещё не договорились о стандарте системы самодиагностики для этого вида накопителей. Но она будет гораздо проще чем для старых добрых электромеханических дисков. И главное с гораздо более высокой вероятностью будет предсказывать возможность выхода из строя! Флэш память более предсказуема в этом смысле. Чтож, будем ждать этого светлого будущего!

www.fobosworld.ru

жесткие диски, какими вы их не знали. Часть 2 / Offсянка

Первую часть этого материала можно прочитать здесь.

Технология S.M.A.R.T. родилась в далеком 1995 году, так что возраст у нее почтенный. Предполагалось, что атрибуты SMART (давайте для простоты писать аббревиатуру без точек), формируемые микропрограммой жесткого диска, позволят программно оценивать состояние накопителя, а также дадут механизм для предсказания выхода его из строя. Последнее в те времена было достаточно актуально: срок жизни дисков в серверах, например, исчислялся годом-полутора, и знать, когда готовить замену, было нелишним.

Со временем многое поменялось: что-то отмерло, какие-то стороны развились сильнее (например, контроль механики диска). Первоначальный набор из десятка простейших атрибутов усложнился и разросся в несколько раз, порой менялся их смысл, многие производители ввели собственные атрибуты с не всегда ясным функционалом. Появилась масса программ для анализа SMART (как правило, невысокого качества, но с эффектным интерфейсом, да еще и за деньги) и т.п.

Так что не мешает описать современное состояние SMART. Начнем с критически важных атрибутов, ухудшение которых почти всегда свидетельствует о проблемах с накопителем. Именно их первым делом смотрят ремонтники при диагностике HDD.

  • #01 Raw Read Error Rate — частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска. Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных ДО выдачи в интерфейс; на пугающе огромные цифры можно не обращать внимания.
  • #03 Spin-Up Time — время раскрутки пакета пластин из состояния покоя до рабочей скорости. Растет при износе механики (повышенное трение в подшипнике и т.п.), также может свидетельствовать о некачественном питании (например, просадке напряжения при старте диска).
  • #05 Reallocated Sectors Count — число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор переназначенным и переносит данные в резервную область. Вот почему на современных HDD нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, на жаргоне — ремап. Поле Raw Value атрибута содержит общее количество переназначенных секторов. Чем оно больше, тем хуже состояние поверхности диска.
  • #07 Seek Error Rate — частота ошибок при позиционировании блока магнитных головок (БМГ). Рост этого атрибута свидетельствует о низком качестве поверхности или о поврежденной механике накопителя. Также может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).
  • #10 Spin-Up Retry Count — число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. Если значение атрибута растет, то велика вероятность проблем с механикой.
  • #196 Reallocation Event Count — число операций переназначения. В поле Raw Value атрибута хранится общее число попыток переноса информации со сбойных секторов в резервную область диска (она, как правило, не слишком велика — несколько тысяч секторов). Учитываются как успешные, так и неудачные операции.
  • #197 Current Pending Sector Count — текущее число нестабильных секторов. Здесь хранится число секторов, являющихся кандидатами на замену. Они не были еще определены как плохие, но считывание с них происходит с затруднениями (например, не с первого раза). Если «подозрительный» сектор будет в дальнейшем считываться успешно, то он исключается из числа кандидатов. В случае же повторных ошибочных чтений накопитель попытается восстановить его и выполнить ремап.
  • #198 Uncorrectable Sector Count — число секторов, при чтении которых возникают неисправимые (внутренними средствами) ошибки. Рост этого атрибута указывает на серьезные дефекты поверхности или на проблемы с механикой накопителя.
  • #220 Disk Shift — сдвиг пакета пластин относительно оси шпинделя. В основном возникает из-за сильного удара или падения диска. Единица измерения неизвестна, но при сильном росте атрибута диск не жилец.

    Также следует принимать во внимание и информационные атрибуты, способные много чего поведать об «истории» диска.

  •  #02 Throughput Performance — средняя производительность диска. Если значение атрибута уменьшается, то велика вероятность, что у накопителя есть проблемы.
  • #04 Start/Stop Count — число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) — счетчик включения режима энергосбережения.
  • #08 Seek Time Performance — средняя производительность операции позиционирования головок. Снижение значения этого атрибута свидетельствует о неполадках в механике привода головок (в первую очередь о замедленном позиционировании).
  • #09 Power-On Hours (POH) — время, проведённое во включенном состоянии. Показывает общее время работы диска, единица измерения зависит от модели (не только 1 час, но и 30 мин, и даже 1 минута).
  • #11 Recalibration Retries — число повторов рекалибровки в случае, если первая попытка была неудачной. Рост этого атрибута указывает на проблемы с механикой диска.
  • #12 Device Power Cycle Count — число полных циклов включения-выключения диска.
  • #13 Soft Read Error Rate — частота появления «программных» ошибок при чтении данных. Сюда можно отнести ошибки программного обеспечения, драйверов, файловой системы, неверную разметку диска — в общем, почти все, что не относится к аппаратной части.
  • #190 Airflow Temperature — температура воздуха внутри корпуса HDD. Для дисков Seagate атрибут выдается в нормировке 100º минус температура (тем самым критический нагрев соответствует значению 45), а модели Western Digital используют нормировку 125º минус температура.
  • #191 G-sense error rate — число ошибок, возникших из-за внешних нагрузок. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера.
  • #192 Power-off retract count — число зафиксированных повторов включения/выключения питания накопителя.
  • #193 Load/Unload Cycle Count — число циклов перемещения БМГ в специальную парковочную зону/в рабочее положение.
  • #194 HDA temperature — температура механической части диска, в просторечии банки (HDA — Hard Disk Assembly). Информация снимается со встроенного термодатчика, которым служит одна из магнитных головок, обычно нижняя в банке. В битовых полях атрибута фиксируются текущая, минимальная и максимальная температура. Не все программы, работающие со SMART, правильно разбирают эти поля, так что к их показаниям стоит относиться критично.
  • #195 Hardware ECC Recovered — число ошибок, скорректированных аппаратной частью диска. Сюда входят ошибки чтения, ошибки позиционирования, ошибки передачи по внешнему интерфейсу. На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины — SATA очень чувствителен к разгону.
  • #199 UltraDMA (Ultra ATA) CRC Error Count — число ошибок, возникающих при передаче данных по внешнему интерфейсу в режиме UltraDMA (нарушения целостности пакетов и т.п.). Рост этого атрибута свидетельствует о плохом (мятом, перекрученном) кабеле и плохих контактах. Также подобные ошибки появляются при разгоне шины PCI, сбоях питания, сильных электромагнитных наводках, а иногда и по вине драйвера.
  • #200 Write Error Rate/ Multi-Zone Error Rate — частота появления ошибок при записи данных. Показывает общее число ошибок записи на диск. Чем больше значение атрибута, тем хуже состояние поверхности и механики накопителя.

Как видим, большинство «интересных» атрибутов отражает функционирование механики накопителя. Технология SMART действительно позволяет предсказывать выход диска из строя в результате механических неисправностей, что, по статистике, составляет около 60% всех отказов. Полезен и мониторинг температур: перегрев головок резко ускоряет их деградацию, так что превышение опасного порога (45-55º в зависимости от модели) — сигнал срочно улучшить охлаждение диска.

Вместе с тем не следует переоценивать возможности SMART. Современные диски нередко «дохнут» на фоне отличных атрибутов, что связано с тонкими процессами дефект-менеджмента в условиях высокой плотности записи и не всегда, мягко говоря, качественных компонентов (разнобой в отдаче головок сегодня — обычное дело). Тем более SMART не способен предсказать последствия таких «форс-мажоров», как скачок напряжения, перегрев платы электроники или повреждение накопителя от удара.

Практически у всех атрибутов наибольший интерес представляет поле Raw Value: «сырые» значения наиболее информативны. Их нормировка (степень приближения к абстрактному порогу) часто ничего не дает и только запутывает дело. Поэтому и программы, полагающиеся на эти проценты, нельзя считать вполне надежными. Типичный случай для них — ложные тревоги. Программа сообщает, что новый, недавно установленный накопитель того и гляди «склеит ласты». А все дело в том, что в начале эксплуатации некоторые атрибуты SMART быстро меняются и примитивная экстраполяция приводит к пугающим пользователя прогнозам.

Я советую бесплатную программу HDDScan — она корректно понимает все атрибуты, в том числе и новые, правильно разбирает температурные показатели. Отчет выводится в виде аккуратной xml-таблицы с цветовой индикацией, которую можно сохранить или распечатать.

SMART диска WD пятилетнего возраста. О его близкой кончине свидетельствуют ненулевые значения атрибутов 1 и 200 (для WD они особенно чреваты), а также тот факт, что после ремапа атрибут 197 снова растет. Это значит, что возможности исправления дефектов исчерпаны

Крайне полезна у HDDScan возможность считывать SMART у внешних накопителей, столь распространенных сегодня. Практически ни одна другая программа этого не умеет, ведь на пути данных стоит контроллер, преобразующий интерфейс PATA/SATA в USB или FireWire. Автор целенаправленно работал в этом направлении, и ему удалось охватить широкий спектр контроллеров. Не забыты и диски с интерфейсом SCSI, до сих пор широко применяемые в серверах (атрибуты у них особые — например, выводится общее число записанных или считанных байтов за всю жизнь накопителя).

Функционал HDDScan полностью отвечает потребностям ремонтника. Когда первичную диагностику принесенного внешнего диска можно провести, не разбирая корпус, — это удобно, экономит время, а порой и сохраняет гарантию.

SMART, снятый со SCSI-диска. Здесь исторически сложились совсем другие атрибуты

⇡#Барьеры HDD

Механика давно стала ахиллесовой пятой HDD, и даже не столько из-за чувствительности к ударам и вибрации (это еще можно компенсировать), сколько из-за медлительности. Самые быстрые «дерганья» блоком магнитных головок (2-3 мс у лучших серверных моделей) в тысячи раз уступают скоростям электроники.

И принципиально ничего тут не улучшишь. Поднимать скорость вращения пакета дисков некуда, 15000 об./мин уже предел. Японцы несколько лет назад подступались к 20000 об./мин (вполне гироскопная скорость), но в итоге отказались — не выдерживают материалы, конструкция получается слишком дорогая и для массового производства слабо пригодная. В малых же сериях винчестеры выйдут золотыми, такие никто не купит — это не гироскопы, которые заменить нечем.

Выходит, уткнулись в барьер. Механику на кривой козе не объедешь. Единственный выход — поднимать плотность записи, поперечную и продольную. Продольная плотность (вдоль дорожки) влияет на производительность накопителя, т.е. на поток данных к остальным узлам компьютера. Но все равно, даже достигнутые 100-130 Мбайт/с — это для нынешних компьютеров слишком мало. Например, рядовая оперативная память (DRAM) имеет реальную производительность около 3 Гбайт/с, а кеш процессора — еще больше. Разница на порядки, и она сильно сказывается на общем быстродействии. Конечно, никто не требует от энергонезависимого накопителя, емкость которого в сотни раз превышает DRAM, такой же производительности. Но даже простое удвоение было бы заметно любому пользователю.

Поперечная плотность записи — это густота дорожек на пластине, в современных HDD она превышает 10000 на 1 миллиметр. Получается, что сама дорожка имеет ширину менее 100 нм (между прочим, нанотехнологии в чистом виде). Это позволяет резко поднять емкость в расчете на одну поверхность, а также ускоряет позиционирование за счет изощренных алгоритмов (их разработка потянула бы на пару докторских диссертаций).

Как итог, за последние годы емкость и производительность HDD значительно выросли. Все это стало возможным благодаря технологии перпендикулярной записи, которая существует уже более 20 лет, но до массового внедрения дозрела только в 2007 году. Причем емкость тогда выросла даже сильнее, чем требуется: первые терабайтные диски встретили вялый отклик пользователей. Народ просто не понимал, куда приспособить таких монстров, тем более что они поначалу строились на пяти пластинах, были капризными, шумными и горячими (речь о тогдашних флагманах Hitachi).

Потом, конечно, люди разобрались, торренты заработали в полную силу, да и количество пластин поуменьшилось. В то же время плотность записи выросла до 500-750 Гбайт на пластину (имеются в виду диски настольного сегмента с форм-фактором 3,5″). Вот-вот в массовое производство пойдут терабайтные пластины, что даст возможность выпустить винчестеры объемом до 4 Тбайт (больше четырех пластин в стандартном корпусе высотой 26,1 мм не уместить; хитачевские пятипластинные первенцы большого развития не получили).

Трехтерабайтный диск WD Caviar Green WD30EZRX, наиболее емкий на сегодня. Имеет четырехпластинный дизайн, выпускается ровно год (с 20 октября 2010 г.). Как полагается, весной и летом дешевел, но в последние дни резко подорожал из-за наводнения в Таиланде (там расположены сборочные заводы WD, и стихия блокировала подвоз комплектующих)

Увы, скорость позиционирования выросла, мягко говоря, несильно, а у массовых моделей так вообще осталась на прежнем уровне, а то и упала в угоду… тишине. Маркетологи доказали, что потребитель голосует кошельком за гигабайты в расчете на один доллар, а не за миллисекунды доступа. Поэтому и небыстры дешевые диски по сравнению с породистыми серверными собратьями. Медлительность хорошо проявляется в скорости загрузки ОС, когда надо читать с диска большое количество мелких файлов, разбросанных по пластинам. Здесь главную роль играет скорость вращения шпинделя и мощный привод БМГ, дающий возможность больших ускорений.

Между прочим, «быстрые» диски легко отличить даже на вес — они заметно тяжелее «медленных». Полноразмерная банка с утолщенными стенками, способствующая геометрической стабильности и подавлению вибраций, скоростной шпиндельный двигатель, мощные магниты позиционера, двухслойная крышка повышенной жесткости — все это прибавляет такому накопителю десятки и сотни граммов. Еще больше отрыв в серверных моделях на 15000 об./мин, где пластины уменьшенного размера окружены внушительным объемом литого алюминия, а общий вес «харда» доходит до килограмма.

Высокопроизводительный диск WD Raptor со скоростью вращения шпинделя 10 000 об./мин. При емкости 150 Гбайт весит 740 г (массовые модели той же емкости — 400-500 г). Обратите внимание на размер магнитов и толщину стенок

С удешевлением твердотельных SSD, использующихся, в первую очередь, под операционную систему, нужда в высокопроизводительных HDD стала снижаться, а сами они постепенно выделяются в особый сегмент рынка (такова, например, «черная» серия у WD). Подобными дисками комплектуются профессиональные рабочие станции с ресурсоемкими приложениями, критичными к скорости доступа. Рядовые же пользователи брать достаточно дорогие накопители не торопятся, предпочитая объем производительности.

На другом конце спектра — популярные «зеленые» модели с намеренно замедленным вращением шпинделя (5400-5900 об./мин вместо 7200) и небыстрым позиционированием головок. Дешевые, тихие, холодные и достаточно надежные, эти винчестеры идеально подходят для хранения мультимедийных данных в домашних компьютерах, внешних корпусах и сетевых хранилищах. На наших прилавках все эти Green и LP сильно потеснили другие линейки, так что в мелких «точках» порой ничего больше и не найдешь.

⇡#Расточительность магнитной записи

Намагниченность доменов жесткого диска, как и в середине двадцатого века, меняют с помощью магнитной головки, поле которой возбуждается переменным электрическим током и действует на магнитный слой через зазор. Также эта технология требует быстрого вращения пластин, прецизионного контроля положения головки и т.д. Двигатель и позиционер жесткого диска, а также управляющая ими электроника потребляют заметную мощность, да и стоят немало. Но главное — на само возбуждение магнитного поля тратится очень много энергии. 

Расточительность стандартного метода магнитной записи трудно оценить, работая на персональном компьютере. Жесткие диски массовых серий даже при активной работе потребляют менее 10 Вт, что на фоне прочих комплектующих (100 Вт и более) почти незаметно. Но ваши взгляды сразу переменятся после посещения серверной комнаты какого-нибудь крупного банка, а чтобы получить впечатлений на всю оставшуюся жизнь, достаточно подойти к дисковой стойке суперкомпьютера. В шуме сотен и тысяч жестких дисков, обдувающих их вентиляторов и прецизионных кондиционеров становится понятно, сколько энергии в глобальном масштабе тратится на такую работу.

Недаром для систем хранения данных энергоэффективность в списке характеристик выходит на первый план. Вот уже и Google переводит свои дата-центры на баржи в море (вот где настоящие офшоры!). Оказывается, охлаждение СХД забортной водой радикально сокращает операционные затраты, в первую очередь за счет экономии на кондиционерах.

⇡#О питании жестких дисков

Будет ли работать обычная 220-вольтовая лампочка от 230 В? Конечно, будет. А от 240 В? Тоже. Вопрос — сколько она протянет? Понятно, что меньше или существенно меньше — это зависит от конкретной лампочки. Ей суждена яркая, но короткая жизнь.

Примерно та же ситуация и с жесткими дисками. Наивные производители проектировали их, полагаясь на стандартные +5 В и +12 В. Однако в типичном компьютерном блоке питания (БП) стабилизируется лишь линия 5 В. К чему же это приводит?

При высокой нагрузке на процессор (а современные «камни» потребляют немало) и недостаточной мощности БП линия 5 В проседает, и система стабилизации отрабатывает это дело, повышая напряжение до номинального значения. Одновременно повышается и напряжение 12 В (из-за отсутствия стабилизации по нему). В результате и так нестойкий к нагреву HDD работает еще и при повышенном напряжении, которое подается на самые греющиеся узлы — микросхему управления двигателем (на жаргоне ремонтников — «крутилка») и привод головок (т.н. «звуковая катушка»). Итог — смотри рассуждение о лампочке.

Сгоревшая «крутилка» на плате как результат повышенного напряжения и плохого охлаждения. Нередко микросхема сгорает в буквальном смысле, с пиротехническими эффектами и выгоранием дорожек на плате. Такое ремонту не подлежит

Отсюда советы по блоку питания. Чем больше его мощность, тем лучше (в разумных пределах: запас более 30-35% по отношению к реальному потреблению снижает КПД блока, так что вы будете греть комнату). Менее мощный, но фирменный БП лучше более мощного, но безродно-китайского. Помните — разгоняют не только процессоры. В первом приближении, 420 «китайских» ватт эквивалентны 300 «правильным».

По-хорошему, надо бы еще учитывать возраст БП: после 2-3 лет эксплуатации его реальная мощность заметно снижается, а выходные напряжения дрейфуют. Разумеется, в некачественных изделиях, работающих на честном китайском слове, процессы старения выражены гораздо резче. Хорошо еще, если подобный блок тихо умрет сам, а не утащит за собой в агонии половину системного блока!

Максимально допустимым считается 12,6 В (+5% от номинала). Однако у многих дисков c ростом напряжения наблюдается нелинейно-резкий нагрев упомянутых выше узлов — «крутилки» и «катушки». Поэтому я рекомендую строже контролировать БП с помощью внешнего вольтметра (датчики на материнской плате, измеряющие напряжение для BIOS и программ типа AIDA, могут быть весьма неточны).

Измерять напряжение лучше всего на разъемах Molex и обязательно под полной нагрузкой: процессор занят вычислениями с плавающей точкой, видеокарта — выводом динамичной трехмерной графики, а диск — дефрагментацией. При 12,2-12,4 В стоит призадуматься, 12,4-12,6 В — поволноваться, 12,6-13 В — бить тревогу, а в случае 13 В и выше — копить деньги на новый диск или положить гарантийный талон на видное место…

Конденсаторы (2200 мкФ, 25 В), напаянные на цепи питания HDD (желтый провод — +12 В, красный — +5 В, черный — земля). В данном случае они уменьшают пульсации напряжения, от которых блок питания издает раздражающий высокочастотный писк

Если напряжение по линии 12 В сильно завышено, а вы не боитесь паяльника и способны отличить транзистор от диода, то можете включить последний в разрыв питания HDD (напомню, линии 12 В соответствует желтый провод). Диод сыграет роль ограничителя — на его p-n переходе упадут «лишние» 0,2-0,7 В (в зависимости от типа диода), и диску станет полегче. Только диод надо брать достаточно мощный, чтобы он выдерживал пусковой ток в 2-3 А.

И без фанатизма: результирующее напряжение не должно опускаться ниже 11,7 В. В противном случае возможна неустойчивая работа диска (множественные рестарты) и даже порча данных. А некоторые модели (в частности, Seagate 7200.10 и 7200.11) могут вообще не запуститься.

⇡#Миграция с флеш

Память NAND Flash появилась много позднее, чем HDD, и переняла ряд его технологий — взять хотя бы коды ECC. Далее оба направления развивались параллельно и сравнительно независимо. Но в последнее время наметился и обратный процесс: миграция технологий с флеш-памяти на жесткие диски. Конкретно речь идет о выравнивании износа.

Как известно, любой флеш-чип имеет ограниченный ресурс по числу стираний-записей в одну ячейку. В какой-то момент стереть ее уже не удается, и она навсегда застывает с последним записанным значением. Поэтому контроллер считает количество записей в каждую страницу и в случае превышения копирует ее на менее изношенное место. В дальнейшем вся работа ведется с новым участком (этим заведует транслятор), а старая страница остается как есть и не используется. Данная технология получила название Wear Leveling. Так вот, износ есть и в жестких дисках, но там он механический и температурный. Если магнитная головка все время висит над одной дорожкой (скажем, постоянно изменяется тот или иной файл), то растет вероятность повреждения дорожки при случайных толчках или вибрации диска (например, от соседних накопителей в корзине). Головка может коснуться пластины и повредить магнитный слой со всеми вытекающими печальными последствиями. Даже если вредного контакта нет, неподвижная головка локально нагревается и пусть обратимо, но деградирует. Запись в данное место происходит менее надежно, растет вероятность последующего неустойчивого считывания (а при современных огромных плотностях записи любое отклонение параметров губительно).

Эти соображения достаточно очевидны, и прошивка серверных дисков с интерфейсом SCSI/SAS (а они весьма горячи) давно научилась перемещать головки в простое, дабы они не перегревались. Но еще лучше вместе с головкой «перебрасывать» и информацию по пластине — в этом случае описанные эффекты подавляются максимально, а надежность накопителя растет. Вот Western Digital и ввел подобный механизм в новых моделях VelociRaptor. Это дорогие высокопроизводительные диски со скоростью вращения шпинделя 10000 об./мин и пятилетней гарантией, так что Wear Leveling там уместен.

VelociRaptor снаружи и внутри. Привлекает внимание мощный радиатор. Пластины же имеют уменьшенный диаметр — это характерно для современных скоростных дисков.

Кроме того, вся линейка VelociRaptor нацелена на использование в высоконагруженных системах, в первую очередь серверах, где запись на диск ведется очень интенсивно и зачастую в одни и те же файлы (типичный пример — логи транзакций). Массовым «ширпотребным» дискам высокие нагрузки не грозят, греются они тоже умеренно, так что подобный изыск там вряд ли появится. Впрочем, поживем — увидим.

⇡#Аdvanced Format и его применение

Вот уже более 20 лет все жесткие диски имеют одинаковый размер физического сектора: 512 байт. Это минимальная порция записи на диск, позволяющая гибко управлять распределением дискового пространства. Однако с ростом объема HDD все сильнее стали проявляться недостатки такого подхода — в первую очередь неэффективное использование емкости магнитной пластины, а также высокие накладные расходы при организации потока данных.

Поэтому диски большой емкости (терабайт и выше) стали производиться по технологии Advanced Format, которая оперирует «длинными» физическими секторами в 4096 байт. Разметка магнитных пластин под AF весьма выгодна для производителя: меньше межсекторных промежутков, выше полезная емкость дорожки и всей пластины (а это, наряду с магнитными головками, самый дорогой компонент HDD). Именно Advanced Format позволил выпустить на рынок недорогие винчестеры, столь популярные ныне у потребителей аудио- и видеоконтента. AF-дисками емкостью 1-3 Тбайт комплектуются не только компьютеры, но и масса внешних накопителей, сетевых хранилищ и медиаплееров.

Один из первых дисков 3,5″ с Advanced Format, выпущенный в 2009 г

Но даром ничего не дается, новые диски уже начинают приносить в ремонт. Похоже, надежность все-таки просела. Ведь единичный сбой диска или дефект поверхности портит теперь в 8 раз больше данных пользователя, чем обычно. При физическом секторе в 4 Кбайт и эмуляции «коротких» секторов в 512 байт не будет читаться от 1 до 8 секторов. Операционная система на это реагирует понятно как: авария, все пропало! В итоге мелкая проблема на пластинах вырастает для пользователя в зависание или чего еще хуже.

Я считаю, на дисках с AF не стоит держать ОС, прикладные программы и базы данных со множеством мелких файлов. Пока что их удел — мультимедийные данные, некритичные к выпадениям.

⇡#Что стоит почитать о жестких дисках

В первую очередь рекомендую заглянуть на форум HARDW.net. Его раздел «Накопители информации» посещает множество профессиональных ремонтников и энтузиастов (почти 40 тыс. участников). Там можно найти ответы практически по любой теме, связанной с HDD, за исключением самых новых «нераскопанных» моделей. Начните с подраздела «Песочница»: на простые (в понимании профессионалов) вопросы там отвечают подробно и содержательно, а не отшивают, как в других местах, — «несите к ремонтнику».

Еще больше информации, правда, на английском языке, можно найти на портале HDDGURU. Помимо ремонтно-диагностического ПО и статей по отдельным вопросам (например, как поменять головки у диска), там есть международный форум ремонтников, а также огромный архив ресурсов по HDD (firmware, документация, фото и т.п.). Портал прививает широкий взгляд на вещи, он будет интересен подготовленным и мотивированным людям. Во всяком случае, в закрытых конференциях ремонтников ссылки на него пробегают постоянно.

Сошлюсь и на свою статью «Как продлить жизнь жестким дискам» в трех частях. Она дает начальные сведения по обращению с HDD, и хотя написана более трех лет назад, устарела мало — диски за это время принципиально не изменились, разве что стали еще менее надежными из-за свирепой экономии. Производители, застигнутые мировым кризисом, снижали свои затраты по всем направлениям, что и послужило причиной ряда громких провалов 2008-2009 гг. Об одном из них речь пойдет в продолжении этого материала, которое выйдет в ближайшее время.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

3dnews.ru

Параметры состояния жёстких дисков (SMART) [Центр компьютерной помощи «1 2 3»]

# hex атрибут оптимально описание 1 1 Raw Read Error Rate Частота ошибок при чтении данных с пластин диска по вине аппаратной части накопителя. Для всех дисков Seagate, Samsung (начиная с семейства SpinPoint F1 включительно) и Fujitsu 2,5″ это — число внутренних коррекций данных, проведенных до выдачи в интерфейс. Таким образом, ненулевой параметр на дисках WD и Samsung до SpinPoint F1 (невключительно) и большое значение параметра на дисках Hitachi могут указывать на аппаратные проблемы с диском. На дисках Seagate, Samsung (SpinPoint F1 и новее) и Fujitsu на этот атрибут можно не обращать внимания. 2 2 Throughput Performance Общая (средняя) производительность диска. Параметр не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении. 3 3 Spin-Up Time Время раскрутки шпинделя диска из состояния покоя до номинальной рабочей скорости. Практически ничего не говорит о здоровье диска. Время разгона может различаться у разных дисков (даже одного и того же производителя) в зависимости от тока раскрутки, массы блинов, номинальной скорости шпинделя и т.п. Винчестеры Fujitsu всегда имеют 1 в этом поле в случае отсутствия проблем с раскруткой шпинделя. 4 4 Number of Spin-Up Times

Start/Stop Count

Полное число циклов включения диска (запуска-остановки шпинделя). У дисков некоторых производителей (например, Seagate) — счётчик включения режима энергосбережения. При оценке здоровья можно не обращать на этот атрибут значительного внимания. 5 5 Reallocated Sectors Count Количество секторов, переназначенных в случае обнаружения винчестером ошибки чтения/записи в резервную область. Поэтому на современных жёстких дисках нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Чем больше это значение, тем хуже состояние поверхности дисков. При достижении определённого порогового значения (например, 10 ремапов) диск нужно обязательно менять, ведь это означает прогрессирующую деградацию состояния поверхности блинов, головок или другие аппаратные проблемы. 6 6 Read Channel Margin Запас канала чтения. Назначение этого атрибута не документировано - в современных накопителях не используется. 7 7 Seek Error Rate Частота появления ошибок позиционирования блока магнитных головок. Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска. Также на значение параметра может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине). На дисках Seagate, Samsung SpinPoint F1 и новее и Fujitsu 2,5″ на значение атрибута можно не обращать внимание, на остальных моделях Samsung, а также на всех WD и Hitachi ненулевое значение свидетельствует об аппаратных проблемах. Для винчестеров Hitachi нормальным значением является только 0. 8 8 Seek Time Performance Средняя производительность операций позиционирования магнитных головок. Не даёт никакой информации пользователю и не говорит ни о какой опасности при любом своём значении. 9 9 Power On Hours Count

Power-on Time

Число часов (минут, секунд — в зависимости от производителя), проведённых винчестером во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF — mean time between failure). Ничего не говорит о здоровье диска как таковом. 10 0A Spin-Up Retry Count Число повторных попыток раскрутки шпинделя диска до рабочей скорости в случае, если первая попытка оказалась неудачной. О здоровье диска чаще всего не говорит. Если значение атрибута увеличивается, то велика вероятность неполадок с механической частью. Основные причины увеличения параметра - плохой контакт диска с БП или невозможность БП выдать нужный ток в линию питания диска. В идеале должен быть равен 0. При значении атрибута, равном 1-2, внимания можно не обращать. Если значение больше, в первую очередь следует обратить пристальное внимание на состояние блока питания, его качество, нагрузку на него, проверить контакт винчестера с кабелем питания, проверить сам кабель питания. 11 0B Calibration Retry Count

Recalibration Retries

Количество повторов запросов сброса накопителя (рекалибровки) в случае, если первая попытка была неудачной. Ненулевое, а особенно растущее значение параметра может означать проблемы с диском. 12 0C Power Cycle Count Количество полных циклов включения-выключения диска. Не связан с состоянием диска. 13 0D Soft Read Error Rate Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению. Все ошибки имеют не механическую природу и указывают лишь на неправильную размётку/взаимодействие с диском программ или операционной системы. 183 B7 SATA Downshift Error Count Количество неудачных попыток понижения режима SATA. Суть в том, что винчестер, работающий в режимах SATA 3 Гбит/с или 6 Гбит/с, по какой-то причине (например, из-за ошибок) может попытаться понизить скоростной режим (например, SATA 1,5 Гбит/с или 3 Гбит/с соответственно). В случае отказа контроллера изменять режим диск увеличивает значение этого атрибута. Не говорит о здоровье накопителя. 184 B8 End-to-End Error Количество ошибок, возникших при передаче данных через кэш винчестера в случае, если паритет данных между хостом и жестким диском не совпадает. Ненулевое значение указывает на проблемы с диском. 187 BB Reported Uncorrected Sector Count

UNC Error

Количество секторов, которые были признаны кандидатами на переназначение за всю историю жизни диска. Причём если сектор становится кандидатом повторно - значение атрибута также увеличивается. Ненулевое значение атрибута явно указывает на ненормальное состояние диска или на то, что оно было таковым ранее (в сочетании с нулевым значением 197). 188 BC Command Timeout Количество операций, выполнение которых было отменено из-за превышения максимально допустимого времени ожидания отклика. Такие ошибки могут возникать из-за плохого качества кабелей, контактов, используемых переходников, удлинителей и т.д., а также из-за несовместимости диска с конкретным контроллером SATA/РАТА. Из-за ошибок такого рода возможны «синие экраны смерти» в Windows. Ненулевое значение атрибута говорит о потенциальной «болезни» диска. 189 BD High Fly Writes Количество зафиксированных случаев записи при высоте полета головки выше рассчитанной (скорее всего, из-за внешних воздействий, например вибрации). Для того, чтобы сказать, почему происходят такие случаи, нужно уметь анализировать логи SMART, которые содержат специфичную для каждого производителя информацию, что на сегодняшний день не реализовано в общедоступном ПО. 190 BE Airflow Temperature Температура воздуха внутри корпуса жёсткого диска. Для дисков Seagate рассчитывается по формуле (100 - HDA Temperature). Для дисков Western Digital — (125 - HDA Temperature). 191 BF G-Sensor Shock Count

Mechanical Shock

Количество критических ускорений (ударных нагрузок), зафиксированных электроникой диска, которым подвергался накопитель и которые превышали допустимые. Обычно это происходит при ударах, падениях и т. п. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера. Актуален для мобильных винчестеров. На дисках Samsung на него часто можно не обращать внимания, т.к. они могут иметь очень чувствительный датчик, который, образно говоря, реагирует чуть ли не на движение воздуха от крыльев пролетающей в одном помещении с диском мухи. 192 C0 Power Off Retract Count

Emergency Retry Count

Для разных винчестеров может содержать одну из следующих двух характеристик: либо суммарное количество парковок диска в аварийных ситуациях (по сигналу от вибродатчика, обрыву/понижению питания и т.п.), либо суммарное количество циклов включения/выключения питания диска (характерно для современных WD и Hitachi). 193 C1 Load/Unload Cycle Count Количество полных циклов парковки/распарковки магнитных головок диска. Анализ этого атрибута — один из способов определить, включена ли на диске функция автоматической парковки (например, у дисков Western Digital). Если значение атрибута превосходит (обычно - многократно) значение атрибута 09 (счётчик отработанных часов), то парковка включена. 194 C2 Temperature

HDA Temperature

HDD Temperature

Текущая температура диска, считываемая с датчика, который на разных моделях может располагаться в разных местах. Поле вместе с текущей также может содержать максимальную и минимальную температуры, зафиксированные за всё время эксплуатации винчестера. При работе старайтесь не допускать повышения температуры винчестера выше 50 градусов. 195 C3 Hardware ECC Recovered Число коррекции ошибок аппаратной частью диска (чтение, позиционирование, передача по внешнему интерфейсу). На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины - SATA очень чувствителен к разгону. Особенности, присущие этому атрибуту на разных дисках, полностью соответствуют таковым атрибутов 01 и 07. 196 C4 Reallocation Event Count Количество операций переназначения секторов. В поле «raw value» атрибута хранится общее число попыток переноса информации с переназначенных секторов в резервную область. Учитываются как успешные, так и неуспешные попытки. Косвенно говорит о здоровье диска. Чем больше значение - тем хуже. Однако нельзя однозначно судить о здоровье диска по этому параметру, не рассматривая другие атрибуты. 197 C5 Current Pending Sector Count Количество секторов, являющихся кандидатами на переназначение в резервную область. Они не были ещё определены как плохие, но скорость считывания с них отличается от чтения стабильного сектора (это так называемые подозрительные или нестабильные секторы). В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения. Рост значения этого атрибута может свидетельствовать о физической деградации жёсткого диска. При ненулевом значении нужно обязательно запустить в программах Victoria или MHDD последовательное чтение всей поверхности с опцией remap. Тогда при сканировании диск обязательно наткнётся на плохой сектор и попытается произвести запись в него (в случае Victoria 3.5 и опции Advanced remap диск будет пытаться записать сектор до 10 раз). Таким образом программа спровоцирует «лечение» сектора, и в итоге он будет либо исправлен, либо переназначен. 198 C6 (Offline) Uncorrectable Sector Count Количество секторов-кандидатов на переназначение, обнаруженных при одном из видов самотестирования диска - оффлайн-тестировании, которое диск запускает в простое в соответствии с параметрами, заданными прошивкой. Ненулевое значение говорит о неполадках на диске (точно так же, как и с параметром 197). 199 C7 UltraDMA CRC Error Count Число ошибок, возникающих при передаче данных по по интерфейсному кабелю в режиме UltraDMA или его эмуляции винчестерами SATA (нарушения целостности пакетов и т. п.). В подавляющем большинстве случаев причинами ошибок становятся некачественный шлейф передачи данных, разгон шин PCI/PCI-E либо плохой контакт в SATA-разъёме на диске или на материнской плате/контроллере. Для Hitachi серий Deskstar 7К3000 и 5К3000 растущий атрибут может говорить о несовместимости диска и SATA-контроллера. Чтобы исправить ситуацию, нужно принудительно переключить такой диск в режим SATA 3 Гбит/с. 200 C8 Write Error Rate

Multi-Zone Error Rate

Частота возникновения ошибок записи. Ненулевое значение говорит о проблемах с диском - в частности, у дисков WD большие цифры могут означать деградирующие головки. 201 C9 Soft Read Error Rate Частота появления ошибок чтения по вине программного обеспечения. 202 CA Data Address Mark Errors Число ошибок Data Address Mark (DAM). Ненулевое значение - это плохо 203 CB Run Out Cancel Количество ошибок ECC. 204 CC Soft ECC Correction Количество ошибок ECC, скорректированных программным способом. 205 CD Thermal Asperity Rate (TAR) Number of thermal asperity errors. 206 CE Flying Height Высота между головкой и поверхностью диска. 207 CF Spin High Current Величина силы тока при раскрутке диска. 208 D0 Spin Buzz Number of buzz routines to spin up the drive. 209 D1 Offline Seek Performance Производительность поиска во время оффлайновых операций. 220 DC Disk Shift Дистанция смещения блока пластин диска относительно оси шпинделя. В основном возникает из-за удара или падения. Единица измерения неизвестна. При увеличении атрибута диск быстро становится неработоспособным. 221 DD G-Sense Error Rate Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного датчика удара. 222 DE Loaded Hours Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область. 223 DF Load/Unload Retry Count Количество новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной области после неудачной попытки. 224 E0 Load Friction Величина силы трения блока магнитных головок при его выгрузке из парковочной области. 225 E1 Load Cycle Count Количество циклов перемещения блока магнитных головок в парковочную область. 226 E2 Load 'In'-time Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска. 227 E3 Torque Amplification Count Количество попыток скомпенсировать вращающий момент. 228 E4 Power-Off Retract Cycle Количество повторов автоматической парковки блока магнитных головок в результате выключения питания. 230 E6 GMR Head Amplitude Амплитуда дрожания (расстояние повторяющегося перемещения блока магнитных головок). 231 E7 Temperature Температура жёсткого диска. 240 F0 Head Flying Hours Время, затраченное на позиционирования головки. Счётчик может содержать несколько значений в одном поле. 250 FA Read Error Retry Rate Число ошибок во время чтения жёсткого диска. 254 FF Free Fall Event Count Количество ускорений свободного падения диска, которым он подвергался (проще говоря, показывает, сколько раз диск падал).

www.vrn123.ru

Расшифровка и понимание SMART атрибутов

Маленький рассказ об S.M.A.R.T. атрибутах, их важности и понимании. В статье пойдет речь об расшифровке всех smart атрибутов ATA дисков. В предыдущих статьях речь шла об мониторинге BBU и жестких SCSI дисков и их атрибутов под Megaraid контроллером. Теперь хочу немного описать атрибуты обычных АТА дисков на примере Seagate Barracuda ES.2 (ST31000340NS). Так же определим самые важные атрибуты, на которые нужно обращать внимание при мониторинге дисков используя smartctl. Для начала, можно убедиться, что наш диск поддерживает смарт

[email protected] s01:~# smartctl -i /dev/sda smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.8.0-29-generic] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Model Family: Seagate Barracuda ES.2 Device Model: ST31000340NS Serial Number: 9QJ2ADVC … ATA Version is: 8 ATA Standard is: ATA-8-ACS revision 4 Local Time is: Fri Feb 21 16:18:35 2014 CET … SMART support is: Available - device has SMART capability. SMART support is: Enabled

Две последние строки свидетельствуют о том, что диск поддерживает smart и можно посмотреть значение всех его атрибутов и их интерпретация будет корректной(интерпретация RAW_VALUE) . В данном случаи тип интерфейса (устройства) не указывался явно (не было указанно атрибут «-d»), по этому smartctl автоматически определил тип устройства и сказал, что «SMART support is: Enabled». Но если используются, к примеру массивы дисков (RAID контроллер), то smartctl может сказать, что смарт не поддерживается:

[email protected]:~# smartctl -i /dev/sda smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.8.0-26-generic] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: SMC Product: SMC2108 Revision: 2.90 User Capacity: 2,996,997,980,160 bytes [2.99 TB] Logical block size: 512 bytes Logical Unit id: 0x600304800086531015527e0b0664df74 Serial number: 0074df64060b7e521510538600800403 Device type: disk Local Time is: Fri Feb 21 17:32:27 2014 IST Device does not support SMART

Но на самом деле, нужно просто знать (или подбирать) какие дисковые массивы используются, и тогда можно получить желаемый результат явно указав тип устройства:

[email protected]:~# smartctl -d megaraid,14 -i /dev/sda smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.8.0-26-generic] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: SEAGATE Product: ST1000NM0001 Revision: 0002 User Capacity: 1,000,204,886,016 bytes [1.00 TB] Logical block size: 512 bytes Logical Unit id: 0x5000c50041080343 Serial number: Z1N0TV980000C2157TYR Device type: disk Transport protocol: SAS Local Time is: Fri Feb 21 17:34:45 2014 IST Device supports SMART and is Enabled Temperature Warning Enabled

Также может быть проблема в версии smartctl ибо не все жесткие диски добавляются в базу SMART сразу после выхода в мир нового HDD или RAID контроллера. Или же в BIOS отключено поддержку (нужно включить). Так же может быть проблема в прошивке (firmware) самого жесткого диска. Можете также стоит для начала попытаться включить SMART командой:

[email protected]:~# smartctl -s on /dev/sda smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.8.0-26-generic] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF ENABLE/DISABLE COMMANDS SECTION === SMART Enabled.

Следующая, интересующая нас часть вывода покажет суммарный результат проверки статуса здоровья диска (Если не Passed – нужно проводить замену диска). Так же выводится дополнительные характеристики диска и предполагаемое время выполнения коротких и длинных тестов.

[email protected]:~# smartctl -Hc /dev/sda smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.8.0-29-generic] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x82) Offline data collection activity was completed without error. Auto Offline Data Collection: Enabled. Self-test execution status: ( 41) The self-test routine was interrupted by the host with a hard or soft reset. Total time to complete Offline data collection: ( 634) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 1) minutes. Extended self-test routine recommended polling time: ( 226) minutes. Conveyance self-test routine recommended polling time: ( 2) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported.

В нашем случаи тип устройства определился автоматически и теперь можно вывести самое интересное — список атрибутов.

[email protected]:~# smartctl -A /dev/sda smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.8.0-29-generic] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 068 059 044 Pre-fail Always - 130449727 3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 23 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 4 7 Seek_Error_Rate 0x000f 063 039 030 Pre-fail Always - 549998464474 9 Power_On_Hours 0x0032 052 052 000 Old_age Always - 42335 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 037 020 Old_age Always - 63 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 093 000 Old_age Always - 4295032870 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 076 049 045 Old_age Always - 24 (Min/Max 18/26) 194 Temperature_Celsius 0x0022 024 051 000 Old_age Always - 24 (0 17 0 0) 195 Hardware_ECC_Recovered 0x001a 041 021 000 Old_age Always - 130449727 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

Используя SMART можно предугадать с довольно большой вероятностью проблемы связанные с:

  • Магнитными головками диска
  • Физическими повреждениями диска
  • Логическими ошибками
  • Механическими проблемами (проблемы привода, системы позиционирования)
  • Подачей питания (платы)
  • Температурой

Расшифруем полученный вывод.

Каждый атрибут имеет группу значений:

  • ID# — идентификационный номер атрибуты (детали здесь). Каждый атрибуты имеет свой уникальный ID, который должен быть одинаковым для всех фирм производителей дисков.
  • ATTRIBUTE_NAME – название атрибута. Так как разные фирмы производители дисков могут называть атрибуты по своему (сокращать, синонимы), лучше всего ориентироваться по ID атрибута.
  • FLAG (Status flag) – каждый атрибут имеет определенный флаг, назначенный фирмой разработчиком диска. В ОС с графическим интерфейсом значения этого флага предоставляется в виде набора буквенных обозначений – w,p,r,c,o,s (расшифровка ниже). И эти наборы предоставляются в виде шестнадцатеричного числа которые вы видели выше.
  1. Warranty: Указывает на жизненно важный атрибут диска и покрывается гарантией. Если этот флаг установлен и значение атрибута с этим флагом достигнет порогового (threshold) значения, в то время, когда диск еще на гарантии, то фирма должна будет заменить диск бесплатно.
  2. Performance: Указывает на атрибут, который представляет показатель производительности диска – не критический.
  3. Error Rate: Атрибут с частотой ошибок.
  4. Count of occurrences: Атрибут-счетчик происшествий.
  5. Online test: Атрибут, который обновляет значения только через on-line тесты. Если не указан, то обновляется через off-line тесты.
  6. Self preserving: Указывает на атрибут который может собирать и сохранять данные о диска, даже если S.M.A.R.T. отключен.
  • Value – Текущее значение атрибута(оценка атрибута диска на основе Raw_value). Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше. Это значение атрибута нужно сравнивать с пороговым (threshold) значением. Если это критический атрибут и значение ниже порогового — нужно проводить замену диска.
  • Worst – Самое низкое значение атрибута за жизненный цикл диска. Значение может изменяться на протяжении жизни диска, и не должно быть ниже или равным пороговому значению (threshold).
  • Thresh (Threshold) – Пороговое значения атрибута назначенное создателем диска. Значение не меняется за жизненный цикл диска. Если значение Value атрибута станет равным или меньше порогового – появиться уведомление в колонке WHEN_FAILED. И диск нужно заменить.
  • Type – тип атрибута. Может быть критическим (pre-fail), который указывает на предстоящий отказ диска из-за ошибок или не критический, указывающий на достижение конца жизненного цикла диска.
  • Raw_value – Объективное значения атрибута, которое показывается в десятичном формате (вычисляется firmware диска) и известных только производителю единицах (имеет связь с Value, Threshold и Worst значениями).
  • WHEN_FAILED – Указывает на проблемы с атрибутом.

Атрибут диска примет значение failed, в случаи:

Value = f(Raw_value) <= Threshold

Здесь:

  • f(Raw_value) – функция вычисления деградации (уменьшения) значения параметра Value в зависимости от значения Raw_value.

Недостатки такого подхода к вычислению деградации диска:

  • Для каждого производителя дисков и даже модели диска функция f(Raw_value) вычисляется по-разному.
  • Оценка каждого атрибута подсчитывается независимо друг от друга – т.е. игнорируются связи между атрибутами.

Теперь хочу представить таблицу с перечисленными всех атрибутов. Те атрибуты, которые выделены розовым — относятся к атрибутам критическим. К тому же, указано тип параметра в зависимости от величины значения. Т.е. чем больше значение параметра, тем лучше состояние здоровья диска или наоборот.

Чем выше значение Value, тем лучше состояние диска.
Чем ниже значение Value, тем лучше состояние диска.
Критический атрибут В ближайшие время диск выйдет из строя — нужна смена диска

Теперь приступим к атрибутам:

#ID HEX Имя атрибута Лучше если… Описание
01 01 Raw Read Error Rate Частота ошибок при чтении данных с жёсткого диска. Происхождение их обусловлено аппаратной частью винчестера.
02 02 Throughput Performance Общая производительность накопителя. Если значение атрибута уменьшается перманентно, то велика вероятность проблем с винчестером.
03 03 Spin-Up Time Время раскрутки шпинделя из состояния покоя (0 rpm) до рабочей скорости. В поле Raw_value содержится время в миллисекундах/секундах в зависимости от производителя
04 04 Start/Stop Count * Полное число запусков, остановок шпинделя. Иногда в том числе количество включений режима энергосбережения. В поле raw value хранится общее количество запусков/остановок жёсткого диска.
05 05 Reallocated Sectors Count Число операций переназначения секторов. При обнаружении повреждённого сектора на винчестере, информация из него помечается и переносится в специально отведённую зону, происходит утилизация bad блоков, с последующим консервированием этих мест на диске. Этот процесс называют remapping. Чем больше значение Reallocated Sectors Count, тем хуже состояние поверхности дисков — физический износ поверхности. Поле raw value содержит общее количество переназначенных секторов.
07 07 Seek Error Rate Частота ошибок при позиционировании блока магнитных головок. Чем больше значение, тем хуже состояние механики, или поверхности жёсткого диска.
08 08 Seek Time Performance Средняя производительность операции позиционирования. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью.
09 09 Power-On Hours (POH) Время, проведённое устройством, во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ.
10 0A Spin-Up Retry Count Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.
11 0B Recalibration Retries Количество повторов рекалибровки в случае, если первая попытка была неудачной.
12 0C Device Power Cycle Count Число циклов включения-выключения винчестера.
13 0D Soft Read Error Rate Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению.
187 BB Reported UNC Errors Неустранимые аппаратные ошибки.
190 BE Airflow Temperature Температура воздуха внутри корпуса жёсткого диска. Целое значение, либо значение по формуле 100 — Airflow Temperature
191 BF G-sense error rate Количество ошибок, возникающих в результате ударов.
192 C0 Power-off retract count Число циклов аварийных выключений.
193 C1 Load/Unload Cycle Количество циклов перемещения блока головок в парковочную зону.
194 C2 HDA temperature Показания встроенного термодатчика накопителя.
195 C3 Hardware ECC Recovered Число коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по внешнему интерфейсу).
196 C4 Reallocation Event Count Число операций переназначения в резервную область, успешные и неудавшиеся попытки.
197 C5 Current Pending Sector Count Число секторов- кандидатов на перенос в резервную зону. Помечены как не надёжные. При последующих корректных операциях атрибут может быть снят.
198 C6 Uncorrectable Sector Count Число некорректируемых ошибок при обращении к сектору.
199 C7 UltraDMA CRC Error Count Число ошибок при передаче данных по внешнему интерфейсу.
200 C8 Write Error Rate /Multi-Zone Error Rate Общее количество ошибок при заполнения сектора информацией. Показатель качества накопителя.
201 C9 Soft read error rate Частота появления «программных» ошибок при чтении данных с диска, а не аппаратной части HDD.
202 Ca Data Address Mark errors Число ошибок адресно помеченной информации (Data Address Mark (DAM)).Если автоматически не корректируется — заменить устройство.
203 CB Run out cancel Количество ошибок ECC данных, присоединяемые к передаваемому сигналу, позволяющие принимающей стороне определить факт сбоя или исправить несущественную ошибку.
204 CC Soft ECC correction Количество ошибок ECC, скорректированных программным способом.
205 CD Thermal asperity rate (TAR) Число ошибок в следствии температурных колебаний.
206 CE Flying height * Высота между головкой и поверхностью диска компьютера.
209 D1 Offline seek performance * Drive’s seek performance during offline operations.
220 DC Disk Shift Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения.
221 DD G-Sense Error Rate Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного crash датчика.
222 DE Loaded Hours * Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.
223 DF Load/Unload Retry Count * Количество новых попыток выгрузок/загрузок блока магнитных головок винчестера в/из парковочной области после неудачной попытки.
224 E0 Load Friction Величина силы трения блока магнитных головок при его выгрузке из парковочной области.
225 E1 Load Cycle Count Число циклов вход-выход в парковочную зону.
226 E2 Load ‘In’-time * Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.
227 E3 Torque Amplification Count Количество попыток скомпенсировать вращающий момент.
228 E4 Power-Off Retract Cycle Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.
230 E6 GMR Head Amplitude * Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок).
231 E7 Temperature Температура жёсткого диска.
240 F0 Head flying hours * Время позиционирования головки.
250 FA Read error retry rate Число ошибок во время чтения жёсткого диска.

Атрибуты дисков нужно смотреть в целом и самостоятельно прогнозировать замену, не только опираясь на smart атрибуты. Нужно дополнительно проводить тесты на бедблоки и запускать fscheck и smart тесты, о которых пойдет речь в следующих статьях.

sysadm.pp.ua

SMART диагностика жесткого диска: зачем она нужна?

Современные жесткие диски оснащаются специальной микропрограммой самодиагностики S.M.A.R.T. (self-monitoring, analysis and reporting technology). Эта технология позволяет отслеживать состояние HDD, анализировать его работу и предсказывать выход из строя. «СМАРТ» отслеживает свыше 40 параметров, результат по каждому из которых вносится в специальную таблицу. Анализ статистики S.M.A.R.T. позволяет обнаружить уязвимые места и предсказать выход жесткого диска из строя.

Эта статья расскажет о том, как посмотреть SMART жесткого диска, расшифровать его показания, и каким параметрам следует уделить повышенное внимание. Стоит отметить, что информация подается структурированно, но для извлечения из нее данных требуется специальное ПО.

Как посмотреть S.M.A.R.T. жесткого диска. Расшифровка параметров.

Чтобы проверить параметры «СМАРТ», нужно чтобы эта функция была включена в системе. Это актуально для компьютеров, выпущенных до 2010 года. В них в BIOS присутствует опция HDD S.M.A.R.T. Capability, включение которой позволяет полноценно отслеживать «СМАРТ». В новых ПК вопрос «как включить S.M.A.R.T. на жестком диске?» неактуален – все включено по умолчанию.

Для просмотра параметров состояния HDD нужна специальная утилита для работы с ЖД (Victoria, HD Tune, HDD Scan) или комплексные диагностические программы (Everest или ее «наследница» Aida64). Они позволяют вывести таблицу в легком для понимания виде.

Проанализируем параметры на примере «Виктории». Как видно из изображения, жесткий диск (в данном случае это Seagate на 200 Гб с устаревшим интерфейсом IDE) поддерживает не все команды «СМАРТ» и фиксирует часть параметров.

В заглавии таблицы можно увидеть ID параметра, его имя, значения VAL, Wrst, Tresh и Raw, а также оценочную графу Health.

  • ID – номер параметра в общем списке анализируемых критериев.
  • VAL – текущее его значение в абстрактных единицах (обычно процентах от идеального показателя).
  • Wrst – наихудшее значение, которого винчестер когда-либо достигал.
  • Tresh – условный порог для значения VAL, по достижении которого система уведомляет о надвигающейся «смерти» HDD.
  • RAW – выражение параметра VAL в численном формате (количество часов наработки/сбоев/ошибок/багов).

Параметр Health позволяет оценить состояние HDD людям, незнакомым с тонкостями компьютерного железа или английским языком. Он присваивает привычную оценку от 1 до 5 баллов каждому из них.

При анализе состояния жесткого диска следует обратить внимание на VAL (сравнивая с графой Tresh) и RAW (для объективной оценки). В приведенном примере видно, что ЖД пережил много ошибок чтения (у Seagate, Fujitsu и Samsung на эту графу можно не смотреть – сюда фиксируются все ошибки) и имеет большое время работы (параметр 9). Из таблицы видно, что число коррекций аппаратных ошибок (параметр 195) достаточно высоко. Остальные значения «СМАРТ» в норме, или близки к ней. Важно, что параметр 5 (Reallocated Sectors Count) – в норме. Это означает, что количество сбойных секторов невелико (11 в данном случае) и самому диску пока ничего не угрожает.

В случае, если параметр 5 отличается тревожными значениями, здоровье HDD под угрозой. На приведенном скриншоте графа Reallocated Sectors Count указывает, что ЖД близок к выходу из строя. В данном случае это – сбой системы (несоответствие нулевого значения RAW и критического показателя VAL указывает на это), и для приведения в норму требуется восстановление SMART жесткого диска. Но обычно такие сведения указывают, что HDD вот-вот сломается, и им уже нельзя нормально пользоваться.

Как сбросить или восстановить S.M.A.R.T. жесткого диска

Мы не можем рассказать подробно, как сбросить SMART жесткого диска. Это действие хоть и не является преступным (в отличие от той же смены IMEI смартфона), но может помочь недобросовестным торговцам продавать неисправные ЖД под видом новых. Но для пользователей, которым нужно знать, как восстановить SMART жесткого диска, чтобы вернуть его в строй после программного сбоя, разъясним ситуацию в общих чертах.

  • Для сброса S.M.A.R.T. (ровно как и других сервисных задач) требуется подключение ЖД по интерфейсу COM. Для этого производители оснащают HDD специальным разъемом из 4 или 5 контактов. Он расположен рядом с гнездами для кабелей передачи данных и подачи питания. Новые компьютеры часто не имеют гнезда COM на задней панели, поэтому его функции выполняет специальная плата USB-COM.

Интерфейсные разъемы жесткого диска

  • Чтобы сбросить смарт жесткого диска, необходимо использовать специальный переходник и программу Hyper Terminal. В старых версиях Windows (до XP включительно) она встроена. В ОС поновее ее нужно скачать и установить отдельно. Подойдут также программы PuTTY, TeraTerm.

    COM-TTL адаптер для подключения HDD

  • Процедура обнуления «СМАРТ» для разных моделей и поколений ЖД отличается. Сброс SMART жесткого диска WD отличается от аналогичных мероприятий с накопителями Seagate, Hitachi или Fujitsu. У «Вестернов» проблема может заключаться еще и в том, что контактов COM-интерфейса у некоторых моделей WD нет.
  • Никто не гарантирует, что SMART восстановится к заводским значениям, и что он обнулится вообще, а ЖД будет нормально работать после этого.
  • Сброс «СМАРТ» обнуляет статистику неполадок, но не ликвидирует их. Восстановив S.M.A.R.T. до заводских значений, сам HDD останется в прежнем состоянии. После сброса на неисправном ЖД на выходе будет сломанный жесткий, который «думает», что он новый, и никак иначе.

blog.priceok.ru

Значения аттрибутов S.M.A.R.T. » Познавательный блог

Многие программы для диагностики жестких дисков умеют показывать S.M.A.R.T. Но что такое это S.M.A.R.T и что значат все те значения, которые он нам выдаёт?

S.M.A.R.T — Self-Monitoring, Analysis and Reporting Technology — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

Система самодиагностики S.M.A.R.T. производит наблюдение за основными параметрами винчестера. Каждый атрибут имеет определенное значение – Value, характеризующее степень надежности. Эта величина изменяется в определенном диапазоне, например, от 1 до 100 или от 1 до 253. Чем выше значение Value, тем лучше. Исправный винчестер должен выдавать максимум по всем параметрам, а изменяющиеся во времени или уверенно убывающие значения в теории не судят ничего хорошего. Для каждого атрибута производитель выбирает минимальное значение, при котором гарантируется безотказная работа данной модели жесткого диска. Эта величина именуется пороговым значением - threshold.

Для просмотра атрибутов существует большое количество программ. Я рекомендую использовать MHDD (под DOS) либо универсальный информатор AIDA32 (под Windows).

Информация по атрибутам:

Критически важные атрибуты:

Raw Read Error Rate – частота ошибок при чтении данных с диска. Частота появления ошибок чтения информации с диска, происхождение которых обусловлено аппаратной частью жесткого диска.Read Channel Margin – запас канала чтения. Назначение неизвестно.Reallocated Event Count – Количество операций переназначения сбойных секторов. Показывает общее число попыток переназначения сбойных секторов в резервную область диска. При этом учитываются как успешные, так и неудачные операции.Reallocated Sector Count – число переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи, он пытается переместить поврежденные данные в резервную область и, в случае успеха, помечает сектор как переназначенный. Благодаря этой возможности жесткие диски способны скрывать незначительное число плохих секторов.Seek Error Rate – ошибки позиционирования блока головок. Ошибки позиционирования возникают при повреждении сервометок, перегреве носителя или в случае сбоя механической системы позиционирования. Большое количество ошибок позиционирования свидетельствует о низком качестве поверхности или поврежденной механике головок носителя.Spin Retry Count – число повторных попыток раскрутки дисков до рабочей скорости при условии, что первая попытка была неудачной. Атрибут имеет не прямое значение, а отражает некий сборный параметр надежности.Spin Up Time – среднее время раскрутки диска из состояния покоя до рабочей скорости. Ухудшение атрибута зачастую свидетельствует о некачественном блоке питания. Ухудшение аттрибута свидетельствует о возможных механических и температурных проблемах.

Информационные атрибуты:

Current Pending Sector Count – текущее число нестабильных секторов. Здесь хранится число претендентов на переназначение в резервную область диска. Если сектор будет считываться успешно, то он исключается из списка. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить и перенести информацию в резервную область, а сам сектор пометит как переназначенный. Постоянно нулевое значение этого атрибута говорит о низком качестве поверхности диска.Disk Shift — сдвиг пакета дисков относительно оси шпинделя (часто возникает при падении винчестера).Drive Temperature – температура. Отражает показания встроенного термодатчика. Температура имеет огромное влияние на срок службы диска.G-Sense Error Rate – частота появления ошибок в результате ударных нагрузок. В соответствии с показаниями ударочувствительного сенсора выводит общее количество ошибок, возникших в результате удара, падения или неаккуратной установки диска в корпус компьютера.GMR Head Amplitude – амплитуда дрожания головок в рабочем состоянии. Воздействие центробежной силы приводит к дрожанию головок над поверхностью диска. Высокая амплитуда дрожания может вызвать соприкосновение блока головок с поверхностью. Как следствие – появление поврежденных секторов.Hardware ECC Recovered - количество ошибок чтения, которые были исправлены аппаратной частью HDD. При записи на диск к основным данным добавляется избыточная информация, которая позволяет восстановить данные, если они были считаны с ошибкой (естественно, восстановление возможно в некоторых пределах).Load Friction - нагрузка на привод головок, вызванная трением в механических частях накопителя.Load-in Friction (Hours\Time) – общее время работы головки под влиянием нагрузок. Показывает общее время работы головок под влиянием центробежных сил.Load-in Time — общее время нагрузки на привод головок. Предположительно данный атрибут показывает общее время работы накопителя под нагрузкой при условии, что головки находятся в рабочем состоянии (вне парковочной зоны).Load/Unload Cycle Count - количество циклов вывода головок в специальную парковочную зону/в рабочее положение.Load/Unload Retry Count - нагрузка на привод головок, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п. Учитывается только период, в течение которого головки находились в рабочем положении.Loaded Hours — нагрузка на привод головок, вызванная общей наработкой часов накопителем. Учитывается только период, в течение которого головки находились в рабочем положении.Offline Correctable - этот атрибут относится к фоновому тестированию поверхности на предмет сбойных или ненадежных секторов. Предположительно, содержит количество сбойных секторов, найденных в этом режиме.Power Cycle Count (Device (Drive) Power Cycle Count) – число полных циклов включения/выключения винчестера. По этому атрибуту можно оценить, как часто использовался диск.Power Off Retract Count — количество зафиксированных повторов включения/выключения питания накопителя.Power-On Hours – количество наработанных часов. Показывает общее время работы диска. В качестве порогового значения выбирается паспортное время наработки на отказ (MTBF – Mean Time Between Failures).Recalibration Retries – количество повторов рекалибровки. Характеризует количество попыток установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Значение этого атрибута, меньшее порогового, говорит о неполадках в механике жесткого диска.Seek Time Performance — средняя производительность операций позиционирования головок. Данный параметр показывает среднюю скорость позиционирования привода головок на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода.Soft Read Error Rate – частота появления «программных» ошибок при чтении данных с диска. Информирует о программных ошибках чтения данных. К таковым можно отнести ошибки программного обеспечения, драйверов, файловой системы и неверную разметку диска. В общем, почти все, что не относится к аппаратной части винчестера.Start/Stop Count – число циклов запуск-остановка шпинделя. Двигатель жесткого диска имеет вполне определенное – гарантированное производителем – число старт-стопов. Это значение и выбирается в качестве критического порога.Throughput Performance – средняя производительность диска. Показывает среднюю пропускную способность жесткого диска. Уменьшение значения с некоторой вероятностью указывает на проблемы в накопителе.Torque Amplification Count - количество усилий вращающего момента привода.UltraDMA (Ultra ATA) CRC Error Count – общее количество ошибок CRC в режиме UltraDMA. На практике подобные ошибки появляются при разгоне системы, сильно перекрученном шлейфе, а также по вине драйвера.Uncorrectable Sector Count – число нескорректированных ошибок. Информирует об ошибках чтения/записи, которые не удалось исправить. Возможной причиной возникновения подобных ошибок может быть повреждение механики или поверхности диска.Write Error Rate (Multi Zone Error Rate) - частота появления ошибок при записи данных. Показывает общее число ошибок записи на диск. Чем меньше значение атрибута, тем хуже состояние поверхности или механики винчестера.Использованы материалы из следующих источников: "Игромания", IZone

www.makak.ru


Смотрите также