S m a r t жесткого диска


Как исправить SMART ошибку жесткого диска или SSD

При загрузке компьютера или ноутбука возникает появляется S.M.A.R.T. ошибка жесткого диска или SSD? После данной ошибки компьютер не работает как прежде, и вы опасаетесь о сохранности ваших данных? Не знаете как исправить ошибку?

Актуально для ОС: Windows 10, Windows 8.1, Windows Server 2012, Windows 8, Windows Home Server 2011, Windows 7 (Seven), Windows Small Business Server, Windows Server 2008, Windows Home Server, Windows Vista, Windows XP, Windows 2000, Windows NT.

Что делать со SMART ошибкой?

  1. Прекратите использование сбойного HDD;
  2. Восстановите удаленные данные диска;
  3. Просканируйте диск на наличие «битых» секторов;
  4. Снизьте температуру диска;
  5. Произведите дефрагментацию жесткого диска;
  6. Приобретите новый жесткий диск;

Шаг 1: Прекратите использование сбойного HDD

Получение от системы сообщения о диагностике ошибки не означает, что диск уже вышел из строя. Но в случае наличия S.M.A.R.T. ошибки, нужно понимать, что диск уже в процессе выхода из строя. Полный отказ может наступить как в течении нескольких минут, так и через месяц или год. Но в любом случае, это означает, что вы больше не можете доверить свои данные такому диску.

Необходимо побеспокоится о сохранности ваших данных, создать резервную копию или перенести файлы на другой носитель информации. Одновременно с сохранностью ваших данных, необходимо предпринять действия по замене жесткого диска. Жесткий диск, на котором были определены S.M.A.R.T. ошибки нельзя использовать – даже если он полностью не выйдет из строя он может частично повредить ваши данные.

Конечно же, жесткий диск может выйти из строя и без предупреждений S.M.A.R.T. Но данная технология даёт вам преимущество предупреждая о скором выходе диска из строя.

Шаг 2: Восстановите удаленные данные диска

В случае возникновения SMART ошибки не всегда требуется восстановление данных с диска. В случае ошибки рекомендуется незамедлительно создать копию важных данных, так как диск может выйти из строя в любой момент. Но бывают ошибки при которых скопировать данные уже не представляется возможным. В таком случае можно использовать программу для восстановления данных жесткого диска – Hetman Partition Recovery.

Для этого:

  1. Загрузите программу, установите и запустите её.
  2. По умолчанию, пользователю будет предложено воспользоваться Мастером восстановления файлов. Нажав кнопку «Далее», программа предложит выбрать диск, с которого необходимо восстановить файлы.
  3. Дважды кликните на сбойном диске и выберите необходимый тип анализа. Выбираем «Полный анализ» и ждем завершения процесса сканирования диска.
  4. После окончания процесса сканирования вам будут предоставлены файлы для восстановления. Выделите нужные файлы и нажмите кнопку «Восстановить».
  5. Выберите один из предложенных способов сохранения файлов. Не сохраняйте восстановленные файлы на диск с ошибкой.

Шаг 3: Просканируйте диск на наличие «битых» секторов

Запустите проверку всех разделов жесткого диска и попробуйте исправить найденные ошибки.

Для этого, откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с SMART ошибкой. Выберите Свойства / Сервис / Проверить в разделе Проверка диска на наличия ошибок.

В результате сканирования обнаруженные на диске ошибки могут быть исправлены.

Шаг 4: Снизьте температуру диска

Иногда, причиной возникновения “S M A R T” ошибки может быть превышение максимально допустимой температуры работы диска. Такая ошибка может быть устранена путём улучшения вентиляции компьютера. Во-первых, проверьте оборудован ли ваш компьютер достаточной вентиляцией и все ли вентиляторы исправны.

Если вами обнаружена и устранена проблема с вентиляцией, после чего температура работы диска снизилась до нормального уровня, то SMART ошибка может больше не возникнуть.

Шаг 5: Произведите дефрагментацию жесткого диска

Откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с ошибкой. Выберите Свойства / Сервис / Оптимизировать в разделе Оптимизация и дефрагментация диска.

Выберите диск, который необходимо оптимизировать и кликните Оптимизировать.

Примечание. В Windows 10 дефрагментацию и оптимизацию диска можно настроить таким образом, что она будет осуществляться автоматически.

Шаг 6: Приобретите новый жесткий диск

Если вы столкнулись со SMART ошибкой жесткого диска то, приобретение нового диска – это только вопрос времени. То, какой жесткий диск нужен вам зависит от вашего стиля работы за компьютером, а также цели с которой его используют.

На что обратить внимание приобретая новый диск:

  1. Тип диска: HDD, SSD или SSHD. Каждому типу присущи свои плюсы и минусы, которые не имеют решающего значения для одних пользователей и очень важны для других. Основные из них – это скорость чтения и записи информации, объём и устойчивость к многократной перезаписи.
  2. Размер. Два основных форм-фактора дисков: 3,5 дюймов и 2,5 дюймов. Размер диска определяется в соответствии с установочным местом конкретного компьютера или ноутбука.
  3. Интерфейс. Основные интерфейсы жестких дисков:
    • SATA;
    • IDE, ATAPI, ATA;
    • SCSI;
    • Внешний диск (USB, FireWire и.т.д.).
  4. Технические характеристики и производительность:
    • Вместимость;
    • Скорость чтения и записи;
    • Размер буфера памяти или cache;
    • Время отклика;
    • Отказоустойчивость.
  5. S.M.A.R.T. Наличие в диске данной технологи поможет определить возможные ошибки его работы и вовремя предупредить утерю данных.
  6. Комплектация. К данному пункту можно отнести возможное наличие кабелей интерфейса или питания, а также гарантии и сервиса.

Как сбросить SMART ошибку?

SMART ошибки можно легко сбросить в BIOS (или UEFI). Но разработчики всех операционных систем категорически не рекомендуют этого делать. Если же для вас не имеют ценности данные на жестком диске, то вывод SMART ошибок можно отключить.

Для этого необходимо сделать следующее:

  1. Перезагрузите компьютер, и с помощью нажатия указанной на загрузочном экране комбинации клавиш (у разных производителей они разные, обычно “F2” или “Del”) перейдите в BIOS (или UEFI).
  2. Перейдите в: Аdvanced > SMART settings > SMART self test. Установите значение Disabled.

Примечание: место отключения функции указано ориентировочно, так как в зависимости от версии BIOS или UEFI, место расположения такой настройки может незначительно отличаться.

Целесообразен ли ремонт HDD?

Важно понимать, что любой из способов устранения SMART ошибки – это самообман. Невозможно полностью устранить причину возникновения ошибки, так как основной причиной её возникновения часто является физический износ механизма жесткого диска.

Для устранения или замены неправильно работающих составляющих жесткого диска, можно обратится в сервисный центр специальной лабораторией для работы с жесткими дисками.

Но стоимость работы в таком случае будет выше стоимости нового устройства. Поэтому, ремонт имеет смысл делать только в случае необходимости восстановления данных с уже неработоспособного диска.

SMART ошибка для SSD диска

Даже если у вас не претензий к работе SSD диска, его работоспособность постепенно снижается. Причиной этому служит факт того, что ячейки памяти SSD диска имеют ограниченное количество циклов перезаписи. Функция износостойкости минимизирует данный эффект, но не устраняет его полностью.

SSD диски имеют свои специфические SMART атрибуты, которые сигнализируют о состоянии ячеек памяти диска. Например, “209 Remaining Drive Life”, “231 SSD life left” и т.д. Данные ошибки могут возникнуть в случае снижения работоспособности ячеек, и это означает, что сохранённая в них информация может быть повреждена или утеряна.

Ячейки SSD диска в случае выхода из строя не восстанавливаются и не могут быть заменены.

Ошибка SMART исправлена? Оставляйте отзывы и задавайте ваши вопросы в комментариях.

hetmanrecovery.com

HDD – атрибуты S.M.A.R.T. (расшифровка параметров S.M.A.R.T. жёсткого диска)

S.M.A.R.T. (self-monitoring, analysis and reporting technology) - технология оценки состояния жёсткого диска встроенной аппаратной части самодиагностики, а также механизм предсказания времени выхода его из строя.

Информация S.M.A.R.T. содержит историю изменения большого количества параметров, отслеживаемых винчестером в процессе своего функционирования. Каждый атрибут имеет свой идентификатор (номер атрибута от 0 до 255 в десятичном значении), название (условное имя атрибута), тип (критический, показатель производительности, счетчик ошибок, счетчик событий), текущее значение, пороговое значение (наибольшее или наименьшее критическое значение), максимальное или минимальное зафиксированное значение в процессе работы. Ниже приведены описание атрибутов, параметров и значения S.M.A.R.T.

01 (01) Raw Read Error Rate - Частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска.

02 (02) Throughput Performance - Общая производительность диска.

03 (03) Spin-Up Time - Время раскрутки пакета дисков из состояния покоя до рабочей скорости.

04 (04) Start/Stop Count - Полное число циклов запуск-остановка шпинделя.

05 (05) Reallocated Sectors Count - Число операций переназначения секторов.

06 (06) Read Channel Margin - Запас канала чтения.

07 (07) Seek Error Rate - Частота ошибок при позиционировании блока магнитных головок.

08 (08) Seek Time Performance - Средняя производительность операции позиционирования магнитными головками.

09 (09) Power-On Hours (POH) – Время, проведённое во включенном состоянии.

10 (0А) Spin-Up Retry Count - Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.

11 (0В) Recalibration Retries - Количество повторов запросов рекалибровки в случае, если первая попытка была неудачной.

12 (0С) Device Power Cycle Count - Количество полных циклов включения-выключения диска.

13 (0D) Soft Read Error Rate - Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению.

180 (B4) Unused Reserved Block Count Total - кол-во резервных секторов, доступных для ремапа.

183 (B7) SATA Downshift Error Count - содержит количество неудачных попыток понижения режима SATA.

184 (B8) End-to-End error - после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают.

185 (B9) Head Stability - Стабильность головок (Western Digital).

187 (BB) Reported UNC Errors - Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами.

188 (BC) Command Timeout - содержит количество операций, выполнение которых было отменено из–за превышения максимально допустимого времени ожидания отклика.

189 (BD) High Fly Writes - содержит количество зафиксированных случаев записи при высоте головки выше расчётной.

190 (BE) Airflow Temperature (WDC) - Температура воздуха внутри корпуса жёсткого диска.

191 (BF) G-sense error rate - Количество ошибок, возникающих в результате ударных нагрузок.

192 (C0) Power-off retract count (Emergency Retry Count) - суммарное количество парковок БМГ диска в аварийных ситуациях или суммарное количество циклов включения/выключения питания диска.

193 (C1) Load/Unload Cycle - Количество циклов перемещения блока магнитных головок в парковочную зону / в рабочее положение.

194 (C2) HDA temperature - Здесь хранятся показания встроенного температурного датчика для механической части диска.

195 (C3) Hardware ECC Recovered - Число коррекции ошибок аппаратной частью диска.

196 (C4) Reallocation Event Count - содержит количество операций переназначения секторов.

197 (C5) Current Pending Sector Count - содержит количество секторов-кандидатов на переназначение в резервную область.

198 (C6) Uncorrectable Sector Count - Число неисправимых ошибок при обращении к сектору.

199 (C7) UltraDMA CRC Error Count - содержит количество ошибок, возникших по передаче по интерфейсному кабелю в режиме UltraDMA.

200 (C8) Write Error Rate / Multi-Zone Error Rate - Показывает общее количество ошибок, происходящих при записи сектора, а так же общее число ошибок записи на диск.

201 (C9) Soft read error rate - Частота появления «программных» ошибок при чтении данных с диска.

202 (CA) Data Address Mark errors - Number of Data Address Mark (DAM) errors (or) vendor-specific.

203 (CB) Run out cancel - Количество ошибок Error Correcting (ECC).

204 (CC) Soft ECC correction - Количество ошибок ECC, скорректированных программным способом.

205 (CD) Thermal asperity rate (TAR) - Количество ошибок из-за повышенной температуры.

206 (CE) Flying height - Высота между головкой и поверхностью диска.

207 (CF) Spin high current - Величина силы тока при раскрутке диска.

208 (D0) Spin buzz - Кол-во попыток раскрутки шпинделя из-из недостаточной мощности питателя.

209 (D1) Offline seek performance - Производительность поиска во время офлайновых операций (Drive’s seek performance during offline operations).

210 (D2) Vibration During Write - вибрация во время записи.

211 (D3) Vibration During Write - вибрация во время записи.

212 (D4) Shock During Write - удары во время записи.

220 (DC) Disk Shift - Дистанция смещения блока дисков относительно шпинделя.

221 (DD) G-Sense Error Rate - Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного датчика удара.

222 (DE) Loaded Hours - Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.

223 (DF) Load/Unload Retry Count - Количество новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной области после неудачной попытки.

224 (E0) Load Friction - Величина силы трения блока магнитных головок при его выгрузке из парковочной области.

225 (E1) Load Cycle Count - Количество циклов перемещения блока магнитных головок в парковочную область.

226 (E2) Load 'In'-time - Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.

227 (E3) Torque Amplification Count - Количество попыток скомпенсировать вращающий момент.

228 (E4) Power-Off Retract Cycle - Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.

230 (E6) GMR Head Amplitude - Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок).

231 (E7) Temperature - Температура жёсткого диска.

232 (E8) SSD Endurance Remaining - Количество завершенных физических циклов стирания на диске в процентах от максимально возможного.

232 (E8) Intel SSD Available Reserved Space - доступное резервное пространство в процентах от общего резервного пространства.

233 (E9) Power-On Hours - количество часов во включённом состоянии.

233 (E9) Intel SSD Media Wearout Indicator - индикатор износа носителя (100% для нового).

240 (F0) Head flying hours - Время позиционирования головки (для Fujitsu - Transfer Error Rate - частота ошибок передачи).

241 (F1) Total LBAs Written - количество записанных LBA.

242 (F2) Total LBAs Read - колисество считанных LBA.

250 (FA) Read error retry rate - Число ошибок во время чтения жёсткого диска.

254 (FE) Free Fall Event Count - содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т.е. проще говоря, показывает, сколько раз диск падал.

alexof.ru

технология внутренней оценки состояния HDD / Накопители

Введение

Сегодня, хотелось бы чуточку подробнее поговорить о вскользь упомянутой в предыдущей статье о критериях выбора винчестера технологии SMART, а также выяснить вопрос о появлении плохих секторов при проверке поверхности специальными программами и исчерпании резервной поверхности для их переназначения - вопросу, поднятому на форуме из прошлой статьи.

Для начала как всегда краткий исторический экскурс. Надежность жесткого диска (и любого устройства хранения в самом общем случае) всегда придается огромное значение. И дело отнюдь не в его стоимости, а в ценности той информации, которую он уносит с собой в мир иной, уходя из жизни сам, и в потерях прибыли, связанных с простоями при выходе из строя винчестеров, если речь идет о бизнес-пользователях, даже в том случае, если информация осталась. И вполне естественно, что о таких неприятных моментах хочется знать заранее. Даже обычные рассуждения на бытовом уровне подсказывают, что наблюдение за состоянием прибора в работе, может подсказать такие моменты. Осталось только каким-то образом реализовать это наблюдение в винчестере.

Впервые над этой задачей задумались инженеры голубого гиганта (IBM то бишь). И в 1995 году они предложили технологию, отслеживающую несколько критически важных параметров накопителя, и делающую попытки на основании собранных данных предсказать выход его из строя - Predictive Failure Analysis (PFA). Идею подхватила Compaq, которая чуть позже создала свою технологию - IntelliSafe. В разработке Compaq также поучаствовали Seagate, Quantum и Conner. Созданная ими технология также отслеживала ряд рабочих характеристик диска, сравнивала их с допустимым значением и рапортовала хост-системе в случае наличия опасности. Это был огромный шаг вперед если и не в повышении надежности винчестеров, то хотя бы в уменьшении риска потери информации при их использовании. Первые попытки оказались удачными, и показали необходимость дальнейшего развития технологии. Уже в объединении всех крупных производителей жестких дисков появилась технология S.M.A.R.T (Self Monitoring Analysing and Reporting Technology), базирующаяся на технологиях IntelliSafe и PFA (кстати говоря, PFA существует и поныне, как набор технологий для наблюдения и анализа за различными подсистемами серверов IBM, в том числе и дисковой подсистемой, причем наблюдение за последней базируется именно на технологии SMART).

Итак, SMART - это технология внутренней оценки состояния диска, и механизм предсказания возможного выхода из строя жесткого диска. Важно отметить то, что технология в принципе не решает возникающих проблем (основные из них показаны на рисунке чуть ниже), она способна лишь предупредить об уже возникшей проблеме либо об ожидающейся в ближайшем времени.

При этом нужно также сказать, что технология не в состоянии предсказать абсолютно все возможные проблемы и это логично: выход электроники в результате скачка напряжения, порча головок и поверхности в результате удара и т.п. никакая технология предсказать не в силах. Предсказуемы лишь те проблемы, которые связаны с постепенным ухудшением каких-либо характеристик, равномерной деградацией каких либо компонент.

Этапы развития технологии

В своем развитии технология SMART прошла три этапа. В первом поколении было реализовано наблюдение небольшого числа параметров. Никаких самостоятельных действий накопителя не предусматривалось. Запуск осуществлялся только командами по интерфейсу. Спецификации описывающей стандарт полностью нет, и, следовательно, не было и нет и четкого предначертания, о том, какие именно параметры надлежит контролировать. Более того, их определение и определение допустимого уровня их снижения целиком и полностью предоставлялся производителям винчестеров (что естественно в силу того, что производителю виднее что именно надлежит контролировать данном его винчестере, ибо все винчестеры слишком различны). И программное обеспечение, по этой причине, написанное, как правило, сторонними фирмами, не было универсальным, и могло ошибочно рапортовать о предстоящем сбое (путаница возникала из-за того, что под одним и тем же идентификатором различные производители хранили значения различных параметров). Имело место большое число жалоб на то, что число случаев обнаружения пред сбойного состояния чрезвычайно мало (особенности человеческой природы: получать хочется все и сразу, жаловаться на внезапные отказы дисков до внедрения SAMRT в голову как-то никому не приходило). Ситуация усугубилась еще и тем, что в большинстве случаев не были выполнены минимально необходимые требования для функционирования SMART (об этом поговорим позже). Статистика говорит о том, что число предсказываемых сбоев было менее 20%. Технология на этом этапе была далека от совершенства, но являлась революционным шагом вперед.

О втором этапе развития SMART - SMART II известно также не много. В основном наблюдались те же проблемы, что и с первой. Нововведениями являлись возможность фоновой проверки поверхности, выполняемая диском в автоматическом режиме при простоях и ведение журналов ошибок, расширился список контролируемых параметров (снова же в зависимости от модели и производителя). Статистика говорит о том, что число предсказываемых сбоев достигло 50%.

Современный этап представлен технологией SMART III. На ней остановимся подробней, попытаемся разобраться в общих чертах как она работает, что и зачем в ней нужно.

Нам уже известно, что SMART производит наблюдение за основными характеристиками накопителя. Эти параметры называются атрибутами. Необходимые к мониторингу параметры определяются производителем. Каждый атрибут имеет какую-то величину - Value. Обычно изменяется в диапазоне от 0 до 100 (хотя может быть в диапазоне до 200 или до 255), ее величина - это надежность конкретного атрибута относительно некоторого его эталонного значения (определяется производителем). Высокое значение говорит об отсутствии изменений данного параметра или, в зависимости от значения, его медленном ухудшении. Низкое значение говорит о быстрой деградации или о возможном скором сбое, т.е. чем выше значение Value атрибута, тем лучше. Некоторыми программами мониторинга выводится значение Raw или Raw Value - это значение атрибута во внутреннем формате (который так же различен у дисков разных моделей и разных производителей), в том, в котором он хранится в накопителе. Для простого пользователя он малоинформативен, больший интерес представляет посчитанное из него значение Value. Для каждого атрибута производителем определяется минимальное возможное значение, при котором гарантируется безотказная работа накопителя - Threshold. При значении атрибута ниже величины Threshold очень вероятен сбой в работе или полный отказ. Осталось только добавить, что атрибуты бывают критически важными и некритически. Выход критически важного параметра за пределы Threshold фактический означает выход из строя, выход за переделы допустимых значений некритически важного параметра свидетельствует о наличии проблемы, но диск может сохранять свою работоспособность (хотя, возможно, с некоторым ухудшением некоторых характеристик: производительности например).

К наиболее часто наблюдаемым критически важным характеристикам относятся: Raw Read Error Rate - частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска.

Spin Up Time - время раскрутки пакета дисков из состояния покоя до рабочей скорости. При расчете нормализованного значения (Value) практическое время сравнивается с некоторой эталонной величиной, установленной на заводе. Не ухудшающееся немаксимальное значение при Spin Up Retry Count Value = max (Raw равном 0) не говорит ни о чем плохом. Отличие времени от эталонного может быть вызвано рядом причин, например блок питания подкачал.

Spin Up Retry Count - число повторных попыток раскрутки дисков до рабочей скорости, в случае если первая попытка была неудачной. Ненулевое значение Raw (соответственно немаксимальное Value) свидетельствует о проблемах в механической части накопителя.

Seek Error Rate - частота ошибок при позиционировании блока головок. Высокое значение Raw свидетельствует о наличии проблем, которыми могут являться повреждение сервометок, чрезмерное термическое расширение дисков, механические проблемы в блоке позиционирования и др. Постоянное высокое значение Value говорит о том, что все хорошо.

Reallocated Sector Count - число операций переназначения секторов. SMART в современных способен произвести анализ сектора на стабильность работы "на лету" и в случае признания его сбойным произвести его переназначение. Ниже мы поговорим об этом подробнее.

Из некритических, так сказать информационных атрибутов, обычно производят наблюдение за следующими:

  • Start/Stop Count - полное число запусков/остановов шпинделя. Гарантировано мотор диска способен перенести лишь определенное число включений/выключений. Это значение выбирается в качестве Treshold. Первые модели дисков со скоростью вращения 7200 оборотов/мин имели ненадежный двигатель, могли перенести лишь небольшое их число и быстро выходили из строя.
  • Power On Hours - число часов проведенных во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MBTF). Принимая во внимание обычно совершенно невероятные величины MBTF, маловероятно, что параметр достигнет когда либо критического порога. Но даже в этом случае выход из строя диска совершенно не обязателен.
  • Drive Power Cycle Count - количество полных циклов включения-выключения диска. По этому и предыдущему атрибуту можно оценить, например, сколько использовался диск до покупки.
  • Temperatue - просто и понятно. Здесь хранятся показания встроенного термодатчика. Температура имеет огромное влияние на срок службы диска (даже если она находится в допустимых пределах).
  • Current Pending Sector Count - здесь храниться число секторов, являющихся кандидатами на замену. Они не были еще определенны как плохие, но считывание их отличается от чтения стабильного сектора, так называемые подозрительные или нестабильные сектора.
  • Uncorrectable Sector Count - число ошибок при обращении к сектору, которые не были скорректированы. Возможными причинами возникновения могут быть сбои механики или порча поверхности.
  • UDMA CRC Error Rate - число ошибок, возникающих при передаче данных по внешнему интерфейсу. Могут быть вызваны некачественными кабелями, нештатными режимами работы.
  • Write Error Rate - показывает частоту ошибок происходящих при записи на диск. Может служить показателем качества поверхности и механики накопителя.

    Все происходящие ошибки и изменения параметров фиксируются в журналах SMART. Эта возможность появилась уже в SMART II. Все параметры журналов - назначение, размер, их число определяются изготовителем винчестера. Нас с вами в настоящий момент интересует только факт их наличия. Без подробностей. Информация хранящаяся в журналах используется для анализа состояния и составления прогнозов.

    Если не вдаваться в подробности, то работа SMART проста - при работе накопителя просто отслеживаются все возникающие ошибки и подозрительные явления, которые находят отражение в соответствующих атрибутах. Кроме того начиная так же со SMART II у многих накопителей появились функции самодиагностики. Запуск тестов SMART возможен в двух режимах, off-line - тест выполняется фактически в фоновом режиме, так как накопитель в любое время готов принять и выполнить команду, и монопольном при котором при поступлении команды, выполнение теста завершается.

    Документировано существует три типа тестов самодиагностики: фоновый сбор данных (Off-line collection), сокращенный тест (Short Self-test), расширенный тест (Extended Self-test). Два последних способны выполняться как в фоновом, так и в монопольном режимах. Набор тестов в них входящих не стандартизирован.

    Продолжительность их выполнения может быть от секунд до минут и часов. Если вы вдруг не обращаетесь к диску, а он при этом издатет звуки как и при рабочей нагрузке - он просто похоже занимается самоанализом. Все данные собранне в результате таких тестов будут также сохранены в журналах и аттрибутах.

    Ох уж эти плохие сектора...

    Теперь вернемся к вопросу бэд-секторов, с которых все началось. В SMART III появилась функция, позволяющая прозрачно для пользователя переназначать BAD сектора. Работает механизм достаточно просто, при неустойчивом чтении сектора, или же ошибки его чтения, SMART заносит его в список нестабильных и увеличит их счетчик (Current Pending Sector Count). Если при повторном обращении сектор будет прочитан без проблем, он будет выброшен из этого списка. Если же нет, то при предоставившейся возможности - при отсутствии обращений к диску, диск начнет самостоятельную проверку поверхности, в первую очередь подозрительных секторов. Если сектор будет признан сбойным, то он будет переназначен на сектор из резервной поверхности (соответственно RSC увеличиться). Такое фоновое переназначение приводит к тому, что на современных винчестерах сбойные секторы практически никогда не видны при проверке поверхности сервисными программами. В тоже время, при большом числе плохих секторов их переназначение не может происходить до бесконечности. Первый ограничитель очевиден - это объем резервной поверхности. Именно этот случай я имел ввиду. Второй не столь очевиден - дело в том, что у современных винчестеров есть два дефект-листа P-list (Primary, заводской) и G-list (Growth, формируется непосредственно во время эксплуатации). И при большом числе переназначений может оказаться так, что в G-list не оказывается места для записи о новом переназначении. Эта ситуация может быть выявлена по высокому показателю переназначенных секторов в SMART. В этом случае еще не все потеряно, но это выходит за рамки данной статьи.

    Итак, используя данные SMART даже не нося диск в мастерскую можно довольно точно сказать, что с ним происходит. Существуют различные технологии-надстройки над SMART, которые позволяют определить состояние диска еще более точно и практически достоверно причину его неисправности. Об этих технологиях мы поговорим в отдельной статье.

    Нужно знать, что приобретения накопителя со SMART не достаточно, для того, что бы быть в курсе всех происходящих с диском проблем. Диск, конечно, может следить за своим состоянием и без посторонней помощи, но он не сможет сам предупредить в случае приближающейся опасности. Нужно что-то, что позволит на основании данных SMART выдать предупреждение. (обычная цепочка приведена на рисунке чуть ниже).

    Как вариант возможен BIOS, который при загрузке при включенной соответствующей опции проверяет состояние SMART накопителей. А если же вам хочется вести постоянный контроль за состоянием диска, необходимо использовать какую-то программу мониторинга. Тогда вы сможете видеть информацию в подробном и удобном виде.

    SmartMonitor из HDD Speed работающий под DOS

    SIGuiardian, работающая из Windows

    Об этих программах мы также поговорим в отдельной статье. Именно это я имел ввиду, когда говорил о том, что по началу не выполнялись необходимые требования при эксплуатации жестких дисков с SMART .

    Технологии хранения информации:

    Технология NoiseGuardMагнито-оптические технологииТехнология Blu-Ray - преемник DVD
  • Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

    3dnews.ru

    Атрибуты S.M.A.R.T жесткого диска - Nima First

    Сохранность наших файлов и данных напрямую зависит от состояния жесткого диска, на котором они хранятся. Важно иметь полное представление о работе этого устройства и вовремя спрогнозировать возможные сбои. Это даст возможность перенести важную информацию на резервный носитель. Полное представление о том, в каком состоянии механическая часть жесткого диска, поверхность физических дисков даёт технология S.M.A.R.T.

    Сокращение S.M.A.R.T. обозначает в свободном переводе технология самоконтроля, анализа и отчета. Соответственно названию она занимается самоконтролем диска, анализом параметров на предмет предполагаемого сбоя и отчета по набору атрибутов.

    Одна группа атрибутов отражает состояние диска в данный момент, другая фиксирует механический износ деталей устройства. У каждого атрибута есть свой номер и значение(Value). Диск хранит значение атрибута в удобном для себя шестнадцатеричном формате (Raw value), а программа пересчитывает его в понятные нам десятичные цифры. Современная система информационной безопасности позволяет обеспечить такие параметры диска, при которых злоумышленник не сможет получить доступ к конфиденциальной информации. Система DLP создает защитный цифровой барьер, который и препятствует утечкам информации. Для оценки состояния есть пороговые значения атрибутов (Threshold), их определяет производитель диска. Значение ниже порога, уже не нормальная работа жесткого диска или вообще неисправность. Очень полезное для прогноза сбоев, наихудшее значение атрибута (Worst),показывает худшее число, которое принимал параметр за весь период работы диска. Дополнительно многие программы показывают значение атрибута в цвете (зеленый, желтый, красный) или шкалой. Value обычно имеет диапазон от 0 до 100, но есть атрибуты со значениями выше 200.Атрибутов S.M.A.R.T. достаточно много, рассмотрим основные и жизненно важные. Набор параметров возьмем из статьи о программе для проверки жесткого диска. Как выглядит таблица S.M.A.R.T. показано на картинке ниже.Здесь есть номер атрибута, его описание, значение Value, значение Worst, Raw value в hex формате и пороговое значение Threshold. Рядом с атрибутом кружок, по цвету которого можно оценить значение атрибута.

    001 Raw Read Error Rate

    - Как часто появляются ошибки чтения из-за аппаратной части накопителя. Ошибок нужно бы поменьше.

    003  Spin Up Time

    – Как быстро диск набирает рабочую скорость. С износом повышается.

    004 Start/Stop Count

    – Количество запусков и остановок диска. Не критично.

    005 Reallocation Sector Count

    – Важный атрибут. Количество переназначения нечитаемых (Bad) секторов в резервную область диска.

    Сбойный сектор заменяется запасным из резервной области.

    При попадании на Bed головка уходит на переназначенный сектор, считывает информацию и возвращается. Операция переназначения называется Remap. Большое количество переназначенных секторов говорит о дефекте поверхности диска и возможно скорой потери данных.

    007 Seek Error Rate

    – Ошибки позиционирования магнитных головок диска. Вызываются износом механики или поверхности.

    008 Seek time Performance

    – Как быстро позиционируются головки.Повышается с износом.

    009 Power-On Hours Count

    – Время работы диска. В качестве Thresholdвремя наработки на отказ при тестах производителя.

    010 Spin Retry Count

    – Счетчик числа повторной попытки раскрутить диск до рабочей скорости. Если таких попыток становиться много, скорый отказ неизбежен.

    011 Recalibration Retries

    – Счетчик повтора рекалибровки при неудачной первой попытке. Показывает износ механики.

    012 Device Power Cycle Count

    – Сколько раз включился-выключился диск. Чистая статистика использования.

    013 Soft read error rate

    – Число программных ошибок при чтении. К механике не имеет отношения и не критичен.

    183 SATA Downshift Error Count

    – Присутствует у дисков производства Samsung и Western Digital. Информационный параметр, не критичен, но указывает на старение диска.

    184 End To End Error Count

    – Диск проверяет и сравнивает данные, которые переданы и которые приняты  материнской платой. Атрибут выводит количество ошибок сравнения. Не критичен.

    187 Reported Uncorrectable Error

    – Не восстановимые ошибки. Чем меньше ошибок, тем лучше. Значение ухудшается при износе.

    188 Reported Command Timeouts

    – Рапорт о задержке команды. Не критичен.

    190 Airflow Temperature

    – Температура внутри корпуса жесткого диска. Указаны минимальное и максимальное значения.

    194 HDA Temperature

    – Показания термодатчика внутри корпуса диска, используются для расчета атрибута 190.

    195 Hardware ECC Recovered

    – Сколько производилось коррекций ошибок аппаратной частью диска. Повышение числа предупреждает о возможном отказе.

    196 Reallocation Event Count

    – Еще один важный атрибут. Считает удачные и неудачные попытки Remap. Показание растетдаже после полного использования резервной области диска. Критичен.

    197 Current Pending Errors Count

    – Число секторов диска операции, с которыми выдают ошибки. Программа готовит их для возможного переназначения (Remap). Рост количества секторов сигнализирует о возможном сбое и потере информации.

    198 Uncorrectable Errors Count

    – Число ошибок обращения к сектору, которые нельзя исправить. Это критично.

    199 UltraDMA CRC Errors

    – Ошибки контрольной суммы при передаче данных. Говорит скорее о неисправном шлейфе или окисленных контактах разъёма, чем о неисправном диске.

    200 Write Error Rate

     - Количество ошибок записи на диск. Увеличивается со сроком эксплуатации.

    201 Soft Read Error Rate

    – Как часто появляются программные ошибки чтения информации. Не критично.

    Из описанных параметров можно получить полное представление о состоянии поверхности диска и ресурсе механики.

    Если какой либо из критичных параметров достиг значения Threshold

    нужно немедленно делать резервную копию информации. При сбоях по критичным атрибутам восстановление утраченных данных крайне затруднено или часто вообще невозможно.

    Читайте также: Простой ремонт жесткого диска

    www.nimafirst.com.ua

    СМАРТ жесткого диска

    Итак, атрибутов в S.M.A.R.T. любого жесткого диска достаточно много, но действительно полезных всего лишь несколько штук. И начну я, пожалуй, с атрибутов, характеризующих состояние поверхности диска.

    Первый из них имеет ID 005 и называется Reallocated Sector Count. Этот атрибут показывает количество секторов, которые были переназначены в резервную область и я думаю, что это один из важнейших атрибутов, ради которого я чаще всего и изучаю S.M.A.R.T. проблемного жесткого диска.

    В одном из предыдущих видео я уже затрагивал тему резервной области и сейчас расскажу об этом более подробно.

    Дело в том, что производители закладывают некоторую резервную область, которая по умолчанию никак не отражается на объеме жесткого диска. В случае если жесткий диск при самотестировании обнаруживает сектор, доступ к которому получить не удается, то он его считает поврежденным и помечает его как нечитаемый. Далее вместо этого сектора используется сектор из резервной области жесткого диска. Происходит переназначение, так как каждый сектор на диске имеет свой номер и теперь при обращении к поврежденному сектору запрос будет перенаправляться к сектору из резервной области. Такой процесс переназначения называется «ремап» (от англ. remap) и этот термин широко используется в программах диагностики жестких дисков.

    Как вы понимаете, если сектор вышел из строя, то объем жесткого диска уменьшится на размер сектора, но так как по сути сектор подменяется и используемая замена берется из резервной области, то на видимом объеме жесткого диска эта проблема никак не отражается.

    Тут нужно понимать, что резервная область не бесконечна и если проблемные сектора возникают регулярно, то такой диск нужно заменить, так как процесс этот необратимый и остановить его скорее всего не получится.

    Но при каких значениях данного атрибута стоит задуматься о замене жесткого диска?

    Не думаю, что тут можно четко указать какое-то значение. В идеале нужно, чтобы таких секторов не было вообще. Если же они у вас есть, то еще рано паниковать. Регулярно следите за динамикой их появления. Если значение атрибута не изменяется, то возможно не все так плохо. Если же бэд-сектора продолжают появляться и текущее значение атрибута уменьшается, то самое время задуматься о переносе важной информации на другой носитель и поискать гарантийный талон от жесткого диска. Если гарантия еще действует, то я бы в этом случае поменял диск.

    Еще один важный нюанс, который вызывает путаницу у многих пользователей — это то, как этот атрибут отображается. Например, если значение Value атрибута равно 100 и значение Worst равно 100, то это не означает, что на диске уже появилось сто битых секторов. Здесь ситуация противоположная — значение Value указывает на ДОСТУПНЫЙ объем резервных секторов! Причем не стоит забывать, что значения Value, Worst и Threshold — это некоторые условные единицы, а отнюдь не штуки.

    Я предполагаю, что в данном случае речь идет о процентах. То есть у полностью исправного жесткого диска доступно 100% секторов в резервной области. Если возникают проблемы и обнаруживаются битые сектора, которые подвергаются ремапингу, то есть переназначению из резервной области, то значение Value станет уменьшаться в процентном соотношении, в зависимости от количества использованных секторов резервной области. Еще раз хочу подчеркнуть, что это мое предположение и мне не удалось найти его подтверждение, но у всех исправных жестких дисков, с которыми мне приходилось иметь дело, значение Value данного атрибута было равно 100. К тому же в поле RAW указывается реальное количество операций переназначения и мне доводилось видеть, что у разных дисков при одинаковом значении Value значения RAW отличались.

    Как я сказал в прошлом видео, многие программы выводят значения в поле Raw в шестнадцатиричном формате, но все же есть программы, которые показывают это значение в более для нас привычной десятичной системе счисления. В любом случае данное значение легко перевести в десятичный формат, воспользовавшись инженерным калькулятором. В идеале значение Raw данного атрибута должно быть равно нулю, а ноль он и в шестнадцатиричной системе ноль:)

    Итак, подводим итог вышесказанному — большое значение Value данного атрибута должно радовать, а не вызывать тревогу.

    Следующий атрибут, о котором я хочу рассказать, имеет ID 197 и называется Current Pending Error Count. Он также имеет отношение к проблемным секторам и указывает на количество секторов, которые жесткий диск зачислил в кандидаты на переназначение в резервную область. То есть эти сектора еще не были определены как «бэд», но при обращении к ним возникли какие-то проблемы, поэтому жесткий диск поместил номер такого сектора в список подозрительных секторов. Если в дальнейшем при обращении к этому сектору проблем не возникнет, то он будет исключен из списка. Если же ошибка повторится, то сектор будет переназначен из резервной области. Увеличение количества ошибок свидетельствует о проблемах. Здесь ситуация со значением атрибута аналогична предыдущему и по мере возникновения ошибок значение атрибута Value будет уменьшаться.

    Следующий атрибут с ID 198 (Uncorrectable Error Count) по сути показывает то же самое что и атрибут с ID 197, то есть указывает на сектора, с чтением которых возникли проблемы. Просто в данном случае тестирование производится по другой схеме, но понимать данный атрибут нужно также как и предыдущие.

    Как понятно, в идеале значение Raw атрибутов 005, 197 и 198 должно быть равно нулю. Отличие значения Raw от нуля, говорит о появлении некоторых проблем. Насколько проблемы серьезные можно судить по динамике возникновения ошибок, то есть необходимо регулярно следить за ситуацией — мониторить ее.

    Теперь расскажу об атрибутах, которые также могут указывать на проблемы с диском, но не у всех дисков они могут быть.

    Во-первых, это атрибут с ID 184 (End-to-End Error). Он показывает количество ошибок, которые возникли при передаче данных через кэш жесткого диска. У жестких дисков есть кэш, то есть своеобразная оперативная память, которая используется для ускорения передачи данных. Если в поле Raw этого атрибута не нулевое значение, значит есть проблемы.

    Следующий атрибут ID 188 (Command Timeout) показывает количество неуспешных операций обращения к диску. Эти операции были прерваны из-за превышения максимально допустимого времени отклика (тайм-аута). Подобные проблемы обычно связаны с плохим питанием или плохим качеством кабелей для передачи данных. Подобные ошибки могут приводить к появлению синего экрана смерти в Windows и значение этого атрибута должно быть равно нулю.

    Атрибут с ID 200 (Write Error Rate / MultiZone Error Rate) показывает общее количество ошибок, возникающих при записи информации в сектор. Ненулевое значение этого атрибута свидетельствует о проблемах с поверхностью или механикой жесткого диска.

    Ну и последний атрибут с ID 194 (HDA Temperature0, показывает температуру жесткого диска. Показания берутся со встроенного внутри диска датчика, который может находится у разных моделей в разных местах, например, на магнитных головках. Часто в отдельных строчках выводится минимальная и максимальная температуры, зафиксированные за все время работы диска. Эта информация будет полезна для анализа в каких условиях работает ваш жесткий диск. Общая рекомендация — не допускать работу жесткого диска при температуре выше 50 градусов.

    Есть и множество других атрибутов, которые либо не несут в себе информацию о здоровье жесткого диска, либо трактовать эту информацию нужно с учетом других атрибутов или внешних факторов, что в свою очередь требует специальных знаний.

    Итак, подытожим — что же нам дает S.M.A.R.T.?

    Используя информацию S.M.A.R.T. можно бегло оценить состояние жесткого диска без серьезной диагностики, которая может занять не один час. Это, пожалуй, единственный плюс данной технологии.

    Стоит помнить о том, что даже отличное состояние всех S.M.A.R.T.-атрибутов НЕ МОЖЕТ гарантировать безотказную работу диска в будущем. Технология работает в режиме реального времени и отражает ТЕКУЩЕЕ состояние жесткого диска.

    Используя информацию S.M.A.R.T. далеко не всегда можно выяснить причину возникших с жестким диском проблем. То есть диск может быть явно не в порядке, а атрибуты S.M.A.R.T. будут в идеальном состоянии.

    Поэтому можно сформулировать небольшое правило — отличное состояние атрибутов S.M.A.R.T. не может гарантировать полную исправность диска, но ухудшение атрибутов может свидетельствовать о грядущих проблемах.

    Ну и в заключении приведу два случая из моей практики, в которых технология S.M.A.R.T. помогла мне решить проблемы.

    Первый случай

    Я приобрел внешний жесткий диск объемом 2Тб и перед переносом на него своей информации я решил его отформатировать. Полное форматирование диска такого объема занимает приличное время, но прошло несколько часов, а процесс форматирования застыл на 25%. Я не стал прерывать процесс и оставил компьютер включенным на всю ночь, но и утром ничего не изменилось. После перезагрузки я запустил утилиту HDDScan и сразу же выяснилось, что диск имеет кучу проблем и самое главное — закончилась резервная область — атрибут 005. Я в этот же день без проблем поменял диск по гарантии и сразу же запустил SMART для контроля состояния нового диска. Поэтому рекомендую сразу же проверить новый жесткий диск, а также не мешает провести полное его форматирование перед переносом на него своих данных.

    Второй случай

    Ко мне обратился друг с просьбой решить проблему с ноутбуком, так как мощный компьютер (DELL Alienware) очень сильно тормозил, надолго подвисал и периодически вываливался в синий экран смерти. Я просидел с этим ноутбуком три дня, ища проблему в видеокарте (их на ноутбуке было две и при установке драйверов на одну из них сразу же появлялись проблемы), но уже отчаявшись найти причину я запустил HDDScan и обнаружил целый букет проблем с жестким диском, а точнее с двумя, так как в этой модели ноутбука по умолчанию было установлено два жестких диска. Оба жестких диска этого ноутбука исчерпали ресурс резервной области, имели проблемы с передачей информации через кэш, ранее работали при критических температурах, что вполне могло явиться причиной проблем с позиционированием блока головок. Все это я узнал из показаний S.M.A.R.T. Замена жесткого диска сразу же решила проблему с внезапным зависанием компьютера, но проблему с видеокартой все же пришлось решать отдельно.

    В общем, для предварительной оценки состояния жесткого диска технология S.M.A.R.T. подходит идеально и ей следует пользоваться.

    Ну а программа HDDScan обладает и другими достаточно богатыми возможностями в плане диагностики жесткого диска и мы с ней продолжим разбираться в следующем видео.

    pc-azbuka.ru

    Ошибки жёсткого диска. S.M.A.R.T.

    №HEXИмя атрибутаЛучше если…Описание0101Raw Read Error Rate↓Частота ошибок при чтении данных с жёсткого диска. Происхождение их обусловлено износом аппаратной части винчестера.0202Throughput Performance↑Общая производительность накопителя. Если значение атрибута уменьшается поступательно, то велика вероятность проблем с винчестером.0303Spin-Up Time↓Время раскрутки «блинов» из состояния покоя до рабочей скорости ( чаще, всего с 0 rpm до 7200 rpm (оборотов в минуту).0404Start/Stop Count*Полное число запусков, остановок шпинделя. Иногда в том числе количество включений режима энергосбережения. В поле raw value хранится общее количество запусков/остановок жёсткого диска.0505Reallocated Sectors Count↓Число операций переназначения секторов. При обнаружении повреждённого сектора на винчестере, информация из него помечается и переносится в специально отведённую зону, происходит утилизация bad блоков, с последующим консервированием этих мест на диске. Этот процесс называют remapping. Чем больше значение Reallocated Sectors Count, тем хуже состояние поверхности дисков — физический износ поверхности. Поле raw value содержит общее количество переназначенных секторов.0707Seek Error Rate↓Частота ошибок при позиционировании блока головок. Чем больше значение, тем хуже состояние механики, или поверхности жёсткого диска.0808Seek Time Performance↑Средняя производительность операции позиционирования. Если значение атрибута уменьшается, то велика вероятность проблем с механической частью.0909Power-On Hours (POH)↓Время, проведённое устройством, во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ.100ASpin-Up Retry Count↓Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.110BRecalibration Retries↓Количество повторов рекалибровки в случае, если первая попытка была неудачной.120CDevice Power Cycle Count*Число циклов включения-выключения винчестера.130DSoft Read Error Rate↓Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению.187BBReported UNC Errors↓Неустранимые аппаратные ошибки.190BEAirflow Temperature↓Температура воздуха внутри корпуса жёсткого диска. Целое значение, либо значение по формуле 100 — Airflow Temperature191BFG-sense error rate↓Количество ошибок, возникающих в результате ударов.192C0Power-off retract count↓Число циклов аварийных выключений.193C1Load/Unload Cycle↓Количество циклов перемещения блока головок в парковочную зону.194C2HDA temperature↓Показания встроенного термодатчика накопителя.195C3Hardware ECC Recovered↓Число коррекции ошибок аппаратной частью диска (ошибок чтения, ошибок позиционирования, ошибок передачи по внешнему интерфейсу).196C4Reallocation Event Count↓Число операций переназначения в резервную область, успешные и неудавшиеся попытки.197C5Current Pending Sector Count↓Число секторов- кандидатов на перенос в резервную зону. Помечены как не надёжные. При последующих корректных операциях атрибут может быть снят.198C6Uncorrectable Sector Count↓Число некорректируемых ошибок при обращении к сектору.199C7UltraDMA CRC Error Count↓Число ошибок при передаче данных по внешнему интерфейсу.200C8Write Error Rate /Multi-Zone Error Rate↓Общее количество ошибок при заполнения сектора информацией. Показатель качества накопителя.201C9Soft read error rate↓Частота появления «программных» ошибок при чтении данных с диска, а не аппаратной части HDD.202CaData Address Mark errors↓Число ошибок адресно помеченной информации (Data Address Mark (DAM)).Если автоматически не корректируется — заменить устройство.203CBRun out cancel↓Количество ошибок ECC данных, присоединяемые к передаваемому сигналу, позволяющие принимающей стороне определить факт сбоя или исправить несущественную ошибку.204CCSoft ECC correction↓Количество ошибок ECC, скорректированных программным способом.205CDThermal asperity rate (TAR)↓Число ошибок в следствии температурных колебаний.206CEFlying height*Высота между головкой и поверхностью диска компьютера.209D1Offline seek performance*Drive’s seek performance during offline operations.220DCDisk Shift↓Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения.221DDG-Sense Error Rate↓Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного crash датчика.222DELoaded Hours*Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.223DFLoad/Unload Retry Count*Количество новых попыток выгрузок/загрузок блока магнитных головок винчестера в/из парковочной области после неудачной попытки.224E0Load Friction↓Величина силы трения блока магнитных головок при его выгрузке из парковочной области.225E1Load Cycle Count↓Число циклов вход-выход в парковочную зону.226E2Load ‘In’-time*Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.227E3Torque Amplification Count↓Количество попыток скомпенсировать вращающий момент.228E4Power-Off Retract Cycle↓Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.230E6GMR Head Amplitude*Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок).231E7Temperature↓Температура жёсткого диска.240F0Head flying hours*Время позиционирования головки.250FARead error retry rate↓Число ошибок во время чтения жёсткого диска.

    hpc.by

    Что такое S.M.A.R.T. технология у жестких дисков и как проверить

    Новейшие накопители представлены интеллектуальными устройствами, способными анализировать свое состояние и своевременно информировать пользователя о неполадках. Для этого аппаратная часть включает оригинальную опцию S.M.A.R.T.

    Назначение технологии SMART.

    Львиная доля дисковых накопителей последних лет, функционирует с использованием технологии S.M.A.R.T. Сочетание расшифровывается как self-monitoring, analysis and reporting technology, что на русском звучит как механизм самоконтроля, анализа и отчетности. Ее первые разработки увидели свет в 1995 году и с тех пор технология постоянно совершенствуется.

    С момента производства дисковый накопитель начинает считывать свое текущее состояние, определяя его с помощью специальных параметров или атрибутов. Они располагаются в служебной зоне накопителя, доступ к которой имеет лишь встроенная программа. Просмотреть параметры позволяет отдельное ПО, чаще всего представленное утилитами от разработчиков конкретного жесткого диска. Через них в накопитель подаются вводные, после чего в журнале статистики появится информация о текущем состоянии диска.

    В процессе эксплуатации накопителя, данные представленные в рамках параметров значения постоянно меняются. Параметры проходят путь с максимальных показателей, гарантирующих высокую производительность и эффективность до минимальных значений, связанных с высокой вероятностью выхода накопителя из строя.

    Все представленные в рамках технологии S.M.A.R.T атрибуты имеет цифровой идентификатор. Как правило, он общий для накопителей различных версий, однако имеют место исключения. В данном отношении выделяется цифра 7, демонстрирующая ошибки в размещении головок на дисковую поверхность. Для накопителей формата SSD цифровой идентификатор неактуален. В отличие от 7-ки, цифра 9, которая показывает общий период непосредственной работы накопителя за срок использования, ее поддерживают все типы дисков HDD и SSD.

    Структура параметров, представлена несколькими полями, демонстрирующих состояние диска и его разделов в конкретный период. Предназначенные для считывания информации утилиты выводят на экран следующие параметры:

    • ID – идентификационный номер
    • name – название атрибута
    • VAL – его текущее состояние
    • Wrst – наихудший показатель за период эксплуатации
    • Thresh – минимальный порог работоспособности

    Показатели S.M.A.R.T

    Существует несколько самых распространенных параметров. Они, за редким исключением, объединяют накопители большинства производителей, итак:

    • Raw Read Error Rate – показатель числа ошибок считывания
    • Throughput Performance – рабочая эффективность. Ее снижение указывает на необходимость замены
    • Spin Up Time – период развертывания накопителя в рабочее состояние. Рост параметра демонстрирует изношенность или недостаток питания
    • Start/Stop Count – показатель количества моментов развертывания диска, которое изначально ограничено его механической структурой
    • Reallocated Sectors Count – атрибут отражает число запасных участков. Туда при неполадках перенаправляется информация. В идеале количество подобных действий должно составлять 0
    • Read Channel Margin – канальный резерв. В наше время накопители обходятся без него
    • Seek Error Rate – Отражение механического состояния накопителя, в числе прочего демонстрирует излишнюю вибрацию и перегрев
    • Seek Time Performance – уровень оперативных возможностей, актуален лишь для дисков HDD
    • Power-on Time – прогноз продолжительности функционирования накопителя исходя из периода эксплуатации. Максимальные показатели составляют 100 и с течением времени снижаются до 0
    • Spin-Up Retry Count – количество дублирующих операций запуска. Их увеличение говорит об ошибках в механической структуре

    Эти и другие атрибуты, идущие красным фоном, говорят о его критическом состоянии накопителя, что предполагает скорую поломку. Конкретного стандарта, объединяющего показатели параметров от различных производителей, не существует. В каждом случае нормальные значения индивидуальны, отражаясь в виде фона или статуса, где

    • Good – хороший показатель
    • Bad – плохой показатель.

    Наряду с уже упомянутыми атрибутами следует уделять внимание таким параметрам как:

    • Recalibration Retries – число дублей при рекаблировке. Их повышение свидетельствует о неполадках механики
    • End-to-End error – Недостатки обменных операций
    • Reported UNC Errors – неполадки, чье устранение ведется с помощью аппаратных средств
    • G-sense error rate – количество механических воздействий на диск. Фиксирует неаккуратную установку, столкновения
    • Reallocation Event Count – общий показатель операций перенаправления информации. Фиксирует удачные и неудачные операции
    • Current Pending Sector Count – количество потенциальных участков накопителя, подлежащих замене
    • Uncorrectable Sector Count – количество неисправных секторов, неподлежащих восстановлению
    • UltraDMA CRC Error Count – неполадки перенаправления данных между накопителем и ПК

    Проверка S.M.A.R.T

    Параметры S.M.A.R.T проверяются при помощи специальных утилит от производителей жестких дисков. Существуют и универсальные программы для тестирования и проверки дисков. Среди них выделяются udisks, smartctl, hddscan, CrystalDiskInfo, Victoria, используя которые пользователь сможет оценить состояние жесткого диска. В некоторых случаях, а именно при работе с контроллерами RAID, получить дисковые атрибуты практически невозможно. 

    Минимальный уровень диагностики поддерживается на уровне BIOS. Если включен режим диагностики S.M.A.R.T., то при наличии критических значений атрибутов BIOS не позволит загрузиться операционной системе. 

    Итак, тестируя состояние жесткого диска, прежде всего внимание, уделяется указанным параметрам S.M.A.R.T . Основное назначение технологии – прогнозирование выхода их строя жесткого диска. При опасном отклонении показателей от нормы, имеет смысл переносить важную информацию на другие носители. 

    И, самое главное, даже если в S.MA.R.T. никаких ошибок нет и все хорошо, это не является гарантией, что диск не сломается, так что всегда делайте бэкап. 

    www.datarc.ru


    Смотрите также