Сегодня 25 апреля 2018
18+
MWC 2018
Накопители

SMART технологии: Data Lifeguard, MaxSafe, Drive Fitness Teсhnologies, Data Protection System

В прошлый раз мы говорили о технологии SMART, рождением которой был ознаменован новый этап в диагностике жестких дисков. Но собственно SMARTом все не ограничилось, многие производители решили пойти дальше, создали ряд технологий, расширяющих стандартные возможности и/также позволяющих оценить состояние диска более точно.


Data Lifeguard

Одним из самых ранних SMART-расширений и улучшений является технология Data Lifeguard разработанная и используемая компанией Western Digital в своих накопителях. Ее суть заключается в создании системы для увеличения надежности хранения информации, т.е. того, чего SMART, работающая в направлении общей диагностики состояния привода, не обещала.

Обычными причинами потери информации в функционирующем накопителе становятся ошибки записи, делающие не возможной последующее чтение и восстановление данных, постепенный износ поверхности, снижение ее магнитных свойств. То есть постепенная деградация, поддающаяся наблюдению, в отличие, от непредсказуемых сбоев (сгорел от скачка напряжения, выпал их кармана по дороге домой).

Это и составляет сущность технологии Data Lifeguard. На холостом ходу накопителя, производится поиск и переназначение сбойных секторов, восстановление, если представляется возможным, из них информации и запись ее в новое место.

Тесты запускаются после того, как накопитель наработал со времени проведения последнего теста 8 часов и при отсутствии к нему обращений в течение 15 секунд (достаточно малое время простоя, гарантирует, что проверка непременно произойдет, а 8 часов от теста до теста обеспечивают достаточно частую проверку, позволяющую избежать серьезных последствий в случае возникновения неприятностей).

Функционирует система следующим образом: при чтении какого-либо сектора возможно возникновение ошибки, которая может быть обусловлена плохой читаемостью сектора (нестабильный сектор), ошибкой при записи данных в сектор, другими случайными внешними условиями или может быть отмечен слабый уровень сигнала. В последнем случае, будет предпринята попытка оживления данных - данные будут по новой записаны в этот же сектор (причиной ведь могло послужить простое размагничивание), с последующим их контрольным чтением. Если уровень сигнала по прежнему низкий - то, очевидно, имеется износ/дефект магнитного слоя, и данные из него будут перемещены в новое место, а данный будет помечен как дефектный.

Аналогичные действия будут предприняты и в остальных названных случаях, но при повторном обращении, случайная ошибка не повториться и с сектором ничего не произойдет, а обусловленная первыми двумя - с большой долей вероятности проявиться снова, и тогда будет предпринята попытка их восстановления по имеющимся корректирующим кодам (ECC, Error Correction Code). В случае удачи данные будут записаны в новое место, а старое пометиться как дефектное. Ну а в случае неудачи, увы, пользователь останется без данных. При работе Data Lifeguard использует функции SMART, но в отличие от нее, функционирует всегда, даже тогда когда SMART выключена. В случае, если накопитель окажется занят Data Lifeguard тестами, когда поступит внешняя команда, тест будет приостановлен и восстановлен по истечении 15 работы после 15 секунд неактивности. Время необходимое на тест поверхности варьируется от модели к модели и в среднем составляет менее 1-ой минуты на гигабайт. Счетчик времени от теста до теста не обнуляется при отключении питания. Возникающие ошибки протоколируются.

В общем, нужно сказать, что это действительно шаг вперед. Пользователь избавляется от необходимости самостоятельно проводить тест поверхности диска, который к тому же многие часто не делали и даже не подозревают что это такое (после появления SMART III, уж тем более Data Lifeguard это оправдано). Значительно снижается вероятность потери данных, кроме того, возможно даже какое-то повышение производительности благодаря тому, что из использования на ранних стадиях исключаются неуверенно читающиеся сектора, и не возникает необходимости повторного чтения. Одна тонкость технологии состоит в том, что она, похоже, проверяет только использующиеся сектора, неиспользуемая поверхность остается без проверки.


MaxSafe

Компанией Maxtor была предложена похожая технология. Видимо ей, как одной из участниц большой четверки (в те времена) не захотелось отставать, да и рынок требовал все большей надежности.

Как и предыдущая технология, MaxSafe (так ее Maxtor обозвал) является дополнением к функциям SMART и старается обнаружить возможные проблемы на ранних стадиях, а также принимает превентивные меры. Для реализации задумки применяют: офф-лайновое сканирование раз, использование улучшенных ECC-кодов два, и контроль высоты полета головки над пластинами три.

Использованием ECC кодов в принципе никого уже удивить было нельзя, но используемый ECC-код в накопителях с MaxSafe имел в два раза больший размер, нежели в их предыдущих сериях. Понятно, что чем больше объем корректирующего кода, тем проще восстановить поврежденные данные. Именно это скрывается под улучшенным ECC-кодом.

Подобно самой технологии SMART и уже рассмотренной Data Lifeguard, MaxSafe выполняет сканирование области занятой пользовательскими данными при отсутствии обращений: осуществляет вычитывание данных, в случае ошибок производит их восстановление по ECC коду и записывает в другую область диска. Не требует от пользователя активации, запускается самостоятельно. Пожалуй, все, что можно было о технологии офф-лайн сканирования.

Что выделяет технологию среди других - так это контроль за высотой полета головок при записи. Дело в том, что корректная запись может быть проведена лишь в том случае, когда головка находится не выше определенного уровня от поверхности, в противном случае данные не будут записаны вовсе, либо с ошибками, в том числе и не восстановимыми. Расстояние между головкой и диском чрезвычайно мало, изменение ее может вызвать множество факторов, технология слежения за высотой хитра, но, тем не менее, запись не начинается, пока не будет обеспечен уровень, гарантирующий безошибочную запись. На этом описание MaxSafe можно закончить.

Справедливости ради нужно заметить что о необходимости наблюдения за высотой полета говорили еще с самого начала, при разработке систем PFA и IntelliSafe, прототипов SMART, наверняка сейчас эта технология используется всеми производителями жестких дисков.

Drive Fitness Teсhnologies

Инженеров компании IBM полет мысли завел еще дальше. Они создали систему, которая позволяет с минимальными усилиями определить состояние жесткого диска и причину неисправности. Предысторией появления технологии являлось обычно высокое число возвратов жестких дисков производителю, среди которых, как подсчитала IBM, оказывается около 80% исправных. Помимо больших расходов на организацию линии горячей поддержки пользователей (как-то говорилось, что организация одного звонка обходится в 150$, вот так-то), имели место еще немалые траты на пересылку якобы неисправного накопителя изготовителю и назад, что еще в придачу занимало немало времени.

Дело усугублялось еще потерей пользователями информации и падением рейтинга фирмы-изготовителя винчестеров (или сборщиков ПК), так как обычно после замены диска производилось новая установка и настройка программного обеспечения (зачастую являющегося истинной причиной) и все глюки, вызвавшие обращение, проходили, и в головах пользователя запечатлевалась вина фирмы-изготовителя винчестера совершенно не справедливо. В общем, устранить вопиющую несправедливость должна была объявленные и внедренные IBM в 1998 году Drive Fitness Teсhnologies в дисках для настольных систем и ноутбуков. Набор Drive Fitness Technologies включает в себя три компонента: технологии Drive Fitness Test (DFT), SMART и PFA. Как и все технологии такого плана ведет протоколы работы, которые хранятся на винчестере в специально отведенной недоступной области, и предоставляет некоторые функции для самотестирования. Под DFT также подразумевается соответствующий микрокод в винчестере.

Программное обеспечение технологии - утилита DFT для PC работает под управлением MS-DOS, позволяет задействовать специальные функции микрокода накопителя, и произвести оценку его работы и работоспособности. DFT доступен для свободной загрузки с сайта ibm (или теперь уже наверное Hitachi) и многих других, может быть так же получен от производителя компьютера или продавца винчестера на любом другом носителе. Именно с ней предстоит взаимодействовать пользователю в случае неполадок. После запуска программа сообщала состояние диска: возможных вариантов 4: диск неисправен; диск поврежден в результате удара; диск может отказать (этот прогноз делается на основании данных SMART); диск исправен.

Диагностирование полностью автоматизировано, и лишено какого бы то ни было субъективизма. При желании можно провести дополнительное тестирование. В программе предусматривалось три режима: Quick Test, Media Scan и Exerciser. В QuickTest проверялось функционирование накопителя, читался и анализировался протокол ошибок, проверялись SMART атрибуты, анализируется PES (Position Error Signal - сигнал, поступающий от сервопривода, сравнение его с эталоном позволяет оценить состояние блока пластин, головок, сервопривода, точность позиционирования), производиться проверка чтения и записи для каждой головки, проверяются первые 500К секторов, содержащих важные пользовательские программы и данные, и выполняется менее чем за две минуты. В режиме Media Scan ко всему, что выполнялось в Quick Test, добавляется еще чтение и проверка целостности данных для всех секторов диска. Этот тест занимает уже значительно больше времени. В режиме Exerciser после выполнения всех тестов MediaScan эмулируется обычная работа пользователя с проведением чтения и записи случайных данных с диска/на диск (данные не повреждаются). В общем Drive Fitness Test является, наверное, самой продвинутой технологией самоанализа, по результатам работы программы можно практически точно сказать причину неисправности.

Как и любые технологии, DFT не стоит на месте, и в настоящее время уже доступна версия 3.40 программы. Работе с ней мы посвятим отдельную статью.

Data Protection System

Кроме IBM попытки создать мощную технологию анализа предприняла еще Quantum (уже продавшая свое подразделение жестких дисков Maxtor, и надо думать эта технология отошла к ней тоже). Двигали ею те же мотивы что и IBM (правда исправных накопителей ей возвращали поменьше - 40%). Ее технология называется Data Protection System. Представляет собой тесты, специально разработанные Quantum для проверки надежности и качества ее жестких дисков. В последних выпускавшихся дисках DPS встраивалась в микрокод, но также совместима и со старыми дисками, для которых доступна в виде приложения. Выполнять умела два теста - экспресс тест, проверяющий аппаратную часть накопителя, а потом данные на первых 300 мбайтах поверхности (время выполнения 1-2 минуты), и расширенном - то же, что и экспресс, но проверяющий не 300 первых мегабайт, а всю поверхность диска, увеличивая вероятность обнаружения ошибок и резко увеличивая продолжительность выполнения. Что тут говорить - хороший механизм, высокая степень достоверности.

Технологии, используемые Seagate большим числом подробностей, к сожалению не засветились. Известно, что в них применяется система 3D Defense System, включающая большое число разных технологий: среди них есть и контроль по ЕСС-коду, и Continuous background defect scanning - фоновая проверка поверхности. Есть SMART, и причем не простой, а даже улучшенный - Enhanced SMART (что в отсутствие четкой спецификации SMART совершенно ни к чему не обязывает).

Для анализа состояния диска существует технология похожая на DFD и DPS. На этот раз сие называется Drive Self Test (и более новый Enhanced Drive Self Test, NDST). Как в обоих предыдущих случаях представляет собой дополнительные функции, закладываемые в микрокод, анализирующие состояние и протоколирующие результат, доступ к которым открывается через специальное программное обеспечение. Предусмотрены два варианта теста - краткий и расширенный. Точность краткого составляет 60-70%, расширенного - до 95%. Некоторые процедуры выполняются во время простоев.

Вообще же нужно сказать, что при всем многообразии технологий от различных производителей, большинство из них являются аналогами и мало чем друг от друга отличаются.

Дополнительные материалы:

Критерии отбора HDD
SMART - технология внутренней оценки состояния HDD

 
 
Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии