Hetzner - DokuWiki

Seriennummern von Festplatten und Hinweise zu defekten Festplatten/ru

Inhaltsverzeichnis

Как определить серийный номер диска

В ОС Windows

В ОС Windows есть инструмент, позволяющий считывать серийный номер одного или нескольких дисков. Программа называется "DiskID32" и относится к Open Source.

Программу можно скачать здесь.

Сначала, откройте в консоли директорию с программой. Затем введите следующую команду:

diskid32.exe

Вы получите больше информации о своём диске (или дисках).
Серийный номер (номера) диска (дисков) находится в строке "Drive Serial Number".

Пример:

Утилита для Windows


В ОС Linux

Откройте терминал и выполните следующую команду:

sudo hdparm -i /dev/sda | grep SerialNo

Задавая "sudo", вы получаете администраторские права, необходимые для считывания информации о диске. А с помощью "hdparm" вызывается функция, предоставляющая информацию о диске.

С помощью "-i /dev/sda" вы задаёте утилите "hdparm" параметр, указывающий конкретный диск, о котором требуется информация.

Однако, имейте ввиду, что проверяемое оборудование может иметь различные интерфейсы:

  • IDE / ATA устройства: "-i /dev/hd[a-t]"
  • SCSI / SATA устройства:"-i /dev/sd[a-z]"

Затем, из вывода команды отфильтровывается серийный номер с помощью " | grep SerialNo".

Если команда завершается ошибкой, то, скорее всего, необходимо просто установить утилиту:

sudo apt-get install hdparm

Пример:

Серийный номер диска в Linux


В ОС FreeBSD

В ОС FreeBSD можно использовать следующую команду:

smartctl -a /dev/ad0 | grep Serial

"smartctl" это утилита для считывания информации о диске.

С параметром "-a", отображается вся доступная информация о диске.

Интерфейсы устройств также здесь могут разниться:

  • IDE / ATA устройство: "-a /dev/ad[0-9]+"
  • SCSI устройство: "-a /dev/da[0-9]+" ИЛИ "-a /dev/pass[0-9]+"
  • SATA устройство: "-a /dev/ada[0-9]+"

С помощью " | grep Serial" из вывода команды отфильтровывается серийный номер диска.

Пример:

Серийный номер диска в FreeBSD


Информация о повреждённых дисках

Для обнаружения неисправностей дисков рекомендуется использовать специальные утилиты.

Мы используем Smartmontools для Windows, Linux и FreeBSD.

В ОС Windows

Если Smartmontools ещё не установлена на вашем Windows Server 2008, последнюю версию программы можно скачать здесь.

ВНИМАНИЕ: Во время установки вам необходимо поставить галочку напротив "PATH variable". Как вариант, вы можете задать путь к программе в переменных окружения.

Когда утилита успешно установлена, можно открывать интерфейс командной строки.

Для проверки совместимости программы, введите следующую команду:

smartctl -h

Должен появиться список опций, которые можно использовать с "smartctl".

Так как "smartctl" ведёт себя абсолютно также, как в Linux, такие же команды можно использовать и в Windows. Тем же остаётся и способ именования дисков.

Поэтому, вам будет нужно использовать одинаковые параметры как в Windows, так и в Linux.

Обращайте внимание на различные интерфейсы устройств:

  • IDE / ATA устройства: "-H /dev/hd[a-t]"
  • SCSI / SATA устройства: "-H /dev/sd[a-z]"

ПРЕДУПРЕЖДЕНИЕ: Обычные названия дисков, такие как "C:", не работают!

В ОС Linux

В Linux системах сообщения ядра, также как и Smartmontools, предоставляют информацию о неисправностях диска.

Сообщения ядра можно вывести с помощью "dmesg". Здесь особенно важно обращать внимание на сообщения, начинающиеся с "ata". Можно например использовать команду "dmesg | grep ata".

Сначала необходимо установить Smartmontools. Название пакета будет различным в разных дистрибутивах:

  • Debian: "smartmontools"
  • Fedora: "kernel-utils"

Для установки необходимы администраторские права.

Далее, вы можете продолжать работу в консоли.

(Пожалуйста заметьте, что администраторские права необходимы на протяжение всего процесса)

Введите в консоли следующую команду:

smartctl -H /dev/sda

Обращайте внимание на различные интерфейсы устройств:

  • IDE / ATA устройства: "-H /dev/hd[a-t]"
  • SCSI / SATA устройства: "-H /dev/sd[a-z]"

Эта команда запрашивает состояние вашего диска. Выводится сообщение, говорящее о том, может ли диск продолжать использоваться.

Если выводится "FAILED!", то что-то в диске неисправно.

Если выводится "PASSED", то диск в порядке.

Если вм нужен более точный результат, вы можете воспользоваться дополнительной таблицей. Её можно найти с помощью той же команды, под "Failed Attributes:".

Описание значений атрибутов вы найдёте в разделе Значения атрибутов.

Оценив ваш вывод команды с помощью таблицы значений атрибутов, вы увидите обзор ошибок на вашем диске.

Если вы желаете обнаружить все возможные ошибки на диске, вы можете использовать команду "smartctl -A /dev/sda".

(ОБРАЩАЙТЕ ВНИМАНИЕ на различные интерфейсы устройств)

На сей раз отображаются все ошибки. Можно теперь свериться с таблицей.

Список всех выводимых атрибутов вы найдёте в разделе Список атрибутов.

В ОС FreeBSD

В операционной системе FreeBSD для обнаружения неисправностей диска, стоит посмотреть на сообщения ядра (dmesg).

Также как и в случае с Windows и Linux, вам нужно установить пакет Smartmontools.

Для этого можно использовать следующую команду:

pkg_add -r -v smartmontools

(Пожалуйста заметьте, что администраторские права необходимы на протяжение всего процесса)

Также, как и в Linux, вы можете использовать команду "smartctl".
Однако, существует небольшое отличие в названии пути к диску.

Вместо обычных "/dev/hd[a-t]" и "/dev/sd[a-z]",
используйте следующее: "/dev/ad[0-9]+".

Список атрибутов

Название параметра

Описание

Raw Read Error Rate

Критично. Низкие значения указывают на неисправимые ошибки, связанные с поверхностью диска или с магнитными головками.

Throughput Performance

Критично. Общая индикация производительности. Низкие значения говорят о том, что диск больше не может работать на полной скорости.

Spin Up Time

Средний период времени, необходимый на раскрутку диска. Низкие значения могут указывать на проблемы с расположением диска, часто это расположение его в условиях слишком высоких температур.

Start/Stop Count

Не критично. Считает количество циклов запусков/остановок диска.

Reallocated Sector Count

Очень критично. Подсчитывает число операций переназначения секторов. Рост значения этого атрибута может свидетельствовать об ухудшении состояния поверхности блинов диска.

Read Channel Margin

Показывает среднее использование канала для операций чтения. Точное описание не документируется.

Seek Error Rate

Критично. Частота ошибок при позиционировании блока магнитных головок. Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска.

Seek Time Performance

Общий атрибут, описывающий производительность операций позиционирования магнитных головок. Если значение атрибута уменьшается (замедление позиционирования), то велика вероятность проблем с механической частью привода головок.

Power On Hours Count

Показывает количество часов во включенном состоянии. Формат, как правило, зависит от производителя.

Spin Retry Count

Критично. Показывает число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.

Recalibration Retries

Критично. Подсчитывает количество повторов запросов рекалибровки в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность проблем с механической частью.

Device Power Cycle Count

Показывает количество полных циклов включения-выключения диска.

Soft Read Error Rate

Показывает как часто операционная система обнаруживает ошибки при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя.

G-Sense Error Rate

G-Sense означает ударо-чувствительный сенсор, фиксирующий сильные вибрации в процессе работы.

Power-Off Retract Cycle

Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.

Load/Unload Cycle Count

Количество циклов перемещения блока магнитных головок в парковочную зону / в рабочее положение.

Temperature

Указывает температуру жёсткого диска. Не имеет важности, так как значения для большинства устройств указываются очень неточно.

Reallocation Events Count

Очень критично. Подсчитывает все попытки переназначения секторов, как успешные, так и неуспешные.

Current Pending Sector Count

Очень критично. Показывает число нестабильных секторов, ожидающих переназначения.

Uncorrectable Sector Count

Очень критично. Количество деффектных секторов, которые внутренний логический диск не может восстановить и переназначить.

UltraDMA CRC Error Rate

Критично. Число ошибок, возникающих при передаче данных по внешнему интерфейсу в режиме UltraDMA (нарушения целостности пакетов и т. п.). Может указывать на деффектный кабель, конфликт драйверов или проблемы, вызванные разгоном.

Write Error Rate

Критично. Показывает общее количество ошибок, происходящих при записи сектора.

Disk Shift

Очень критично. Это значение указывает на дисбаланс (смещения блока дисков относительно шпинделя) из-за проблем с температурой или из-за удара или падения.

Loaded Hours

Показывает время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.

Load/Unload Retry Count

Количество новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной области после неудачной попытки.

Load Friction

Показывает статистическое значение величины силы трения блока магнитных головок при его выгрузке из парковочной области.

Load-in Time

Указывает как долго привод блока магнитных головок не находился в парковочной области.

Torque Amplification Count

Подсчитывает количество попыток скомпенсировать вращающий момент.

GMR Head Amplitude

Чисто статистический показатель, описывающий расстояние повторяющегося перемещения блока магнитных головок.

(Источник: http://ru.wikipedia.org/wiki/S.M.A.R.T.)

Значения атрибутов

VALUE нормальный показатель, от которого обычно идёт обратный отсчёт (ниже, наихудший)
WORST наихудший показатель на текущий момент.
THRESHOLD порог, ниже которого показатель падать не должен.
TYPE служит для определения показателя: "Pre-fail" это предупреждение о скором отказе, тогда как "Old age" просто означает устаревание. (Текущая температура не обязательно подпадает под ту или иную категорию).
UPDATED показывает, обновляется ли показатель перманентно (всё время) или он обновляется в результате теста типа "Offline data collection".
RAW_VALUE это текущий определённый показатель, например только что замеренная температура или количество ошибок.

(Source: http://en.wikipedia.org/wiki/S.M.A.R.T.)

Создание полного лога SMART

Чтобы создать полный лог SMART используйте команду smartctl с ключом «-x». Нужный диск указывается также как описано выше в «Информация о повреждённых дисках».

Запуск самотестирования SMART

Самотестирование можно запустить выполнив команду smartctl с ключами «-t short» или «-t long». Нужный диск указывается также как описано выше в «Информация о повреждённых дисках».

Самотестирование является специфичным для различных дисков, и производится встроенным программным обеспечением диска. Во время тестирования сервер нельзя использовать так как это может остановить тест.

Проверка дисков и оборудования

В Rescue-системе доступна утилита hwcheck, используемая в Hetzner для стандартный проверки. В ней доступны два вида тестов. Короткий тест (выбор G) занимает 15 - 30 минут. Долгий тест (выбор l) может занять более 6 часов. Во время выполнения тестов никаких других действий с сервером производить не следует. При тестировании RAID-контроллеры определяются автоматически.

Описание работы проверки оборудования

Тесты начинаются с тестирования чтения с каждого диска по очереди. Читается примерно 100 ГБ с каждого диска. Это позволяет проверить наличие ошибок чтения. При этом сами прочитанные данные никак не интерпретируются и после считывания нигде не используются.

После окончания чтения производится проверка значений SMART на аномалии, которые могли бы означать аппаратную проблему.

После этого, в зависимости от типа выбранного теста, запускается либо короткий (short) либо долгий (long) тест.

В коротком тесте проверяется только часть диска. Это сокращает время выполнения теста.
Во время долгого текста все секторы на дисках проверяются по нескольку раз.

Какие именно проверки выполняются во время самопроверки зависит от производителя и достоверно неизвестны.

По завершению самопроверки ещё раз проверяются значения SMART.

В конце, полученные результаты проверяются и записываются в файлы (hddtest-[serial number].log). Их можно найти в директории /root/hwcheck-logs/.

Диски с RAID контроллерами

В ОС Windows

Компания Adaptec разработала утилиту управления для получения информации о дисках в RAID системах. Программа имеет графический интерфейс и называется "Adaptec Storage Manager". Её можно скачать здесь. Для этго, пожалуйста используйте данные доступа, содержащиеся в email сообщении, подтверждающем ваш заказ.

Установите и запустите программу на вашем сервере. Появится графический интерфейс.

Далее, щелчок правой кнопкой мыши в поле на "Direct Attached Storage". Посмотрите на выпадающее меню справа, и сделайте двойной щелчок по установленной ОС с соответствующим IP адресом. Должен последовать запрос данных доступа. После регистрации в системе, появится сообщение о том, что найден RAID контроллер. Подтверлите с помощью "Register Later" и сделайте двойной щелчок по RAID контроллеру.

Появится список всех дисков, подключённых к RAID контроллеру. Сделайте двойной щелчок по выбранному диску. Открывается окно, где вы можете получить информацию о диске.

В ОС Linux

smartctl обычно показывает серийный номер диска, однако существуют специальные программы для различных контроллеров:

  • для контроллеров 3ware это tw_cli

Утилита tw_cli должна быть включёна репозитории большинства дистрибутивов. Запустите tw_cli без указания параметров:

tw_cli

Вызов осуществляется следующим образом:

/cx/py show serial

x означает номер контроллера, а O y означает номер диска.

  • для контроллеров Adaptec это arcconf

В ОС Linux вам понаобится утилита, которая называется "arcconf". Её можно скачать здесь.

Извлеките файл. Затем переместите его:

mv arcconf-64 /usr/local/bin

Далее, сделайте "arcconf" исполняемым файлом:

chmod +x /usr/local/bin/arcconf

Теперь, запустите его:

/usr/local/bin/arcconf

Возможно вам также придётся установить "libstdc++5", так как утилите "arcconfig" необходим этот пакет. Если это ваш случай, вы можете скачать файл здесь.

Если появляется список возможных параметров команды, значит программа работает корректно.

Теперь вы можете прочитать серийные номера дисков с помощью команды "./usr/local/bin/arcconf getconfig 1". Цифра "1" , указывает RAID контроллер.

Однако заметьте, что ваши диски в RAID сначала отобразятся в "Physical Device information" . Серийные номера дисков можно найти в "Serial number".

В дбавок к серийным номерам, утилита предлагает и другую полезную информацию о дисках.

В ОС FreeBSD

Чтобы узнать серийный номер диска в ОС FreeBSD, вам нужно ввести следующую команду в терминале:

portsnap fetch update
cd /usr/ports/sysutils/arcconf
make install clean && rehash

Команда "/usr/local/sbin/arcconf getconfig 1" даёт вам доступ к дискам. Пожалуйста, имейте в виду, что цифра после "getconfig" указывает здесь RAID контроллер.

Также как и в Linux, различную информацию о дисках и "Serial number", можно найти в "Physical Device information".



© 2019. Hetzner Online GmbH. Alle Rechte vorbehalten.