Tutorial Smart
HERRAMIENTA DE TESTEO DE DISCO DURO SMART
# apt-get install smartmontools
activar S.M.A.R.T. en la bios:
(disco IDE) (SATA)
# smartctl -s on /dev/hda # smarctl -d ata -s on /dev/sda
Información del disco:
# smartctl -i /dev/hda # smartctl -d ata -i /dev/sda
lanzar un test largo (long) o rápido (short)
# smartctl -t short /dev/hda # smartctl -d ata -t short /dev/sda
# smartctl -t long /dev/sda # smartctl -d ata -t long /dev/sda
Visualizar la información obtenida en el comando anterior
# smartctl -l selftest -i /dev/hda # smartctl -d ata -l selftest -i /dev/sda
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.9 family
Device Model: ST3250824AS
Serial Number: 9ND0FR24
Firmware Version: 3.AAH
User Capacity: 250,059,350,016 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Sat May 10 07:25:50 2008 CEST
SMART support is: Available – device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 3976 -
# 2 Short offline Completed without error 00% 2901 -
LifeTime indica las horas que el disco ha estado encendido junto a posibles errores. El campo LBA_of_First_error es el que indica si existe algún error. Para saber si el disco está sano:
# smartctl -Hc /dev/sda # smartctl -d ata -Hc /dev/sda
Sin problemas si leemos:
SMART overall-health self-assessment test result: PASSED
Listar los atributos internos del disco y su estado:
# smartctl -A /dev/sda # smartctl -d ara -A /dev/sda
Power_Cycle_Count (RAW_Value).- Veces que le ha llegado corriente.
Temperature Celsius. (RAW_Value) .- Temperatura del disco
Reallocated_Sector_Ct (RAW_Value).- número de sectores de repuesto que ha
usado el disco para sustituir sectores dañados
Raw_Read_Error_Rate (RAW_Value).- Frequencia de errores en la
lectura del disco.
Start_Stop_Count: Cantidad de veces que se ha parado y arrancado el disco
Seek_Error_Rate: Tasa de errores de colocación de la aguja
Power_On_Seconds: Tiempo funcionando
Spin_Retry_Count: Nombre de reintents d’engegada
El campo VALUE (valor) es un atributo de S.M.A.R.T que va del número 1 al 253, siendo 1 el peor. Los valores normales son los que estan entre 100 y 200.
El campo WHEN_FAILED indica cuando se produjo una falla de algún atributo.
Listar los errores sufridos por el disco:
# smartctl -l error /dev/hda # smartctl -d ata -l error /dev/sda
En esta dirección se explica el significado de todos los atributos (ingles):
http://smartlinux.sourceforge.net/smart/attributes.php
# gedit /etc/default/smartmontools
Y descomentar (y en su caso modificar) las lineas siguientes:
enable_smart=”/dev/sda /dev/sdb”
start_smartd=yes
Reiniciar el servicio: # /etc/init.d/smartmontools restart (stop,start)
El archivo de configuración se halla en /etc/smartd.conf donde ingresaremos la siguiente linea (una por cada disco) para recibir una notificacion en caso de anomalia.
/dev/sda -a -I 194 -m usuario@IP_de_la_máquina
-a indica que chequee todos los atributos, -I 194 que ignore la temperatura ya que al variar continuamente nos enterraria de notificaciones y -m que envie las notificaciones a la dirección indicada. Comentar la linea:
#DEVICESCAN -m root -M exec /usr/share/smartmontools/smartd-runner
Reiniciar el demonio: # /etc/init.d/smartd restart (start, stop)