Tutorial Smart

HERRAMIENTA DE TESTEO DE DISCO DURO SMART

# apt-get install smartmontools

activar S.M.A.R.T. en la bios:

(disco IDE)                                           (SATA)

# smartctl -s on /dev/hda               # smarctl -d ata -s on /dev/sda

Información del disco:

# smartctl -i /dev/hda                     # smartctl -d ata -i /dev/sda

lanzar un test largo (long) o rápido (short)

# smartctl -t short /dev/hda            # smartctl -d ata -t short /dev/sda
# smartctl -t long /dev/sda              # smartctl -d ata -t long /dev/sda

Visualizar la información obtenida en el comando anterior

# smartctl -l selftest -i /dev/hda      # smartctl -d ata -l selftest -i /dev/sda

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.9 family
Device Model:     ST3250824AS
Serial Number:    9ND0FR24
Firmware Version: 3.AAH
User Capacity:    250,059,350,016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sat May 10 07:25:50 2008 CEST
SMART support is: Available – device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      3976         -
# 2  Short offline       Completed without error       00%      2901         -

LifeTime indica las horas que el disco ha estado encendido junto a posibles errores. El campo LBA_of_First_error es el que indica si existe algún error. Para saber si el disco está sano:

# smartctl -Hc /dev/sda                    # smartctl -d ata -Hc /dev/sda

Sin problemas si leemos:

SMART overall-health self-assessment test result: PASSED

Listar los atributos internos del disco y su estado:

# smartctl -A /dev/sda                     # smartctl -d ara -A /dev/sda

Power_Cycle_Count (RAW_Value).- Veces que le ha llegado corriente.
Temperature Celsius. (RAW_Value) .- Temperatura del disco
Reallocated_Sector_Ct (RAW_Value).-  número de sectores de repuesto que ha
usado el disco para sustituir sectores dañados
Raw_Read_Error_Rate (RAW_Value).- Frequencia de errores en la
lectura del disco.
Start_Stop_Count: Cantidad de veces que se ha parado y arrancado el disco
Seek_Error_Rate: Tasa de errores de colocación de la aguja
Power_On_Seconds: Tiempo funcionando
Spin_Retry_Count: Nombre de reintents d’engegada

El campo VALUE (valor) es un atributo de S.M.A.R.T que va del número 1 al 253, siendo 1 el peor. Los valores normales son los que estan entre 100 y 200.
El campo WHEN_FAILED indica cuando se produjo una falla de algún atributo.

Listar los errores sufridos por el disco:

# smartctl -l error /dev/hda             # smartctl -d ata -l error /dev/sda

En esta dirección se explica el significado de todos los atributos (ingles):
http://smartlinux.sourceforge.net/smart/attributes.php

# gedit /etc/default/smartmontools

Y descomentar (y en su caso modificar) las lineas siguientes:

enable_smart=”/dev/sda /dev/sdb”
start_smartd=yes

Reiniciar el servicio:    # /etc/init.d/smartmontools restart (stop,start)

El archivo de configuración se halla en /etc/smartd.conf donde ingresaremos la siguiente linea (una por cada disco) para recibir una notificacion en caso de anomalia.

/dev/sda -a -I 194 -m usuario@IP_de_la_máquina

-a indica que chequee todos los atributos, -I 194 que ignore la temperatura ya que al variar continuamente nos enterraria de notificaciones y -m que envie las notificaciones a la dirección indicada. Comentar la linea:

#DEVICESCAN -m root -M exec /usr/share/smartmontools/smartd-runner

Reiniciar el demonio:          # /etc/init.d/smartd restart  (start, stop)

Escribe un comentario