Pasos para activar la deduplicación en Filer NetApp

La deduplicación de datos es una tecnología novedosa y fundamental para hacer frente a la proliferación de datos. Los volúmenes de disco de UNIX® o Windows® suelen contener miles e incluso millones de objetos de datos duplicados. Conforme los datos se crean, distribuyen, copian y archivan, se almacenan elementos duplicados en todos los niveles de almacenamiento. Como consecuencia, los recursos de almacenamiento de datos se utilizan de forma poco eficiente.

Al eliminar los elementos redundantes y disponer únicamente del original, se produce un aumento inmediato de la eficacia general de todo el sistema de almacenamiento.

Activar la deduplicación en volumenes dentro de un Filer NetApp es muy sencillo. Nos conectamos por SSH al Filer y ejecutamos los siguientes comandos.

Nota: Es necesario adquirir y activar en el Filer la licencia correspondiente de deduplicación.

Primero activamos la deduplicación en el volumen seleccionado:

filer> sis on <volumen>

Ejemplo:

filer> sis on /vol/test01

Una vez realizado esto, los comandos básicos para trabajar con la deduplicación son los siguientes:

Chequeo de estado, podemos ver si está activada, el estado y el progreso en caso de estar trabajando la deduplicación:

filer> sis status /vol/test01
Path                           State      Status     Progress
/vol/test01                 Enabled    Idle       Idle for 21:47:18

Para comprobar el espacio usado en el volumen y el ahorro producido por la deduplicación utilizamos el comando df. En este caso vemos que hemos ahorrado un 25% de espacio:

filer> df -s /vol/test01
Filesystem                used      saved       %saved
/vol/test01/       18018920    5532416          23%

Finalmente el comando sis config nos dirá cuando está planificado que la deduplicación trabaje, por defecto se hace a media noche todos los días:

filer> sis config /vol/test01
Path                           Schedule
/vol/test01                 sun-sat@0

Os recomiendo también utilizar la GUI de NetAPP, NetApp System Manager para gestionar todo esto. Se hace extremadamente sencillo modificar los Schedules, ver gráficas de rendimiento y ahorra de espacio, etc.