La deduplicación de datos es una tecnología novedosa y fundamental para hacer frente a la proliferación de datos. Los volúmenes de disco de UNIX® o Windows® suelen contener miles e incluso millones de objetos de datos duplicados. Conforme los datos se crean, distribuyen, copian y archivan, se almacenan elementos duplicados en todos los niveles de almacenamiento. Como consecuencia, los recursos de almacenamiento de datos se utilizan de forma poco eficiente.
Al eliminar los elementos redundantes y disponer únicamente del original, se produce un aumento inmediato de la eficacia general de todo el sistema de almacenamiento.
Activar la deduplicación en volumenes dentro de un Filer NetApp es muy sencillo. Nos conectamos por SSH al Filer y ejecutamos los siguientes comandos.
Nota: Es necesario adquirir y activar en el Filer la licencia correspondiente de deduplicación.
Primero activamos la deduplicación en el volumen seleccionado:
filer> sis on <volumen>
Ejemplo:
filer> sis on /vol/test01
Una vez realizado esto, los comandos básicos para trabajar con la deduplicación son los siguientes:
Chequeo de estado, podemos ver si está activada, el estado y el progreso en caso de estar trabajando la deduplicación:
filer> sis status /vol/test01 Path State Status Progress /vol/test01 Enabled Idle Idle for 21:47:18
Para comprobar el espacio usado en el volumen y el ahorro producido por la deduplicación utilizamos el comando df. En este caso vemos que hemos ahorrado un 25% de espacio:
filer> df -s /vol/test01 Filesystem used saved %saved /vol/test01/ 18018920 5532416 23%
Finalmente el comando sis config nos dirá cuando está planificado que la deduplicación trabaje, por defecto se hace a media noche todos los días:
filer> sis config /vol/test01 Path Schedule /vol/test01 sun-sat@0
Os recomiendo también utilizar la GUI de NetAPP, NetApp System Manager para gestionar todo esto. Se hace extremadamente sencillo modificar los Schedules, ver gráficas de rendimiento y ahorra de espacio, etc.