Deduplicación de datos, la nueva frontera del back up

Desde hace un par de años, hay una tecnología emergente que en la actualidad están adoptando y fomentando entre los usuarios corporativos los principales actores del mundo del almacenamiento.
Se trata de la deduplicación de datos, también conocida como ?commonality factoring’ o ?almacenamiento de única instancia’, y que permite reducir la cantidad de datos sobre los que diariamente se realizan los back ups de información empresarial, optimizando así la capacidad de almacenamiento y recursos disponibles en cada empresa.
Su manera de funcionar se basa en la eliminación de las copias redundantes que normalmente existen al efectuar copias de seguridad tanto completas como incrementales, es decir, las que copian la información de una sola vez o las que van sumando y añadiendo elementos a los discos y cintas de back up.
En este sentido, esta tecnología perfecciona un poco más el uso de los back ups incrementales. Mientras estos procesos de copia minimizan el tráfico guardando sólo los bloques de datos que hayan cambiado después del back up anterior, la deduplicación copia sólo los bloques modificados, pero además que sean únicos.
Sea como fuere y gracias a poder evitar la redundancia de datos, la deduplicación está pensada para cumplir tres funciones esenciales en las organizaciones, unas consecuencia de las otras: ahorrar espacio de almacenamiento mediante tecnología de compresión, reducir los costes de asociados con el crecimiento del centro de datos y optimizar el ancho de banda disponible en la red corporativa.

Más con menos
Mientras el ahorro en espacio de almacenamiento puede alcanzar ratios de reducción del 25 a 1 en las operaciones de back up -con el consiguiente ahorro de costes- es posible también sustituir los sistemas de copia basados en cinta por el uso del disco, mucho más fiable y rápido en el acceso a los datos guardados, aunque hasta la fecha más caro que el almacenamiento en cinta.
Igualmente, la mayoría de los negocios realiza hoy en día un importante número de copias remotas, destinadas por un lado a separar físicamente los datos en caso de desastre en uno de los CPDs o bien para que las sucursales de las multinacionales puedan a acceder en modo local a la información corporativa.
Para ambos casos, la deduplicación se ha convertido en un excelente aliado, ya que permite optimizar el uso del ancho de banda disponible en la empresa y facilitar una gestión centralizada.
Esto se consigue gracias a que las copias pueden efectuarse sobre la WAN (red de área ancha) utilizando el ?canuto’ que no se utiliza en períodos de baja actividad, como puede ser la franja de horario nocturno. Esto minimiza el uso del ancho de banda en las horas más críticas para el negocio.
Asigra, Avamar (adquirida por EMC), Data Domain, Diligent Technologies, Quantum, Symantec, ExaGrid Systems, FalconStor Software, NEC, Sepaton o Network Appliance son algunos de los proveedores de tecnología de almacenamiento que han visto en la deduplicación una forma de optimizar las operaciones de back up, y que por tanto han incorporado ya a sus ofertas de producto.
Según las apreciaciones de la consultora Taneja Group, ?después de un período de varios años en el que se ha mantenido más o menos estable, el mercado de protección de datos está preparado para una transformación global?.
Esto se debe a la cantidad de datos que es necesario salvaguardar, procedente en su mayor parte de información no estructurada -como imágenes, presentaciones o correos electrónicos- y que debido a los nuevos requerimientos legales las empresas están obligadas a mantener en el tiempo. En este escenario cambiante, ?la tecnología de deduplicación, enmarcada en el segmento COS (Capacity Optimized Storage), será responsable de generar una gran parte de los ingresos?.
En este sentido, son reveladoras las cifras de mercado proporcionadas por la consultora Grupo 451: ?La deduplicación se ha convertido en el tópico más importante hoy para suministradores y usuarios de almacenamiento; en los últimos tres años ha crecido desde la nada hasta facturar 100 millones de dólares en 2006, y para 2007 se espera que esa cantidad aumente hasta los 260 millones de dólares. Para 2009, alcanzará un volumen de negocio de 1.000 millones de dólares a escala global?.
De forma paralela, las soluciones de deduplicación están avanzando desde un concepto de productos aislados hacia soluciones globales fusionadas con los arrays de almacenamiento o el tradicional software de back up y replicación remota.
Sin embargo, el avance de esta tecnología no evitará -aunque sí mitigará- el crecimiento del mercado de almacenamiento en disco. Según IDC, para 2011 el segmento mundial de discos duros se multiplicará hasta los 675 millones de unidades y unos ingresos cercanos a los 37.000 millones de dólares; sólo el ámbito empresarial demandará esa fecha 72 millones de discos duros, con el fin de almacenar 42 millones de Tbytes, teniendo en cuenta que el pasado año las empresas guardaron 5,6 millones de Tbytes en todo el mundo.