El Plan de Contingencia de Backup

 

Seguro que todos estamos de acuerdo en que el elemento primordial para recuperar el negocio ante una situación de crisis (debida a fallos en hardware/software, error humano o ciberataques), es el BACKUP. Por ello es crítico preparar un Plan de Contingencia de Backup que nos ayude a ser conscientes de la capacidad real de la empresa para recuperar su operatividad en un periodo de tiempo aceptable. Además, es de obligado cumplimiento según la LOPD. En otras palabras, no sólo es importante saber que se realizan Backups periódicos en nuestra empresa sino también saber cuánto tiempo se tardaría en restaurar esas copias y si éstas se están haciendo correctamente. Para ello es necesario realizar periódicamente un “simulacro” de restauración de backup para asegurarnos de que todos los parámetros están controlados y dentro de nuestros estándares.

La importancia de tener un Plan de Contingencia informático

Está claro que es necesario proteger la información crítica de las empresas pero también su infraestructura de sistemas y para ello se debe preparar e implementar un Plan de Contingencia informático. Este plan, indica todas las acciones que deben tomarse a nivel de sistemas:

  • Inmediatamente tras suceder un “desastre”.
  • Durante la resolución de la situación.
  • Y después de haberse restablecido el servicio.

No debemos olvidar lo importante que es realizar las correspondientes acciones de mantenimiento periódico para asegurar el buen funcionamiento de los sistemas y así detectar posibles malfuncionamientos antes de que se conviertan en averías.

¿Cuáles son los riesgos informáticos de nuestro negocio?

Debemos empezar por identificar los bienes que podrían sufrir daños en nuestra infraestructura de sistemas:

  • Hardware.
  • Software y aplicaciones.
  • Datos e información.
  • Información y datos CRÍTICOS para la función del negocio.
  • Suministro de energía eléctrica y de telecomunicaciones.

Una vez identificados aquellos elementos que son críticos para el funcionamiento de nuestros sistemas, se debe llevar a cabo un análisis de todos los riesgos a los cuales está expuesta nuestra infraestructura de sistemas y de los que nos debemos proteger.

Definición de los objetivos de recuperación

Pongámonos en el peor de los casos. Debemos restaurar nuestro último backup para recuperar el servicio tras una parada producida por un evento crítico. Sabemos que tenemos backup, pero ¿Cuánto tiempo tardará en restaurarse la copia?, ¿Sabemos si esa copia está bien hecha?.

Es importante para la empresa marcar los objetivos de recuperación en base a los requerimientos del negocio y el presupuesto designado al efecto. Al realizar el plan de contingencia de Backup periódico se verá si se siguen los parámetros designados y considerados óptimos o si por el contrario existen desviaciones sobre las que se deban tomar medidas.

El RPO (Recovery Point Objective)

El Recovery Point Objective es la cantidad máxima de datos que podemos perder antes de que se llegue a afectar a la continuidad del negocio. Hace referencia al momento en que se llevó a cabo el último backup previo a la parada. Se podría decir que definiendo el RPO, medimos la cantidad de información a la que podemos llegar a renunciar para reanudar nuestra actividad cuanto antes y nos ayudará a decidir también la frecuencia con la que se deberían realizar las copias de seguridad en un futuro.

El RTO (Recovery Time Objective)

El Recovery time objective es el máximo tiempo de parada que puede aceptarse dado que más allá de este punto el negocio se ve perjudicado por no poder dar servicio. Es el tiempo que pasa desde que se produce el parón, se hacen pruebas, se averigua lo que ha pasado, se recuperan los datos y se vuelve a la actividad normal de la empresa. Con este dato tomaremos medidas acerca de la necesidad de ajustar los tiempos de restauración de copias, la adquisición de discos más rápidos para acelerar la recuperación de la información, etc.

Impacto económico

Obviamente, todo esto se traduce en clarificar el impacto económico que supondrá para la empresa el tiempo de inactividad por fallo en los sistemas o por no poder acceder a los datos críticos. Para poder calcular este coste, necesitaremos datos sobre cuál es % del impacto en ventas del tiempo que permanecemos sin actividad, el número de empleados, el coste medio por empleado/h y el % de impacto en la productividad.

Imagen

Por último y no menos importante, el impacto en la imagen de la empresa frente a los clientes. Es más difícil de medir y dependerá de la naturaleza de cada negocio el impacto que un parón produzca directamente en el servicio a sus clientes.

Frecuencia de realización del Plan de Contingencia de Backup

En TWINLAN recomendamos realizar un “simulacro” de restauración del Backup cada 6 meses para dar cumplimiento a la LOPD, verificar la funcionalidad del sistema y poder comparar resultados con próximas restauraciones.

Puntos a revisar al realizar el Plan de Contingencia de Backup

Algunos de los puntos a revisar variarán según cada negocio y sus requerimientos, pero algunos de los elementos clave que en TWINLAN siempre verificamos a nuestros clientes:

Revisión del repositorio de Backup:

  • Discos duros y RAID.
  • Espacio disponible.
  • Tareas de copia a Unidades USB.
  • Espacios en Unidades USB.
  • Notificaciones.
  • Actualizaciones de Firmware.

Revisión de las tareas de Backup

  • Tamaño de los archivos de Backup.
  • Eliminar copias antiguas para liberar espacio.
  • Encriptación de datos en todas las tareas que afecten al Backup.
  • Upgrade de versiones del software de Backup.
  • Notificaciones.

Restauración de Backups

  • Crear un entorno de TEST para restauración.
  • Comprobar integridad de imágenes ISO de restauración.
  • Restaurar un Active Directory y apuntar tiempos de restauración.
  • Restaurar el servidor de Documentos y apuntar tiempos de restauración.
  • Restaurar el servidor de Exchange (si el cliente dispone de este servicio) y apuntar tiempos de restauración.
  • Restaurar archivos individuales y apuntar tiempos de restauración.
  • Si la restauración fuese fallida, resolver el problema.

Informe de resultados

Es importante sentarse a analizar los resultados para proponer mejoras que permitan llegar a los RTO y RPO óptimos. TWINLAN siempre realiza una reunión con los responsables de la compañía para discutir la situación del Backup con la información obtenida tras la ejecución del Plan de contingencia y a su vez, el cliente recibe un informe entendible explicando la situación y detallando:

  • Tamaños de copia.
  • Tiempos reales de restauración.
  • Porcentaje de éxito mensual de las tareas.
  • Gráfico actualizado de la situación de los Backups.
  • Propuestas de mejora.