Copias de Seguridad con Pika Backup

Abandono Déjà Dup después de años de servicio.

Copias de Seguridad con Pika Backup

Estoy moviendo todas mis copias de seguridad, desde Déjà Dup a Pika Backup.

Pika Backup es una solución de copias de seguridad para GNU/Linux que, sin dejar de ser extremadamente sencilla de utilizar, proporciona características muy interesantes y es muy eficiente. Está basado en Borg Backup, un sistema que crea copias de seguridad comprimidas, cifradas, y que además detecta y elimina duplicados en la copia de seguridad.

La imagen muestra la vista principal de Pika Backup. Muestra dos configuraciones de copia de seguridad, una a un disco duro USB sin programar, y otra, programada para ejecutarse periódicamente, a una ubicación remota.
Pika Backup con dos tareas de copia de seguridad configuradas; una en un directorio remoto, y otra en un disco duro externo

Las características de Pika Backup que me han convencido han sido las siguientes:

  • Permite realizar copias de seguridad a discos USB y a cualquier directorio remoto, y soporta Borg en el lado del servidor:
    • Directorio "tonto": cualquier directorio en donde tengas acceso local (por ejemplo, servicios tipo Drop Box o One Drive), y a localizaciones remotas "tradicionales" como servidores de ficheros FTP, o carpetas compartidas en red.
      • En sí, esto ya es muy potente y versátil.
    • Servicio remoto con soporte para Borg Backup, si quieres mejor rendimiento. Esto no es más que un servidor donde el ejecutable borg esté instalado, y al que tengas acceso por ssh. Una Raspberry Pi con el paquete borgbackup instalado y un disco duro enchufado por USB es suficiente para tener copias de seguridad en red en casa, con rendimiento mejorado.
      • No hay por qué saber usar Borg; Pika Backup lo hace todo por ti, tanto en tu ordenador de trabajo como en tu servidor de copia de seguridad.
      • Más adelante os cuento por qué esto es tan ventajoso.
  • Permite tener más de una tarea de copia de seguridad configuradas sobre el mismo conjunto de datos, para poder tener tu copia de seguridad en varios lugares. Por ejemplo, en un servidor en red, donde ejecutas la copia de seguridad de forma programada, y en un disco externo por USB, donde ejecutas la copia manualmente, cuando te parece bien.
    • Esto permite desarrollar una estrategia 3:2:1 sin salir de Pika Backup.
💡
Una estrategia 3:2:1 significa que deberíamos tener 3 réplicas de los datos, 2 de las cuales serían las copias de seguridad, ubicadas en sistemas almacenamiento diferentes, para 1 conjunto de datos en particular.

De esa forma, siempre nos protegemos en caso de daño físico tanto a nuestra estación de trabajo como a discos de las copias, siendo extremadamente difícil que fallen las tres réplicas a la vez.
  • Es amigable para portátiles, porque detecta si el ordenador está conectado a la corriente, y si no lo está, ni siquiera intenta realizar la tarea de copia de seguridad programada.
  • Proporciona filtros predefinidos para excluir de la copia de seguridad máquinas virtuales, contenedores, cachés y aplicaciones flatpak instaladas en el directorio de usuario. Esto simplifica bastante la configuración, aunque si no es suficiente, se pueden añador desde ficheros y carpetas individuales, hasta filtros basados en nombres de fichero y en expresiones regulares.
  • Las copias de seguridad se pueden programar (hay reglas horarias, diarias, semanales, mensuales o anuales), y permite especificar el día y la hora 🎉. Esto parece baladí, pero si sabes que, por ejemplo, los domingos por la tarde el portátil va a estar en el escritorio con tareas de mantenimiento como actualizar el sistema, con sólo dejarlo enchufado la copia de seguridad se va a realizar automáticamente.
Una vista de la configuración donde se pueden ver los distintos filtros que se pueden configurar en Pika Backup. Muestra filtros predeterminados, y carpetas seleccionadas manualmente.
Una vista de la configuración donde se pueden ver los distintos filtros que se pueden configurar en Pika Backup.

De por sí, las funcionalidades que proporciona Pika Backup en su interfaz gráfico son ya suficientes para convencerme; sobre todo el hecho de poder tener todas las copias de seguridad de mi estrategia 3:2:1 en la misma aplicación. Pero donde lo remata es en el aspecto de ser un cliente de Borg, y por lo tanto soportar servidores con Borg, para acelerar todas las operaciones de copia y restauración, y en especial la verificación de las copias de seguridad.

En general, hay que verificar las copias de seguridad, al menos cada cierto tiempo. Con ello nos aseguramos de que los archivos se han generado y almacenado correctamente, y que no hay nada corrupto. Y esto es un proceso que, si se hace en red, es muy costoso: Pika debería descargarse un trozo de la copia de seguridad desde el servidor de red, verificar su integridad, buscar el siguiente trozo, y así... hasta 130 GB en mi caso. He presenciado verificaciones de integridad hechas así que tardaron 20 horas. Y así es como se hace cuando Pika Backup deposita las copias de seguridad en un directorio de red, "tonto", es decir, sin Borg.

Con Borg, la cosa cambia. El hecho de que Pika Backup esté basado en Borg Backup y, a todos los efectos, que sea un cliente de Borg, acelera el proceso de una forma drástica. Según la documentación de Borg, el proceso del lado del servidor realiza las operaciones de gestión de almacenamiento completas cuando se hace la copia de seguridad, y la verificación en sí. Esto incrementa el rendimiento sensiblemente, porque elimina el trasiego de datos por la red, y reduce el tiempo de verificación de una copia tan masiva como 130 GB de 20 horas a unos 35 minutos.

La imagen muestra un terminal de Gnome conectado al host barcas, bajo el usuario gvisoc. Dentro del terminal se puede ver la salida del comando htop, que muestra el proceso de servidor de borg realizando la verificación de integridad de la copia de seguridad, consumiendo algo menos de un 13% de CPU.
Una captura de pantalla que muestra el proceso de servidor de borg realizando la verificación de integridad de la copia de seguridad, consumiendo algo menos de un 13% de CPU.

En general estoy muy contento con el cambio, ya que me permite realizar las cosas más eficientemente, utilizar mejor los recursos, y sobre todo, sobre todísimo, poder realizar todas las copias de seguridad de mi estrategia con la misma aplicación y de forma sencilla.

Extremadamente recomendable.


¿Cómo se compara Pika Backup con Déjà Dup?

Déjà Dup es una solución basada en duplicity que se ofrece, tradicionalmente, como parte del entorno de escritorio Gnome. Realiza copias de seguridad cifradas, incrementales, y las almacena en un formato de archivo comprimido que, independientemente de dónde almacenes estos archivos, preserva los permisos de los ficheros en tu máquina.

  • Soporta discos externos y todo tipo de almacenamiento remoto –la lista completa se puede consultar en la documentación de duplicity, pero sólo soporta una única configuración para tu copia de seguridad. La copia de seguridad que configures, es única y a un sólo destino. Esto dificulta el realizar una estrategia de copias de seguridad robusta, 3:2:1, con la misma herramienta.
  • Por otro lado, el sistema de copias de seguridad no tiene parte servidora, como la tiene Borg (y la aprovecha Pika Backup al ser éste un cliente gráfico y versátil de Borg); esto quiere decir que la verificación y el almacenamiento sea mucho más lento.
  • No está bien pensado para portátiles, si es que han pensado en portátiles en absoluto.
    • No permite escoger el día o la hora de las copias de seguridad programada. Si cuando configuras Déjà Dup las copias semanales caen en miércoles por el artículo 33, moverlas al domingo no es nada intuitivo, si es que el posible. Y, si cuando entra la copia de seguridad, te tienes que ir con tu portátil, el proceso se va a quedar por ahí medio enganchado.
    • Las copias de seguridad programadas siempre se intentan realizar, estés funcionando en batería, sin red, o lo que sea. Esto consume energía y genera errores de forma innecesaria.

Todo este tipo de cosas hacen que Déjà Dup se vaya quedando atrás. Si bien es igual de sencillo de usar que Pika Backup, el ritmo al que añaden el tipo de funcionalidades que me afectan más es bastante bajo, casi diría que cae en la apatía, y estas cosas van desluciendo al producto poco a poco.