Prinzipiell: Was kann denn bei der Systemwartung kaputtgehen? Ich würde behaupten: Nicht so viel. Zumindest nichts was mit einem kompletten Image zurückgespielt werden müsste. Tar ist auch keine Backuplösung. Du solltes wirklich etwas nehmen was für Backups ausgelegt ist.
Ich würde empfehlen für die "Zurücksetzung" bei fehlgeschlagener Wartung LVM Snapshots zu nehmen. Komplette Plattenabbilder zur schnellen Wiederherstellung im Katastropehnfall (Platte kaputt) oder bei "Neuinstallation" können vorhanden sein, müssen aber nur bei Neuinstallation von Software oder größeren Systemänderungen aktualisiert werden. Installation von Updates im wiederhergestellten System ist einfacher als den Server regelmäßig herunterzufahren. 1mal im Monat kann man das ja machen damit der Update-Stau nicht zu groß wird. Lässt sich aber auch alles gut mit normalen Backups sowie zusätzlichen Backups der eingerichteten Paketquellen und installierten Pakete ersetzen.
Ein RAID-1 oder 5 um die Ausfallsicherheit zu erhöhen sollte man auch in Erwägung ziehen, ist aber kein Ersatz für ein Backup.
Für alles andere: (Mindestens) tägliche Backups auf ein externes Medium, besser noch mit Örtlicher Redundanz, also z.B. Backup an einen anderen Standort oder spiegelung des Backups dorthin. Sieht bei meiner rsnapshot-basierten Lösung wie folgt aus. Kaputte Konfigurationsdateien kann man von da für die entsprechenden Zeiten dann wiederherstellen, genauso Benutzerdaten. Und ist dazu inkrementell, dauert bei mir mit ~500-1000MiB Differenz pro täglichem Backup ca 5 Minuten für das eigentliche Backup, 30-60 Minuten um das über die VDSL-Leitung zu einem zweiten Ort zu spiegeln.
Stündliche Backups auf eine externe, per E-SATA angeschlossene Platte ohne Spiegelung. Nachdem mir bereits 2-mal das Raid-5 durch jeweils doppelten Plattenausfall um die Ohren geflogen ist (Gegenüber 4 Fällen wo das RAID den Ausfall einer Platte jeweils wie gewünscht gemeldet und sich danach auf die Ersatzplatte anstandslos wiederhergestellt hat) habe ich da lieber noch eine zusätzliche Sicherheitsschicht.
Tägliche Backup nachts um 2 mit Vorhaltezeit eine Woche, Spiegelung
Wöchentliche Backups in der Nacht von So auf Mo mit Vorhaltezeit 5 Wochen, Spiegelung
Monatliche Backups jeweils am 1. mit Vorhaltezeit 12 Monate, Spiegelung
Jährliche Backups mit 3 Jahren Vorhaltezeit. Wobei ich nicht davon ausgehe die jemals zu brauchen, Spiegelung
Vorteile so einer gestaffelten Lösung: Bei der Wartung was kaputtgemacht? → Je nach Schwere LVM Snapshot nehmen oder alte Config-Datei aus einem Backup wiederherstellen. Daten gelöscht? → Aus Backup wiederherstellen. Systemplatte oder RAID schrott? → Image einspielen, Updates einspielen, aktuelle Configs und Nutzerdaten aus Backup wiederherstellen bzw. ohne Image: Installieren, Paketquellen wiederherstellen, Paketliste einspielen, Configs und Nutzerdaten wiederherstellen.