Kritik und Fragen an Nickles 2.696 Themen, 22.838 Beiträge

News: Platte verreckt

Nickles.de-Server-Ausfall und Folgen

Michael Nickles / 38 Antworten / Flachansicht Nickles

Am Montag gab es Störungen auf Nickles.de, am Dienstag folgte der komplette Zusammenbruch. Simpler Grund: der Server ist verreckt. Die Server-Ausfälle am Montag lagen daran, dass die Festplatte des Servers anfing zu spinnen, an Dienstag ist sie dann vollständig verreckt und wurde ausgetauscht.

Nickles.de war dann fast den ganzen Tag down, weil das Backup zurückgespielt wurde. Das erwies sich leider kniffliger als gedacht, es gibt noch einige Sachen die momentan noch nicht funktionieren. Details zum Vorfall wurden hier erklärt und diskutiert: Wiederherstellung von Nickles nach Festplatten-Defekt.

An dieser Stelle nochmals sorry für den Server-Ausfall und dadurch entstandene Unannehmlichkeiten.

Leider ist die Sache noch nicht ganz ausgestanden, es gibt aktuell zwei gravierende Probleme. Eines davon sind "sterbende Datenbank-Prozesse", die für Überlastungen des Servers führen können. Dieses Problem wurde vor ein paar Wochen entdeckt und durch Code-Änderungen behoben.

Jetzt ist es ärgerlicherweise wieder zurückgekehrt. Ein weiteres Problem betrifft die Zugriffsrechte bei einigen Verzeichnissen, die nicht sauber funktionieren. Aktuell gibt es keine Erklärung für diese Fehler, sie werden untersucht.

Im Verlaufe des Tages wird es eventuell vorkommen, dass die Datenbank und die PHP-Umgebung zurück gesetzt werden müssen. Das bedeutet dann einen weiteren Ausfall von Nickles.de für ca 30 Minuten.

Meine Wut über die Unzuverlässigkeit aktueller Festplatten werde ich in Kürze in meinem Blog mitteilen. Im Moment geht das noch nicht, weil der Blog aktuell leider noch zu den offenen Baustellen zählt, nicht funktioniert.

bei Antwort benachrichtigen
Wiesner Michael Nickles „Nickles.de-Server-Ausfall und Folgen“
Optionen

Hallo Michael,

darf ich das ganze so verstehen das dein Hoster dein Web ohne Raid betrieb?
Oder war das "Backup zurückspielen" das beschreiben der neuen Platte vom Raid?

Ich hatte letztens ähnliche Probleme mit WD Platten (24h Serie SATA + Sata Controller).
Vor ca. 1 Jahr das Raid neu aufgebaut mit 2 Platten im Spiegel.
Ein halbes Jahr später zickte die erste Platte und vor 2 Wochen war die zweite im Austausch.
Zum Glück gab der RaidController einen Alert.
In dieser Zeit kam es bei unseren alten Source Safe Archiven auch zu den seltsamsten Zuständen beim Zugriff.
(ist ein anderes SAS Raid mit eigenem Controller)
Erst beim Tausch der zweiten Platte vom SATA Raid beseitigten sich auch die Zugriffsprobleme.
 
Seit dem setze ich wieder rein auf SAS.

Setzt euch heute Abend mal alle zusammen und trinkt ein Frustbier um mal den Ärger und Stress herunterzuspülen.

Grüsse 

Mike

bei Antwort benachrichtigen
Ist behoben. xafford
Danke :-) Michael Nickles