Ein sehr schönes Paper über Ausfallursachen bei Festplatten findet sich in den Google Labs. Drei Mitarbeiter (Eduardo Pinheiro, Wolf-Dietrich Weber und Luiz Andre Barroso) des „Such-Giganten“ haben sich mal rund 100.000 (mittlerweile kaputten) Festplatten angeschaut. Die drei haben dazu ein dreiviertel Jahr, Festplatten die in den diversen Google-Diensten im Einsatz waren, beobachtet und deren S.M.A.R.T. Logs ausgewertet und das ganze recht anschaulich aufbereitet. Diese Daten beinhalten zum Beispiel Temperatur, Laufzeit, Lesefehler und weitere Parameter die auf die „Fitness“ des Laufwerks hinweisen. Dabei werden lediglich die statistisch erhobenen Daten erwähnt, nicht aber welchen Fabrikats die jeweiligen Platten waren.
Besonderen Einfluss auf die zu erwartendende Laufzeit einer Festplatte, haben laut der Studie, sowohl die Beanspruchung (d.h. Leerlaufzeit vs. Schreib-/Lesezeit) wie auch die Temperatur. Demnach liegt der optimale Bereich für ein langes Leben einer Festplatte bei 30-45°C (alle Angaben ohne Gewähr 🙂 ).
Auch eine Aussage über die Zuverlässigkeit des S.M.A.R.T.-Mechanismus läßt sich aus der Studie ableiten, so fielen 36% der Platten ohne vorherige Meldung des Überwachungsmechanismusses aus.
Wie man es auch dreht und wendet, aus der Misere regelmäßige Backups anzufertigen kommt man halt nicht raus.
Nachzulesen ist das ganze hier (PDF, 241KB)