Hallo Nickles-Gemeinde,
mein Rechner mit Ubuntu 9.10 startet aus heiterm Himmel manchmal neu. Ich hoffe, dass es kein Hardwareschaden ist und ich vielleicht mit Hilfe der Logs die Ursache identifizieren kann. Bisher habe ich mich nicht viel mit den Logdateien beschäftigt und würde gerne erfahren worauf man da achten sollte und welchen (hoffentlich riesigen Teil) man nicht durchlesen muss.
Als kaum benutzte Zweitinstallation habe ich übrigens die Testversion von Windows 7 installiert. Dort hat sich der Rechner leider auch schon von alleine neugestartet.
Mein Computer besteht unter Anderem aus:
MB: Asrock Alive Dual e-sata2
Graphik: AGP MSI Nvidia 7600GT passiv
2GB RAM
Sound: Creative Audigy 2
Netzwerk: VIA Technologies, Inc. VT6105/VT6106S [Rhine-III]
CPU: Athlon X2 5000+
Ist es überhaupt sinnvoll in den Logs nachzuschauen? Wenn der Rechner plötzlich neu startet sollte er ja keine Zeit mehr habe etwas in ein Log zu schreiben.
Die Kondensatoren auf dem Mainboard (Knapp 2 Jahre alt) sind nicht aufgebläht, sollten also in Ordnung sein.
Schon mal Danke für alle konstruktiven Vorschläge
jojo3
Linux 15.036 Themen, 107.107 Beiträge
Hallo
Ich hoffe, dass es kein Hardwareschaden is
Zumindest unter Windows kannst Du in der Systemsteuerung-Verwaltung-Ereignisanzeige nachsehen.
Unter Ubuntu sieht es so aus:
http://wiki.ubuntuusers.de/Logdateien
Interessant dürften da die /var/log/messages als Dauerprotokoll und die /var/log/dmesg sein.
Da letztere bei einem Neustart automatisch überschrieben wird, wäre es in Deinem Fall sinnvoll, den PC dann von einer Live-CD zu starten und die /var/log/dmesg von außen zu lesen, allerdings stehen da nur die Bootmeldungen des Kernels.
Solche sporadischen Abstürze ohne erkennbare Ursache klingen aus dem Bauch heraus nach einem Speicherfehler, also kann da auch memtest aus dem Bootmenü von Ubuntu helfen.
Da wäre also ein CMOS-Clear (nachdem Du Deine BIOS-Einstellugen abgeschrieben hast) und dann ein Ein- und Ausstecken der Speicherriegel sinnvoll, auch mal ein Betrieb mit nur einem Riegel und dann tauschen der beiden.
Wenn Du dann dem Problem nicht beikommst, läuft das Versuch-und-Irrtum-Spiel an:
Alle Komponenten, die nicht benötigt sind, ausbauen, auch das Netzteil tauschen und dann Stück für Stück wieder einbauen, bis die macke wieder kommt.
Apropos Speicher, bei den AMD-Prozzis sitzt der Speichercontroller in der CPU.
Und auch wenn es nur bei Notwendigkeit gemacht werden soll, ziehe ein BIOS-Update in Betracht, ist bei einem wackligen PC allerdings risikobehaftet, denn wenn beim Flashen der PC abstürzt, hast Du Elektronikschrott produziert, außer Du kannst den BIOS-Chip ausbauen oder hast ein Dual-BIOS als Rückversicherung, aber das steckt meines Wissens in erster Linie auf Gigabyte-Boards.
fakiauso
Sollte es ein Hardwareproblem sein (RAM Module oder defektes Netzteil), dann löst der Linuxkernel in der Regel ein Signal 9 oder auch ein Signal 11 aus und beendet alle Prozesse , bevor es zum Datenverlust kommt.
Dieses sporadische Neustarten macht Windows wenn die Hardware nicht stabil läuft. Unter Linux ist mir das noch nicht passiert.
Fehlerquellen können beispielsweise sein:
-RAM Module defekt oder von schlechter Qualität (Noname Speicher)
-Netzteilspannung nicht stabil
-CPU übertaktet
-CPU zu heiß, weil die Corespannung nicht richtig eingestellt ist.
Hallo jojo3,
möglicherweise ist auch nur die wake up - Funktion im bios aktiviert?
MfG.
violetta
Hallo violetta,
an der waku up - Funktion liegt es nicht. Der Rechner ist ja schon an.
@KarstenW & faklauso
Wie kann ich denn feststellen, welches Signal ausgelöst wurde?
Der Speicher ist von MDT. Da steht auf der Verpackung "just great memory" ;-) Zwei Durchläufe mit memtest haben aber keine Fehler ergeben. Das Netzteil würde ich erst mal ausschließen. Das ist ein 330 Watt Modell von Seasonic. Für das Bios habe ich erst ein Update von 1.2 auf 1.8. Jetzt ist schon wieder ein neues raus. Aber ich denke diese Updates sind nur für neue CPUs.
CPU zu heiß könnte der richtige Tipp gewesen sein. Ich habe ein bisschen mit fancontrol gespielt... Die Regelung des CPU-Lüfters habe ich dem entsprechendem Sensor überlassen der aber anscheinend viel zu niedrige Werte anzeigt. (31 °C bei 1500 U/min des 90mm Lüfters). Ich habe die Regelung jetzt wieder dem Mainboard überlassen. Eigentlich dachte ich, dass durch solche Aktionen nichts passieren kann, weil die modernen CPUs heute doch dieses Throtteling-Funktionen haben?!
In der Windows-Ereignisanzeige habe ich folgendes Ereignis gefunden:
Protokollname: System
Quelle: Microsoft-Windows-Kernel-Power
Datum: 11.01.2010 22:51:09
Ereignis-ID: 41
Aufgabenkategorie:(63)
Ebene: Kritisch
Schl�sselw�rter:(2)
Benutzer: SYSTEM
Computer: jojo-Seneca
Beschreibung:
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgem�� heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgest�rzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.
Ereignis-XML:
41
2
1
63
0
0x8000000000000002
577
System
jojo-Seneca
0
0x0
0x0
0x0
0x0
false
0
Ich habe aber die Vermutung dass das System mit dem Standard Windows7 Graphiktreiber nicht gut läuft und den aktuellen Nvidia-Treiber installiert.
Im Moment läuft mein System stabil, zumindest gab es nach dem Abstellen von fancontrol keinen Neustart mehr.
Vielen Dank an alle Diskussionsteilnehmer. Wenn er wieder abstürzt melde ich mich wieder.
Grüße
jojo3
Diese Signale werden direkt vom Linuxkernel ausgelöst. Wenn die Hardware nicht stabil läuft und Daten auf dem Bus verloren gehen, erkannt der Linuxkernel das und löst diese Signal aus. Daraufhin werden alle prozesse beendet. Also es wird der XServer und der Desktop beendet. Du sieht dann nur noch eine Konsole und darin staht dann das ein Signal 9 oder Signal 11 ausgelöst wurde.
Ich hatte früher Probleme mit Noname Speicher und dadurch wurde sporadisch durch ein Signal 9 oder 11 der Desktop und der Xserver vom Linuxkernel beendet.
Ich weiß jetzt auch nicht so genau wie die Meldung heißt. Schau mal in der messages und die kern.log Datei unter /var/log rein, ob da etwas von einer Signal 9 oder 11 Meldung steht.
Wenn das netzteil in Ordnung ist und du keinen Noname Speicher verbaut hast, dann würde ich im BIOS mal die Defaulteinstellungen einstellen.
Diese Spielerei mit der CPU Lüftung würde ich sein lassen. Moderne CPU Lüfter sind schon temeraturgereglt und wenn du einen hochwertigen (ich nutze Arctic Cooling http://www.arctic-cooling.com/catalog/index.php ) CPU Lüfter einbaust, dann ist das System auch nicht laut.
Es kann aber auch sein das die Netzteilspannung auf der Sekundärseite nicht stabil ist.