Hallo Linuxer,
ich habe grade ein Problem, und keine Ahnung wo es herkommt:
System: AMD64X2, 4GB RAM, NVIDIA Chipsatz, 2 SATA-Platten (80-GB ExcelStore und 160 GB SAMSUNG)
BS ist Debian Lenny, Kernel 2.6.26-1-amd64
Seit ca. zwei Wochen friert der Rechner zeitweise ein, nach ca. 1 bis 2 Minuten läuft dann wieder alles, nach einem Spindown und Spinup der 80 GB - Platte. Der Fehler tritt unregelmässig auf, bei verschiedenen Anwendungen, und ist nicht reproduzierbar.
Das Intervall zwischen zwei solchen "Stehern" ist zwischen 30 Minuten und 6 Stunden. Ich habe mich im Netz schlau gemacht und beide Platten mit "badblocks" und den SMART-Tests sowie mit e2fscheck und Reiserfscheck überprüft, keine Fehler.
Test-Tools der beiden Hersteller ergaben ebenfalls keine Fehler.
kern.log sieht so aus:
Dec 1 10:06:25 Donald kernel: [ 4788.255283] ata1: EH in SWNCQ mode,QC:qc_active 0x7 sactive 0x7
Dec 1 10:06:25 Donald kernel: [ 4788.255290] ata1: SWNCQ:qc_active 0x3 defer_bits 0x4 last_issue_tag 0x1
Dec 1 10:06:25 Donald kernel: [ 4788.255291] dhfis 0x3 dmafis 0x0 sdbfis 0x0
Dec 1 10:06:25 Donald kernel: [ 4788.255294] ata1: ATA_REG 0x50 ERR_REG 0x0
Dec 1 10:06:25 Donald kernel: [ 4788.255296] ata1: tag : dhfis dmafis sdbfis sacitve
Dec 1 10:06:25 Donald kernel: [ 4788.255298] ata1: tag 0x0: 1 0 0 1
Dec 1 10:06:25 Donald kernel: [ 4788.255300] ata1: tag 0x1: 1 0 0 1
Dec 1 10:06:25 Donald kernel: [ 4788.255309] ata1.00: exception Emask 0x0 SAct 0x7 SErr 0x0 action 0x6 frozen
Dec 1 10:06:25 Donald kernel: [ 4788.255315] ata1.00: cmd 61/e8:00:6d:f1:7f/02:00:03:00:00/40 tag 0 ncq 380928 out
Dec 1 10:06:25 Donald kernel: [ 4788.255316] res 40/00:01:01:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255319] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255324] ata1.00: cmd 61/68:08:5d:f4:7f/00:00:03:00:00/40 tag 1 ncq 53248 out
Dec 1 10:06:25 Donald kernel: [ 4788.255325] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255327] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255332] ata1.00: cmd 60/20:10:af:1a:4f/00:00:08:00:00/40 tag 2 ncq 16384 in
Dec 1 10:06:25 Donald kernel: [ 4788.255333] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255335] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255341] ata1: hard resetting link
Dec 1 10:06:26 Donald kernel: [ 4788.835296] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
Dec 1 10:06:26 Donald kernel: [ 4788.866416] ata1.00: configured for UDMA/133
Dec 1 10:06:26 Donald kernel: [ 4788.866436] ata1: EH complete
Dec 1 10:06:26 Donald kernel: [ 4788.866546] sd 0:0:0:0: [sda] 160836480 512-byte hardware sectors (82348 MB)
Dec 1 10:06:26 Donald kernel: [ 4788.866565] sd 0:0:0:0: [sda] Write Protect is off
Dec 1 10:06:26 Donald kernel: [ 4788.866568] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
Dec 1 10:06:26 Donald kernel: [ 4788.866599] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Ich bin jedenfalls mit meinem Latein am Ende, ich hoffe es kann jemand helfen.
Danke im Voraus
Borowitsch
-
Linux 14.981 Themen, 106.344 Beiträge
Ich glaube nicht das es ein Fehler im Treiber ist.
Man darf nicht vergessen den NVidia (SATA Treiber) und den AHCI Treiber monolitisch in den Kern zu kompilieren:
Komponente Systemplattform Treiber
Audio (AC97) nForce-1 – nForce-4 intel8x0.c
Audio (HDA) nForce-430 and later hda_intel.c
Speicher SATA sata_nv.c
ACHI ahci.c
IDE amd74xx.c
Ethernet Alle forcedeth.c
http://www.nvidia.de/object/linux_nforce_1.23_de.html
NVidia unterstützt selbst die Entwicklung von Linuxtreibern. Ich habe auch einen NForce Chipsatz eingebaut und alles läuft gut, nachdem ich das Board getauscht habe.
Der Rechner ließ sich nicht mehr einschalten. Anfangs trat dieser Fehler nur gelegentlich auf. Ich habe das Netzteil zurückgesetzt und nach etwa 5 min wieder eingeschaltet. Danach ließ sich der Rechner wieder starten. Zum Schluß konnte ich den Rechner überhaupt nicht mehr einschalten.
Gigabyte konnte aber kein Austauschboard mehr liefern und da ich keine neue CPU und neuen Speicher kaufen wollte, habe ich dieses ASROCK Board eingebaut.
Der Support bei Gigabyte hat auch zugegeben das Gigabyte Produktionsprobleme hatte.
Mein Computerhändler nutzt als Diagnosesoftware die Toolhouse Programme. Ich habe von diese Toolshouse Diagnoseprogrammen nichts gutes gehört. Die Servicetechniker hätten mit diesen Toolhouse Programmen noch nie einen Fehler gefunden.