Hallo Linuxer,
ich habe grade ein Problem, und keine Ahnung wo es herkommt:
System: AMD64X2, 4GB RAM, NVIDIA Chipsatz, 2 SATA-Platten (80-GB ExcelStore und 160 GB SAMSUNG)
BS ist Debian Lenny, Kernel 2.6.26-1-amd64
Seit ca. zwei Wochen friert der Rechner zeitweise ein, nach ca. 1 bis 2 Minuten läuft dann wieder alles, nach einem Spindown und Spinup der 80 GB - Platte. Der Fehler tritt unregelmässig auf, bei verschiedenen Anwendungen, und ist nicht reproduzierbar.
Das Intervall zwischen zwei solchen "Stehern" ist zwischen 30 Minuten und 6 Stunden. Ich habe mich im Netz schlau gemacht und beide Platten mit "badblocks" und den SMART-Tests sowie mit e2fscheck und Reiserfscheck überprüft, keine Fehler.
Test-Tools der beiden Hersteller ergaben ebenfalls keine Fehler.
kern.log sieht so aus:
Dec 1 10:06:25 Donald kernel: [ 4788.255283] ata1: EH in SWNCQ mode,QC:qc_active 0x7 sactive 0x7
Dec 1 10:06:25 Donald kernel: [ 4788.255290] ata1: SWNCQ:qc_active 0x3 defer_bits 0x4 last_issue_tag 0x1
Dec 1 10:06:25 Donald kernel: [ 4788.255291] dhfis 0x3 dmafis 0x0 sdbfis 0x0
Dec 1 10:06:25 Donald kernel: [ 4788.255294] ata1: ATA_REG 0x50 ERR_REG 0x0
Dec 1 10:06:25 Donald kernel: [ 4788.255296] ata1: tag : dhfis dmafis sdbfis sacitve
Dec 1 10:06:25 Donald kernel: [ 4788.255298] ata1: tag 0x0: 1 0 0 1
Dec 1 10:06:25 Donald kernel: [ 4788.255300] ata1: tag 0x1: 1 0 0 1
Dec 1 10:06:25 Donald kernel: [ 4788.255309] ata1.00: exception Emask 0x0 SAct 0x7 SErr 0x0 action 0x6 frozen
Dec 1 10:06:25 Donald kernel: [ 4788.255315] ata1.00: cmd 61/e8:00:6d:f1:7f/02:00:03:00:00/40 tag 0 ncq 380928 out
Dec 1 10:06:25 Donald kernel: [ 4788.255316] res 40/00:01:01:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255319] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255324] ata1.00: cmd 61/68:08:5d:f4:7f/00:00:03:00:00/40 tag 1 ncq 53248 out
Dec 1 10:06:25 Donald kernel: [ 4788.255325] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255327] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255332] ata1.00: cmd 60/20:10:af:1a:4f/00:00:08:00:00/40 tag 2 ncq 16384 in
Dec 1 10:06:25 Donald kernel: [ 4788.255333] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
Dec 1 10:06:25 Donald kernel: [ 4788.255335] ata1.00: status: { DRDY }
Dec 1 10:06:25 Donald kernel: [ 4788.255341] ata1: hard resetting link
Dec 1 10:06:26 Donald kernel: [ 4788.835296] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
Dec 1 10:06:26 Donald kernel: [ 4788.866416] ata1.00: configured for UDMA/133
Dec 1 10:06:26 Donald kernel: [ 4788.866436] ata1: EH complete
Dec 1 10:06:26 Donald kernel: [ 4788.866546] sd 0:0:0:0: [sda] 160836480 512-byte hardware sectors (82348 MB)
Dec 1 10:06:26 Donald kernel: [ 4788.866565] sd 0:0:0:0: [sda] Write Protect is off
Dec 1 10:06:26 Donald kernel: [ 4788.866568] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
Dec 1 10:06:26 Donald kernel: [ 4788.866599] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Ich bin jedenfalls mit meinem Latein am Ende, ich hoffe es kann jemand helfen.
Danke im Voraus
Borowitsch
-
Linux 14.979 Themen, 106.322 Beiträge
Ich habe noch hdparm -I laufen lassen, die Ausgabe scheint auch normal zu sein:
/dev/sda:
ATA device, with non-removable media
Model Number: ExcelStor Technology J880S
Serial Number: PF2B27K211BPQA
Firmware Revision: PF2OA60A
Standards:
Used: ATA/ATAPI-7 T13 1532D revision 1
Supported: 7 6 5 4
Configuration:
Logical max current
cylinders 16383 16383
heads 16 16
sectors/track 63 63
--
CHS current addressable sectors: 16514064
LBA user addressable sectors: 160836480
LBA48 user addressable sectors: 160836480
device size with M = 1024*1024: 78533 MBytes
device size with M = 1000*1000: 82348 MBytes (82 GB)
Capabilities:
LBA, IORDY(can be disabled)
Queue depth: 32
Standby timer values: spec'd by Standard, no device specific minimum
R/W multiple sector transfer: Max = 16 Current = 1
Advanced power management level: disabled
Recommended acoustic management value: 128, current value: 254
DMA: mdma0 mdma1 mdma2 udma0 udma1 udma2 udma3 udma4 udma5 *udma6
Cycle time: min=120ns recommended=120ns
PIO: pio0 pio1 pio2 pio3 pio4
Cycle time: no flow control=240ns IORDY flow control=120ns
Commands/features:
Enabled Supported:
* SMART feature set
Security Mode feature set
* Power Management feature set
* Write cache
* Look-ahead
* Host Protected Area feature set
* WRITE_BUFFER command
* READ_BUFFER command
* DOWNLOAD_MICROCODE
Advanced Power Management feature set
Power-Up In Standby feature set
SET_FEATURES required to spinup after power up
Address Offset Reserved Area Boot
SET_MAX security extension
Automatic Acoustic Management feature set
* 48-bit Address feature set
* Device Configuration Overlay feature set
* Mandatory FLUSH_CACHE
* FLUSH_CACHE_EXT
* SMART error logging
* SMART self-test
Media Card Pass-Through
* General Purpose Logging feature set
* WRITE_{DMA|MULTIPLE}_FUA_EXT
* 64-bit World wide name
* URG for READ_STREAM[_DMA]_EXT
* URG for WRITE_STREAM[_DMA]_EXT
* SATA-I signaling speed (1.5Gb/s)
* Native Command Queueing (NCQ)
* Host-initiated interface power management
Non-Zero buffer offsets in DMA Setup FIS
DMA Setup Auto-Activate optimization
Device-initiated interface power management
In-order data delivery
* Software settings preservation
Security:
Master password revision code = 65534
supported
not enabled
not locked
not frozen
not expired: security count
not supported: enhanced erase
44min for SECURITY ERASE UNIT.
Logical Unit WWN Device Identifier: 0000
NAA : 0
IEEE OUI : 0
Unique ID : 00
Checksum: correct
zumindest habe ich keinen Fehler gefunden
Ergänzend noch: die Platte ist zwei Jahre lang unter dem gleichen Betriebssystem problemlos gelaufen (zuerst etch, dann lenny, jeweils testing)
Borowitsch
-