Festplattencheck bricht immer nach 40% ab

Hallo Allerseits.

Mit Hilfe des genialen "smartctl" kann man ja wunderbar den tatsächlichen Zustand seiner Festplatten feststellen.

Wie z.B. bei dieser hier:

smartctl 5.40 2010-10-16 r3189 [i586-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen,

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
1 Raw_Read_Error_Rate 0x000a 253 252 000 Old_age Always - 1417339649827
3 Spin_Up_Time 0x0027 229 229 063 Pre-fail Always - 96
4 Start_Stop_Count 0x0032 253 253 000 Old_age Always - 346
5 Reallocated_Sector_Ct 0x0033 252 252 063 Pre-fail Always - 3
6 Read_Channel_Margin 0x0001 253 253 100 Pre-fail Offline - 0
7 Seek_Error_Rate 0x000a 253 252 000 Old_age Always - 60153
8 Seek_Time_Performance 0x0027 251 249 187 Pre-fail Always - 238701398041384
9 Power_On_Minutes 0x0032 252 252 000 Old_age Always - 452h+17m
10 Spin_Retry_Count 0x002b 252 252 223 Pre-fail Always - 4294967387
11 Calibration_Retry_Count 0x002b 253 249 223 Pre-fail Always - 77
12 Power_Cycle_Count 0x0032 244 244 000 Old_age Always - 3750
196 Reallocated_Event_Count 0x0008 252 252 000 Old_age Offline - 1
197 Current_Pending_Sector 0x0008 252 252 000 Old_age Offline - 1
198 Offline_Uncorrectable 0x0008 253 252 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0008 199 199 000 Old_age Offline - 3592
200 Multi_Zone_Error_Rate 0x000a 253 252 000 Old_age Always - 269119
201 Soft_Read_Error_Rate 0x000a 253 252 000 Old_age Always - 21475278627
202 Data_Address_Mark_Errs 0x000a 253 252 000 Old_age Always - 442147
203 Run_Out_Cancel 0x000b 253 252 180 Pre-fail Always - 8590376739
204 Soft_ECC_Correction 0x000a 253 252 000 Old_age Always - 442147
205 Thermal_Asperity_Rate 0x000a 253 252 000 Old_age Always - 442147
207 Spin_High_Current 0x002a 252 252 000 Old_age Always - 4294967387
208 Spin_Buzz 0x002a 253 252 000 Old_age Always - 91
209 Offline_Seek_Performnce 0x0024 253 253 000 Old_age Offline - 0
96 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
97 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
98 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
99 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
100 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0
101 Unknown_Attribute 0x0004 253 253 000 Old_age Offline - 0

Nun ist der Zustand der Platte (noch) nicht besorgniserrregend, bedenkt man das Alter.
Aber wenn ich nun einen Festplatten-check mache

smartctl -A /dev/sda>

bricht das Teil immer bei 40% ab.

Wie kann ich das Tool dazu bringen, nun den Test bis zum Ende durchzuführen?

smartctl 5.40 2010-10-16 r3189 [i586-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen,

Warning: device does not support Error Logging
SMART Error Log Version: 1
Warning: ATA error count 8672 inconsistent with error log pointer 5

ATA Error Count: 8672 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 8672 occurred at disk power-on lifetime: 423 hours (17 days + 15 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
84 51 29 ef 88 8e e1 Error: ICRC, ABRT at LBA = 0x018e88ef = 26118383

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ca 00 a8 70 88 8e e1 08 00:08:21.840 WRITE DMA
f8 00 00 01 00 00 e0 08 00:08:21.824 READ NATIVE MAX ADDRESS
ec 00 00 01 00 00 a0 0a 00:08:21.808 IDENTIFY DEVICE
ef 03 44 00 00 00 a0 0a 00:08:21.792 SET FEATURES [Set transfer mode]
f8 00 00 01 00 00 e0 08 00:08:21.792 READ NATIVE MAX ADDRESS

Error 8671 occurred at disk power-on lifetime: 423 hours (17 days + 15 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
84 51 29 ef 88 8e e1 Error: ICRC, ABRT at LBA = 0x018e88ef = 26118383

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ca 00 a8 70 88 8e e1 08 00:08:21.648 WRITE DMA
f8 00 00 01 00 00 e0 08 00:08:21.616 READ NATIVE MAX ADDRESS
ec 00 00 01 00 00 a0 0a 00:08:21.600 IDENTIFY DEVICE
ef 03 44 00 00 00 a0 0a 00:08:21.584 SET FEATURES [Set transfer mode]
f8 00 00 01 00 00 e0 08 00:08:21.584 READ NATIVE MAX ADDRESS

Error 8670 occurred at disk power-on lifetime: 423 hours (17 days + 15 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
84 51 29 ef 88 8e e1 Error: ICRC, ABRT at LBA = 0x018e88ef = 26118383

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ca 00 a8 70 88 8e e1 08 00:08:21.424 WRITE DMA
f8 00 00 01 00 00 e0 08 00:08:21.392 READ NATIVE MAX ADDRESS
ec 00 00 01 00 00 a0 0a 00:08:21.376 IDENTIFY DEVICE
ef 03 44 00 00 00 a0 0a 00:08:21.360 SET FEATURES [Set transfer mode]
f8 00 00 01 00 00 e0 08 00:08:21.360 READ NATIVE MAX ADDRESS

Error 8669 occurred at disk power-on lifetime: 423 hours (17 days + 15 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
84 51 29 ef 88 8e e1 Error: ICRC, ABRT at LBA = 0x018e88ef = 26118383

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ca 00 a8 70 88 8e e1 08 00:08:21.200 WRITE DMA
c8 00 e0 30 21 93 e1 08 00:08:21.168 READ DMA
c8 00 10 70 cb 93 e1 08 00:08:21.152 READ DMA
c8 00 00 71 ca 93 e1 08 00:08:21.136 READ DMA
c8 00 68 08 c9 93 e1 08 00:08:21.120 READ DMA

Error 8668 occurred at disk power-on lifetime: 423 hours (17 days + 15 hours)
When the command that caused the error occurred, the device was in an unknown state.

After command completion occurred, registers were:
-- -- -- -- -- -- --
04 51 05 01 aa 00 a0 Error: ABRT

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
a1 00 05 01 aa 00 a0 00 00:00:06.688 IDENTIFY PACKET DEVICE

smartctl 5.40 2010-10-16 r3189 [i586-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen,

Warning: device does not support Self Test Logging
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 423 -
# 2 Extended offline Completed: read failure 40% 416 20401794
# 3 Extended offline Completed: read failure 40% 415 20401794

gelöscht_35042 Systemcrasher

Schon mal ein chkdsk mit der Platte durchgeführt?


Systemcrasher Nachtrag zu:

Den Befehl gibt es unter Linux nicht.

Allerdings machen so gut wie alle Linux-Distries nach einer bestimmten Zeit einen Partitionscheck aller automatisch gemounteten Partitionen.

Ich vermute daher, das liegt an den beiden alten Win98-Partitionen. Selbiges startet schon lange nicht mehr (was wahrscheinlich sogar die Ursache für das Problem ist), aber bisher habe ich diese Partition noch nicht nach Dateien, die ich noch benötige durchsucht.

Ich hatte eigentlich gehofft, daß ich das mit smartctl irgendwie hinbekomme.

Wiesner Systemcrasher

fsck ist das pendant zu chkdsk.
zumindest für Ext Dateisysteme

DergroßeGuru Wiesner

*code-tag ends here... ;-) *

Ich würde es auch mal mit fsck bzw. dosfsck versuchen:
dosfsck -a device sollte der Befehl lauten (-a für automatische Reparatur)

Borlander Systemcrasher

Ggf. gsmartcontrol installieren, das stellt die Ausgaben von smartctrl deutlich übersichtlicher da und hebt kritische Werte deutlich hervor.

5 Reallocated_Sector_Ct 0x0033 252 252 063 Pre-fail Always - 3
Ist ein Hinweis auf defekte Sektoren. Das ist immer Besorgniserregend!
Der Platte würde ich keine Daten mehr anvertrauen.

Vor allem auch in Verbindung mit Lesefehlern mitten auf der Platte (bei Sektor 20401794):
# 2 Extended offline Completed: read failure 40% 416 20401794
# 3 Extended offline Completed: read failure 40% 415 20401794

Was Dateisystemtools da bringen sollen kann ich beim besten willen nicht nachvollziehen. SMART ist vollkommen egal was auf der Platte drauf ist und ob da irgendein Dateisystem drauf ist oder nur Datenmüll.


Systemcrasher Borlander
Der Platte würde ich keine Daten mehr anvertrauen.

Naja, das ist die 1. Platte meines Testrechners. Da finden sich nur unterschiedliche Linux-Distries drauf (und noch eine alte win-Installation.

/home und /dev befinden sich auf der 2. Platte. Wichtige Daten sind ohnehin nochmal extra gesichert.

Insofern kann ich die Platte also nutzen, bis sie endgültig abraucht.

Für mich ist es halt auch interessant zu beobachten, wie sich der Zustand verändert.

Das einzige, was mich halt stört, ist, daß Smartctl immer nach 40% abbricht.

Ich würde den Test gerne mal vollständig durchlaufen lassen.

Und da fsck bisher auf den Ext-Partitionen keinerlei Probleme gemeldet hat, vermute ich die Probleme auf den beiden Win-Partitionen.
Borlander Systemcrasher
Das einzige, was mich halt stört, ist, daß Smartctl immer nach 40% abbricht.
Nicht SmartControl bricht hier ab, sondern die Platte selbst (bzw. der eingebaute Selbsttest)

Und da fsck bisher auf den Ext-Partitionen keinerlei Probleme gemeldet hat, vermute ich die Probleme auf den beiden Win-Partitionen.
Zunächst einmal bekommt das Betriebssystem gar nichts davon mit: Bislang wurden eben "nur" drei (siehe Reallocated Sector Count) defekte Sektoren durch Reserve-Sektoren ersetzt. Und selbst wenn das nicht mehr funktionieren würde: Eine Dateisystemprüfung würde den Fehler nur unter ganz bestimmten Voraussetzungen erkennen:
Wenn Du eine Prüfung machst bei der jeder Sektor geprüft wird.
Oder wenn einer der Sektoren in dem Dateisystemstrukturen gespeichert sind defekt ist UND beim Lesen werte liefert die nicht auftreten dürfen.

Welche Partition betroffen ist könntest Du ggf. auch auf Basis der Sektor-Nummer ausrechnen ;-)

