A Merevlemezek S.M.A.R.T. Funkciója

Nemrégiben jelent meg egy cikk, mely alapján úgy gondolhatnánk, hogy a merevlemezek címben említett funkciója nem használható, illetve nem ad valós képet a lemez állapotáról. Ebben van némi igazság, de azért nem teljesen egyértelmû a helyzet. Mirõl is van itt szó? (Elõször a S.M.A.R.T. alapjait tekintjük át, gyakorlott felhasználók a következõ néhány bekezdést átugorhatják).

S.M.A.R.T.

A S.M.A.R.T. (Self-Monitoring Analysis and Reporting Technology, azaz Ön-ellenõrzõ Analizáló és Nyilvántartó Technológia) az IBM fejlesztése. Létrehozásának célja a merevlemez állapotának folyamatos figyelése, különbözõ módszerekkel, eszközökkel. Egy merevlemezben maximálisan 30 különféle mért érték (attribútum) tárolására és aktualizásálásra van lehetõség, melyek egy része közvetve vagy közvetlenül meghatározza a lemez egészségi állapotát, míg más részük statisztikai információt hordoz.

Mára gyakorlatilag az összes IDE/Serial ATA/SCSI merevlemezbe beépítésre került, de nem vált teljesen szabványossá, így az egyes attribútumok jelentése gyártónként eltérõ. Jelen cikkünkben az ATA (IDE és S-ATA) merevlemezek mûködésével foglalkozunk. A SCSI esetében picit más a helyzet, mivel ott szabványosak a tárolt adatok, sõt az egyes szenzorok (pl. hõérzékelõ) maximális eltérése is fixen rögzített (+/- 3 Celsius fok).

Bizonyos paraméterek többé-kevésbé szabványossá váltak, így a merevlemezek jelentõs részén lehetséges az egyes problémákon túl például a mûködési hõmérséklet és a bekapcsolva töltött idõ kiolvasása is. Az újabb szoftverek képesek ezeket az adatokat kiolvasni és megfelelõ feldolgozás után kijelezni.

A S.M.A.R.T. specifikációja szerint probléma észlelésétõl és jelentésétõl még 24 órát kell a merevlemeznek mûködnie, amíg az adatok mentése folyik. A legtöbb esetben ez nagyon kevés - éppen ezért fontos a korábbi felismerés, megelõzés.

Tekintse meg a S.M.A.R.T. attribútumok teljes listáját és azok jelentését! (pl. reallocated sector count, off-line uncorrectable sectors count, stb.)

A S.M.A.R.T. mûködése

A merevlemezen belül a pillanatnyi állapotot több szenzor, értékelõ algoritmus folyamatosan méri és a megfelelõ attribútumokat ennek megfelelõen módosítja.

Az egyes mûködési attribútumok több részbõl állnak:

  • Azonosító (bájt): némely értékek de facto szabványossá váltak (pl. 5 = tartalék területre áthelyezett szektorok száma, 194 = hõmérséklet, stb.) A szoftverek nagy része az egyes azonosítókhoz megfelelõ nevet, vagy akár leírást is ad.

  • Adat (6 bájt): a szenzorok által szolgáltatott mérések eredménye illetve a mérés és egy korábbi állapot alapján meghatározott adat, vagy számláló jellegû attribútum esetén problémák összes száma (halmozottan) kerül itt rögzítésre. Az egyes gyártók által meghatározott, típusonként eltérõ módszer alapján ez az adat valamilyen formában további feldolgozásra kerül. Nem ritka, hogy az Adat mezõ bizonyos részei (pl. alsó-felsõ-középsõ 16 bit) más-más jellegû számadatot tartalmaznak azonos attribútumon belül.

  • Küszöb (bájt): az attribútumhoz tartozó (meghibásodási) küszöb értékét tartalmazza.

  • Érték (bájt): a jelenlegi állapotot meghatározó érték, az "Adat" mezõ feldolgozása alapján kerül meghatározásra, a kérdéses attribútum relatív "jóságát" mutatja. A merevlemez elsõ használatakor egy elméleti maximum értéken (általában 100, 200 vagy 253) áll, melyrõl a használat során folyamatosan alacsonyabb szintre kerül.

  • Legrosszabb (bájt): a valaha mért legrosszabb (legalacsonyabb) értéket tárolja.

  • Állapotjelzõk: megmutatják, hogy az adott attribútum milyen célt szolgál. Például statisztikai (hõmérséklet) ill. kritikus attribútum, esemény számláló (áthelyezett szektorok száma) stb.

Megjegyzés: a szoftverek egy része ezek adatok alapján mást is kijelezhet (pl. attribútum állapota) és az adatok értékelésében, menedzselésében is segítséget nyújthat.

Attribútumok a megfelelõ adatokkal
Attribútumok a megfelelõ adatokkal

Valamely attribútum akkor hibátlan, ha az érték mezõ nagyobb vagy egyenlõ, mint a küszöb mezõ. Ha ez nem teljesül valamely kritikus attribútumra, akkor a merevlemez hibásnak minõsül, ilyenkor azonnali cserére szorul. A valódi hiba okára a kérdéses attribútum enged következtetni. Garanciális merevlemezt a gyártó ebben az esetben cseréli a garancia feltételeinek megfelelõen. Az egyes alaplapok által támogatott S.M.A.R.T. funkció is riaszt az operációs rendszer betöltõdése elõtt. Ha a küszöb=0, akkor az attribútum nem képes problémát elõrejelezni (hiszen az érték nem mehet 0 alá).

Matematikai kifejezéssel tehát az egyes attribútumok hibátlansága akkor teljesül, ha az alábbi egyenlõtlenség IGAZ (humán beállítottságú olvasók lépjenek a következõ bekezdésre):

A - f(ny) >= C     (1)

Ahol:

  • A - elméleti maximális érték, az attribútum "legjobb" értéke.

  • f - egy leképezõ függvény, mely a nyers értékek alapján kiszámított eredménnyel csökkenti a kezdeti értéket. Általában lineáris függvény, azaz ny értéke egyszerûen szorzásra kerül egy B konstanssal.

  • C - a meghatározott küszöb értéke, mely alatt az attribútum értéke hibásnak minõsül.

A módszer problémáit az jelenti, hogy nincsenek az A, B (ill. f függvény) és C értékek egyértelmûen meghatározva (még azonos gyártó különbözõ típusain belül is eltérõek), valamint az, hogy az egyes paraméterek egymástól függetlenül kerülnek kiértékelésre.

A problémák

Az általánosan elterjedt S.M.A.R.T. mûködésével kapcsolatban sajnos valóban számos probléma merül fel. Ezek egy része (vagy összessége) miatt valóban nem minden esetben mûködött a merevlemez meghibásodásának elõrejelzése. Ezen problémák lehetnek:

#1. Nem megfelelõ küszöbszintek

A S.M.A.R.T.-tal kapcsolatos problémák (azaz a nem megfelelõ hiba-elõrejelzést) nagy többségét az okozza, hogy a küszöb szintek nincsenek megfelelõen, gondosan kiválasztva. Ennek következménye, hogy a merevlemeznek bizonyos attribútumoknál egyszerûen nincs esélye elérni a küszöböt, annál jóval elõbb meghibásodik. Ez esetben a S.M.A.R.T. valóban nem jelez problémát.

A gyakorlati életben több ízben találkozhatunk irreális küszöb szintekkel. Például a hibás szektorok maximális számát több ezerben (a tartalék adatterület nagyságának függvéynében) határozzák meg. Így ennyit el kell érni, mire a S.M.A.R.T. jelezné, hogy meghibásodás várható. Önmagában ez nem jelent túl nagy adatterületet, hiszen pl. 1000 szektor is "csak" 512000 bájt hibás területet jelentene (és nem jár kapacitás vesztéssel, mivel a tartalék terület át tudja venni a hibás szektorok szerepét), de nem mindegy ezen hibás szektorok eloszlása, mennyiségük növekedésének üteme.

Legtöbb esetben problémák már jóval azelõtt jelentkeznek, hogy ezt a küszöböt megközelítené a kérdéses attribútum. Például egy fejhiba, mely miatt több ezer szektor válik használhatatlanná, már az adatterület jóval nagyobb hányadát is menthetetlenül tönkreteszi, és így a késõbbi helyreállítást is megakadályozza. Nem beszélve arról, hogy egy-egy újabb problémás terület analizálása és onnan az adatok mentése a meghajtó számára akár órákig is tarthat (ha egyáltalán tökéletesen sikerül). Ilyen esetben a rendszer általában megáll, tehát egy folyamatosan romló, újabb és újabb hibákat produkáló merevlemez a teljes rendszer stabilitását is veszélyeztetheti.

Érték=253, Küszöb=63, ennek eléréséhez nagyjából 1900 db hibás szektorra van szükség ezen a merevlemezen, itt szerencsére nincs egy sem
Érték=253, Küszöb=63, ennek eléréséhez nagyjából 1900 db hibás szektorra van szükség ezen a merevlemezen, itt szerencsére nincs egy sem

De említhetjük például a teljesen rosszul megválasztott küszöbértéket is. Például bizonyos gyártók a merevlemez teljes élettartamára mintegy 60-70 évet vagy még többet jelölnek meg, ha a megfelelõ attribútum értékét kiolvassuk. Ez különösen érdekes annak a tudatában, hogy a gyártók általában 5 évre tervezik a termékeik élettartamát. Csak hab a tortán, hogy ha az élettartam lejár, a S.M.A.R.T. nem figyelmeztet, mivel ez az attribútum általában nem számít kritikusnak!

Az érték 759 nap használat alatt ment le 100-ról 97-re
Az érték 759 nap használat alatt ment le 100-ról 97-re, vajon hány nap kell, mire a lemez a eléri a gyártó szerinti élettartam végét?

Továbbá bizonyos kritikus attribútumok esetén a küszöb értéke 0. A fent említett egyenlõtlenségben szereplõ számok (bájtok) alapján könnyen belátható, hogy 0 alá nem csökkenhet az érték mezõ tartalma. Íly módon ezek az attribútumok akárhogyan is mérik és "szeretnék" elõrejelezni a közelgõ katasztrófát, a S.M.A.R.T. soha nem fog szólni.

Kritikus attribútumok, 0 küszöbszinttel
Kritikus attribútumok, 0 küszöbszinttel

Néha az igazán fontos attribútumok nincsenek megjelelölve, mint "kritikus" attribútumok. Ennek következtében a merevlemez ellenõrzõ alkalmazások és a BIOS-ban található S.M.A.R.T. funkció nem ellenõrzik ezen értékeket és a bekövetkezõ változásokat.

#2. Hibás értékelési módszer

A merevlemez ellenõrzõ programok túlnyomó többsége a fenti gyártó specifikus módszert használja a merevlemez állapotának kijelzésére. Ilyen esetekben a legtöbb meghajtó jelentõsen elõnyösebbnek tûnik a valós állapotnál. Bizonyos gyártók az értékek állításával jobbnak próbálják beállítani a meghajtót mint amilyen valójában - és ez sajnos több programot, felhasználót megtéveszt. Az sem ritka, hogy a gyártók a konkurrencia termékénél szeretnék a merevlemezeiket jobbnak beállítani az értékek megválasztásával.

A szoftverek készítõi pedig "mossák kezeiket", hiszen õk a gyártó-specifikus értékeket használják, azaz ha a merevlemez idõ elõtt elhalálozna, rákenik a gyártóra. Mindeközben az ilyen szoftverek nem ritkán mutatnak várható élettartamnak (egy nem tökéletes merevlemez esetén is) 10-20 évet vagy még többet, ami minimum megkérdõjelezendõ.

#3. Attribútumok súlyossága

Könnyen belátható, hogy az egyes attribútumok más-más módon befolyásolják a merevlemez állapotát. Vannak viszont igazán kritikus paraméterek, például a 10-es (felpörgési újrapróbálkozások száma). Ennek apró változása is komoly problémára adhat okot (mely adódhat táp gyengeségbõl is, de a motor- vagy csapágyhiba sem kizárt).

A gyártók ilyenkor általában a küszöböt magasabbra teszik, azaz az attribútum elvileg hamarabb eléri azt, jelezve a problémát. Viszont a küszöb és a fenti (1) képletben található f függvény megválasztása úgy történik, hogy néhány probléma még ezeknél a kritikus attribútumoknál is "belefér", azaz nincs jelzés a felhasználó felé, hogy itt valami történt.

Problémát jelent továbbá, hogy az egyes attribútumok közötti összefüggés sem látszik, azaz könnyen lehet, hogy már több attribútum szerint is "majdnem" halálán van a merevlemez, de elõrejelzés mégsincs, hiszen egyik sem érte el a küszöbszintet.

#4. Visszajelzés hiánya

Megfelelõ S.M.A.R.T.-ot kiolvasni képes szoftver használata nélkül a felhasználó általában semmit nem vesz észre a merevlemez állapotának romlásából (csak mikor már túl késõ). Ha idõnként néhány újabb hibás szektor keletkezik és a lemez megpróbálja azokat tesztelni és az adatokat áthelyezni, nem biztos, hogy észrevehetõ (ha pl. a gép nem dolgozik amúgy intenzíven). Ilyen esetekben az operációs rendszer általában teljesen megáll, ezért a felhasználók egy része (tévesen) ilyenkor újraindítja, esetleg lekapcsolja a számítógépet, mondván az "kifagyott". Az adatok helyreállítása közben eltûnõ táp nem a legszebb módja annak, hogy kifejezzük mennyire szeretjük merevlemezünket.

#5. Hõmérséklet, érzékelõ problémák

Szoftver használata nélkül nem értesülünk továbbá a hõmérséklet alakulásáról sem. Míg a processzor, videókártya rendelkezik védelmi mechanizmussal (vészleállítás) a merevlemez nem. Ez különösen annak fényében érdekes, hogy a számítógép valamennyi alkatrésze közül a merevlemez a legérzékenyebb a magas hõmérsékletre. Néhány kivételtõl eltekintve a gyártók 50-55 Celsius fokban maximálják az üzemi hõmérsékletet.

Míg a legtöbb BIOS lehetõséget biztosít a processzor hõmérsékletének, tápfeszültségnek, ventillátor fordulatszámának ellenõrzésére, a merevlemezek hõmérsékletének felügyeletére nincs mód. Az alaplapi (BIOS) S.M.A.R.T. ellenõrzés a magas hõmérséklet esetén sem figyelmeztet. Így elképzelhetõ, hogy egy félig megfõtt merevlemezt használunk - amíg az bírja.

Fontos tudni, hogy a merevlemezbe épített hõmérséklet érzékelõk egy része nem teljesen pontos (nem ritka a 8-10 fokos eltérés sem a valós hõmérséklethez képest), ezért érdemes a merevlemez hõmérsékletét más eszközzel (pl. infrás hõmérõ segítségével) is megmérni, majd az erre alkalmas szoftverben beállítani a különbséget a valós és jelzett hõmérséklet között (kalibráció). Így a szoftver a késõbbiekben a valós hõmérsékletet jelzi, felhasználva a kalibráció során megadott hõmérséklet különbséget.

Érdemes megvizsgálni a merevlemez nyugalmi és huzamosabb ideig tartó teljes terhelés alatt mért hõmérsékletet is, komoly különbségek lehetnek a mért hõmérséklet értékek között.

Ha bekapcsoláskor a hõmérséklet túl alacsony vagy túl magas a környezethez képest, érdemes ellenõrizni a szenzor pontosságát
Ha bekapcsoláskor a hõmérséklet túl alacsony vagy túl magas a környezethez képest, érdemes ellenõrizni a szenzor pontosságát

#6. Nem megfelelõ meghajtóprogramok (driver-ek)

Sajnos nagyon sok hibás meghajtóprogrammal lehet találkozni, melyek által a vezérlõre (alaplapra) kötött merevlemezek egyikérõl-másikáról nem lehet S.M.A.R.T. adatokat kiolvasni. A jelenség általában független a használt szoftvertõl, mivel a merevlemezhez való hozzáférés hasonló elven alapul. Az sem ritka, hogy két merevlemez esetén mindkettõrõl ugyanazokat a mûködési értékeket szolgáltatja a vezérlõ (általában az elsõ lemez vagy PRIMARY MASTER adatait). A szoftverek egy része ezt kiszûri, de gyanú esetén érdemes megbizonyosodni errõl: ha a lemezek sorozatszáma, S.M.A.R.T. adatai feltûnõen azonosnak tûnnek, akkor ott ilyen helyzet áll fenn.

Általánosan a meghajtóprogramok a merevlemez parancsok egy részét támogatják csak. Emiatt bizonyos funkciók nem minden esetben mûködnek (pl. akusztika menedzsment) még ha a merevlemez támogatja is azt.

Emiatt érdemes figyelni, hátha a gyártók közzétesznek frissebb firmware-t illetve újabb driver csomagot, mellyel a helyzet javulhat. Amennyiben a vezérlõhöz RAID-es és nem-RAID-es driver csomag is telepíthetõ, fontos a megfelelõ (nem-RAID-es) változat telepítése (már ha nem használunk RAID-et). Ellenkezõ esetben általában búcsút mondhatunk a vezérlõre kötött merevlemez részletes adatainak (hõmérséklet, egészségi állapot, stb.)

Számos alaplap illetve merevlemez vezérlõ nem rendelkezik minden szempontból tökéletes meghajtóprogrammal Vista alá. Ez megnehezíti illetve lehetetlenné teheti az új operációs rendszer alatt a lemez információinak lekérését és a problémák elõrejelzését.

#7. Nem megfelelõ hardver vagy hibás adatok

Ez a probléma szorosan kapcsolódik az elõzõhöz. Bizonyos vezérlõk, alaplapok használata esetén a S.M.A.R.T. küszöbök értéke nem kérdezhetõ le vagy mindegyik küszöb 0. Az ilyen vezérlõre kötött merevlemezek sosem fognak hibát elõrejelezni, hiszen egyik érték sem csökkenhet ez alá a szint alá. Az egyes szoftverek is tévesen kitûnõnek értékelhetik a merevlemezt, mivel az attribútumok értékei nagyon távol esnek a küszöbszinttõl.

Minden küszöb 0
Minden küszöb 0 - az "örökké" fiatal és egészséges merevlemez. Vagy mégsem?

Nem ritka az sem, hogy a visszaadott adatok hiányosak. Ez ugyan nem befolyásolja közvetlenül a lemez állapotát, de ilyenkor bizonyos kijelzett adatok (például az aktuális mûködési sebesség, Serial-ATA mûködési tulajdonságok, stb.) hitelessége megkérdõjelezhetõ (szerencsére ez nem befolyásolja a hõmérséklet és az egészségi állapottal összefüggõ információk lekérdezését). Az újabb szoftverek figyelmezetetnek ennek lehetõségére, az ATA ellenõrzõ szó kiolvasásával (leírása megtalálható az "AT Attachment - 8 ATA/ATAPI Command Set (ATA8-ACS)" dokumentum 116. oldalán.

Ideális esetben a driver minden adatot pontosan ad vissza
Ideális esetben a driver minden adatot pontosan ad vissza

Hibás szektorok?

Többször elõforduló kérdés, hogy mit jelentenek a "hibás szektorok", hogyan lehet ezeket orvosolni. Sokan furcsának tartják ezt, hiszen a lemez felületét ellenõrzõ szoftverek (pl. Windows lemezellenõrzõ) nem jeleznek hibás területet, akkor hogy is van ez?

A merevlemezben található önellenõrzõ algoritmus a következõképpen mûködik: mikor a lemez felületén problémát (hibás szektort) észlel, elkezdi onnan az adatokat átmenteni a tartalék adatterületre. Ilyenkor az eredeti helyet megjelöli hibásnak és minden további (ide irányuló) írás és olvasás átirányításra kerül a tartalék területre.

A folyamat végén az eredeti (hibás) terület szoftveres úton nem érhetõ el többé. Ezért (többszöri) formázás és újratelepítés után sem mutat a lemez hibát, mivel valójában a hibásnak minõsített adatterület ilyenkor nem esik formázás (ellenõrzés) és használat alá. Emiatt például az említett alkalmazás (Scandisk) sem talált hibát a felületen, még alapos teszteléssel sem. Egyedül a hardveres biztonsági törlés funkció éri el ezt a területet is, mely törli az esetlegesen ott maradt információt is.

Emiatt pl. a DOS-os formázás a mai modern merevlemezeknél (a S.M.A.R.T. tevékenysége miatt) gyakorlatilag sosem talál hibás szektort (illetve csak akkor, ha a tartalék terület már megtelt, de ez valóban ritka, személy szerint még nem találkozam ilyen merevlemezzel).

Az adatok átmentése nem minden esetben problémamentes (bár tény, hogy a lemezek sokat fejlõdtek ilyen téren az elmúlt évek alatt). Legjobb esetben az átmentés gond nélkül lezajlik, de a rendszert ez rövidebb-hosszabb ideig megakaszthatja, veszélyeztetheti annak stabilitását.

Ideális esetben a felhasználó nem vesz észre semmit a fenti procedúrából, csak mikor már a S.M.A.R.T. egyik pillanatról a másikra riaszt - ha megéri a lemez, hogy a valamely attribútum értéke (pl. a hibás szektorok száma alapján) elérje a küszöböt.

Megoldás

Az valóban elég ritka, hogy minden különösebb ok nélkül egy merevlemez elhalálozzon, kivéve a leesést, túlfeszültséget, természeti katasztrófát, melyeket értelemszerûen nem jelez elõre a S.M.A.R.T. (sem). Általában néhány hibás szektor megjelenik, ezek száma egyre nõ, a lemez állapota lassan de folyamatosan romlik (akár hetek is elmúlhatnak "tünetmentesen"). Más esetben a magas hõmérséklet és/vagy kevés számú de nagyon kritikus hiba (pl. felpörgés sikertelensége) adhat okot aggodalomra.

Nem ritka az sem, hogy több különbözõ probléma jelentkezik, melyek együttes hatása más és más hibára enged következtetni. Például ha a merevlemez nehezen (csak többszöri újrapróbálkozás után) vagy lassan pörög fel (mely motor ill. csapágy hibára enged következtetni), annak nyoma van a S.M.A.R.T. adat mezõkben. De akár csak egyetlen újabb hibás vagy gyenge szektor is bejegyzésre kerül, tehát minden változás (még ha csekély mértékû is) észlelhetõ.

Fontos, hogy ezeket a jeleket idõben felismerjük és jóval az adatvesztés elõtt fel tudjunk lépni. Ezért lényeges, hogy a korábban használt modellt (és a fenti (1) képletet) teljesen mellõzve, a gyártó specifikus küszöbértékeket (vagy azok hiányát, rossz megválasztását) figyelmen kívül hagyva a nyers mért értékeket vegyük alapul, azok alapján alkossunk véleményt a merevlemezrõl, lehetõség szerint az egyes attribútumok közötti kölcsönhatást, összefüggést is vizsgálva. Így valós képet kaphatunk a lemez állapotáról, megtudhatjuk mi okoz problémát és esetleg mit tehetünk a védekezés, megelõzés érdekében.

Érdemes az értékelést a merevlemez használatának és az adatok fontosságának figyelembevételével megválasztani. Egy komolyabb használat alatt álló, nagyobb igénybevételû (pl. szerver vagy hordozható számítógép) illetve kritikus adatokat tartalmazó merevlemez esetén a legkisebb hiba is végzetes lehet, így fontos, hogy bármilyen apró botlás, hiba esetén azonnal lépni lehessen.

A szoftverek egy része képes ilyen módon (módokon) értékelni a merevlemez állapotát, valamint szöveges értékelést készíteni, esetleges tippeket adni a problémák orvoslására. Hasznos funkció, ha az esetleges új problémák észlelésekor a szoftver nem csak passzívan tud figyelmeztetni (például hangjelzéssel, üzenet küldésével, lekapcsolással), hanem aktívan is képes fellépni, például teljes vagy részleges adatmentési (archiválási) feladatok indításával.

A Hard Disk Sentinel alkalmazás kialakítása a fentiek figyelembevételével történt. A fejlesztés során a Králik és Társa Kft.-hez adatmentésre érkezett merevlemezek S.M.A.R.T. adatait elemezve készült el a lemezek értékelését végzõ modul, mely a szöveges értékeléssel együtt pontos képet ad a valóban elõforduló problémákról. A fejlesztés során lehetõség volt megvizsgálni számos különbözõ gyártójú és típusú merevlemez állapotát - melyek már csak komoly adatmentõ módszerek segítségével voltak mûködõképesek. Fontos megemlíteni, hogy ezen merevlemezek túlnyomó többségénél a "hagyományos" S.M.A.R.T. valóban nem jelzett meghibásodás elõtt.

Példa

Az alábbi S.M.A.R.T. attribútumokkal rendelkezõ merevlemez mûködésképtelen állapotban került adatmentésre:

AzonosítóAttribútum névKüszöbÉrtékLegrosszabbAdatÁllapotjelzõkKritikus?
1 Raw Read Error Rate 50 100 100 000000000000 000BIgen
2 Throughput Performance 50 100 100 000000000000 0005 
3 Spin Up Time 1 100 100 0000000001E9 0027 
4 Start/Stop Count 0 100 100 000000000A5A 0032 
5 Reallocated Sectors Count 50 100 100 000000000015 0033Igen
7 Seek Error Rate 50 100 100 000000000000 000BIgen
8 Seek Time Performance 50 100 100 000000000000 0005 
9 Power-On Time Count 0 87 87 0000000014C1 0032 
10 Spin Retry Count 30 152 100 000000000000 0033Igen
12 Drive Power Cycle Count 0 100 100 0000000009EA 0032 
192 Vendor-specific 0 100 100 000000000058 0032 
193 Load/Unload Cycle Count 0 73 73 00000004218D 0032 
194 HDD Temperature 0 100 100 003B00020024 0022 
196 Reallocation Event Count 0 100 100 00000000000F 0032 
197 Current Pending Sector Count 0 100 100 000000000004 0032 
198 Off-Line Uncorrectable Sector Count 0 100 100 000000000000 0030 
199 Ultra ATA CRC Error Count 0 200 200 000000000000 0032 
220 Disk Shift 0 100 100 0000000000B3 0002 
222 Loaded Hours 0 95 95 0000000007EA 0032 
223 Load/Unload Retry Count 0 100 100 000000000000 0032 
224 Load Friction 0 100 100 000000000000 0022 
226 Load-in Time 0 100 100 00000000017F 0026 
240 Head flying hours 1 100 100 000000000000 0001Igen

A BIOS által támogatott S.M.A.R.T. ellenõrzés problémát nem jelzett. A táblázatot áttanulmányozva látható, hogy az Érték oszlopban található számok (100 ill. a felettiek) a Küszöb értékektõl nagyon távol állnak, sõt többségük (100-as értékek) el sem mozdult a maximális kondíciót jelzõ szintrõl. Emiatt a gyártó specifikus értékek elemzésével a merevlemez nemhogy hibásnak nem mutatja magát, de a kondíciója tökéletesnek tûnik. A 100-nál alacsonyabb értékek a merevlemez mûködési idejébõl adódnak, mindazonáltal a lemez összesen csak 5313 órát (0x14C1) töltött bekapcsolva (jelen merevlemeznél a teljes mûködési idõt a gyártó vélhetõleg jól adta meg, azt kiszámítva nagyjából 4,7 évet kapunk napi 24 órás üzemmódban használva: (5313/0,13)/24/365 = 4,665 év). Tehát elhasználódásról még szó sem lehet.

Ezzel szemben a Hard Disk Sentinel értékelõ algoritmusa segítségével egészen más eredményt kapunk. Mivel a kérdéses merevlemez egy hordozható számítógépben használt 2.5"-os példány, a szigorúbb értékelési módszer segítségével kerül értékelésre a merevlemez állapota. Az értékelésben részt vesznek azon attribútumok is, melyek funkciójuk szerint felelõsek a lemez valós állapotáért - még ha azok a gyártó szerint nem kritikusak.

A kondíció számítása (figyelembe véve az 5-ös, 196-os, 197-es attribútumok Adat mezõjében található értékeket):

100 x (100 - 10x6) x (100 - 30) x (100 - 4x4) = 23,52 %

Az értékelés alapján a merevlemez kondíciója igencsak aggasztó. A szoftver alaphelyzetben ilyen kondíció esetén már figyelmeztet, hogy adatvesztés várható. A megfelelõ számítási módszer kiválasztásával és a megfelelõ riasztási szint beállításával még akár ennél korábban is jelezhetõ lett volna az adatvesztés ennél a merevlemeznél - ha a megfelelõ szoftver elõzõleg telepítése kerül.

Önmagában ha a kondíció alacsony, nem jelenti azt, hogy a merevlemez biztosan meg fog hibásodni az elkövetkezendõ idõszakban (ehhez tüzetesebb - nem szoftveres - vizsgálatok szükségesek), de reális esély van rá. A fenti merevlemez problémája nehezen detektálható, valóban kevés nyomot hagy a S.M.A.R.T. táblázatban. Más probléma esetén más merevlemezek (akár ennél alacsonyabb kondíció értékkel is) nem kizárt, hogy hosszú ideig üzemelnek még (például rövid ideig tartó túl nagy hõmérséklet, nem megfelelõ tápellátás által okozott problémák maguktól nem javulnak meg, de az ok elhárításával a merevlemez további élettartama meghosszabbítható). Mindazonáltal az ilyen lemezeket érdemesebb fokozottabb figyelemmel mûködtetni és gondoskodni róla, hogy a tárolt adatok egy másik, lehetõség szerint jobb állapotú eszközön is rendelkezésre álljanak.

Máthé János

Jelen írás (illetve annak bármely része) szabadon felhasználható, terjeszthetõ, de kizárólag az eredeti cikkre való hivatkozással (link) együtt.

Vissza a Hard Disk Sentinel oldalára

Felhasznált irodalom

Information technology - AT Attachment 8 - ATA/ATAPI Command Set (ATA8-ACS) (Revision 3f December 11, 2006)
www.t13.org, D1699r3f-ATA8-ACS.pdf

Tekintse meg a S.M.A.R.T. attribútumok teljes listáját és azok jelentését! (pl. reallocated sector count, off-line uncorrectable sectors count, stb.)

Oldal megjelenítések száma: 10726