Dlaczego mój dysk twardy uległ awarii lub awarii tak szybko i bez wyraźnego powodu?

Szacuje się, że ponad 90% wszystkich nowych informacji wytwarzanych na świecie przechowywanych jest na nośnikach magnetycznych, w większości na dyskach twardych. Pomimo ich znaczenia, opublikowano stosunkowo niewiele prac na temat wzorców awarii dysków(failure patterns of disk drives) i kluczowych czynników wpływających na ich żywotność. Większość dostępnych danych opiera się albo na ekstrapolacji z eksperymentów przyspieszonego starzenia, albo na stosunkowo niewielkich badaniach terenowych.

Dlaczego mój dysk twardy uległ awarii lub awarii?

Co więcej, większe badania populacyjne rzadko dysponują infrastrukturą do zbierania sygnałów zdrowotnych z działających komponentów, co jest informacją krytyczną dla szczegółowej analizy awarii.

Klienci wymieniają dyski twarde w tempie znacznie wyższym niż sugerowane przez szacowany średni czas między awarią ( MTBF ) dostarczany przez dostawców dysków, zgodnie z badaniem około 100 000 dysków przeprowadzonym przez Carnegie Mellon University .

Awaria dysku twardego

W badaniu Carnegie Mellon zbadano duże systemy produkcyjne, w tym witryny obliczeniowe o wysokiej wydajności i witryny internetowe(Internet) z dyskami SCSI , FC i SATA . Arkusze danych dla tych dysków wymieniały MTBF od 1 miliona do 1,5 miliona godzin, co według badania powinno oznaczać roczny wskaźnik awarii „maksymalnie 0,88%”. Jednak badanie wykazało typowe roczne stopy wymiany wynoszące od 2% do 4% „i do 13% obserwowane w niektórych systemach”.

Więc co to oznacza dla Ciebie, konsumenta, który kupuje dyski twarde i komputery z dyskami twardymi?

Mam ponad 25 lat doświadczenia w inżynierii, produkcji i tworzeniu oprogramowania, więc najpierw przyjrzyjmy się ważnemu aspektowi typowych procesów produkcyjnych, od samochodów i samolotów po dyski twarde i smartfony. Typowy producent dowolnego produktu końcowego faktycznie wytwarza kilka komponentów, które składają się na produkt końcowy. W rzeczywistości zlecają produkcję i często projektowanie prawie wszystkich podzespołów, zapewniając dostawcy nadzór w zakresie od zupełnego braku po rozbudowane specyfikacje, testowanie i nadzór. Dostawca wybrany do dostarczenia komponentu jest często najtańszym oferentem, podczas gdy niektórzy producenci wybierają najlepszego dostawcę na podstawie wartości będącej kombinacją ceny, jakości i niezawodności.

Ten system outsourcingu jest często określany jako wielopoziomowa baza dostawców. Dostawca pierwszego poziomu dostarcza produkty bezpośrednio do producenta produktu końcowego. Dostawcy pierwszego poziomu są dostawcami drugiego poziomu, a więc idzie w dół łańcucha żywnościowego. Technicznie rzecz biorąc, w przypadku producenta dysków twardych, w rzeczywistości są one dostawcą pierwszego poziomu dla producenta komputerów. Ten system wyjaśnia, dlaczego kiedy rząd Stanów (Government)Zjednoczonych (United) zmagał(States) się z ratowaniem amerykańskich producentów samochodów(US Automobile Manufacturers) , cytowano ludzi, którzy mówili, że jeśli pozwoli im się zejść, setki tysięcy ludzi stracą pracę. Odnosili się do pracowników wszystkich dostawców poziomu.

W takim systemie jakość produktu końcowego jest tak dobra, jak najsłabsze ogniwo łańcucha dostaw. Większość dostawców stosuje bardzo złożone i sztywne metody kontroli jakości i projektowania, aby zapewnić jakość swoich produktów, ale ostatecznie nadal sprowadza się to do potencjalnego błędu ludzkiego. (Very)Nawet najbardziej wyrafinowane, całodobowe, sterowane komputerowo i zrobotyzowane zakłady produkcyjne na świecie z wyłączonym oświetleniem są narażone na błędy ludzkie. Osoba programująca robota może nie koncentrować się na zadaniu, przez co robot umieszcza mikrochip o ułamek mikrometra poza cel przy każdej setnej operacji, co powoduje problemy z dyskiem twardym, gdy identyczny komputer współpracownika jest w porządku.

Takie wczesne niepowodzenia nie są rzadkością. To właśnie wszystkie gwarancje nazywają „wadami fabrycznymi”. Wewnętrzny termin branżowy to porażka śmiertelności niemowląt(Infant Mortality Failure) ( IMF ). Gwarancje są ograniczone czasowo, ponieważ mają chronić Cię przed MFW(IMFs) . W rzeczywistości istnieją różne poziomy MFW(IMFs) . Większość urządzeń elektronicznych przechodzi jakiś rodzaj testu, często określanego jako wypalanie. Jest to test na natychmiastową awarię lub awarię w ciągu pierwszych kilku minut. Są one spowodowane poważnymi wadami produkcyjnymi, które niemal natychmiast powodują katastrofalne awarie.

Bardziej uciążliwe MFW(IMFs) to te, które docierają do Ciebie, konsumenta, działają bezbłędnie przez krótki czas, a potem bam, już nie żyją. Producenci nienawidzą tych awarii, ponieważ teraz twoja opinia o producencie jest nadszarpnięta. Nigdy nie wiedziałeś o awariach podczas wypalania i cieszyłeś się, że nie wiedziałeś o nich, ale kiedy twój dysk twardy umiera w nocy przed krytycznym terminem, popadasz w balistykę i żądasz od świata odszkodowania. Koszt tej awarii jest długoterminowy i wyższy niż koszt nowego dysku twardego. Może to spowodować utratę klienta na zawsze. Dlatego nigdy nie będę posiadał kolejnego komputera HP, nawet jeśli są to świetne komputery. Dostałem zły i na zawsze splamił mnie HP.

Powiązane(Related) : Dysk twardy sam się wyczyścił! Co mam zrobić ?

Więc co możesz zrobić, aby się chronić?

Osobiście zawsze przeprowadzam wiele badań przed zakupem nowej elektroniki. MFW(IMF) może być uporczywym problemem z jednym producentem lub modelem, dopóki nie zostanie znaleziona i naprawiona główna przyczyna problemu. Może to być nawet wada projektowa, a nie problem produkcyjny. Niedawno kupiłem nowy telewizor z dużym ekranem HD i myślałem, że chcę najwyższej klasy plazmę (Plasma)Panasonic 3D , dopóki nie dowiedziałem się, czytając recenzje z kilku źródeł, że modele z 2010 roku doświadczają wczesnej (w ciągu 3 miesięcy) utraty poziomów czerni i niewystarczających dostępne były informacje, aby ustalić, czy zostało to naprawione w modelach z 2011 roku. Więc kupiłem mój drugi wybór.

Inną bardziej oczywistą rzeczą, którą możesz zrobić konkretnie z dyskiem twardym komputera, jest utworzenie kopii zapasowej danych lub zobrazowanie całego systemu. Osobiście używam produktu o nazwie Acronis True Image . Tworzę kopię zapasową całego systemu, a następnie co noc robię przyrostowe kopie zapasowe. Ustawiłem go tak, aby zachował 10 ostatnich przyrostów, więc zawsze mogę przywrócić poprzednią najnowszą wersję. Tworzę kopię zapasową na dedykowanym zewnętrznym dysku twardym(Hard Drive) o pojemności 1 TB . A co, jeśli ten twardy dysk ulegnie awarii, mówisz? Cóż, prawdopodobieństwo awarii dysku twardego komputera i zewnętrznego dysku twardego w tym samym czasie jest odległe, ale jestem właścicielem własnej firmy, więc mam nadmiarowy zewnętrzny dysk twardy, na którym robię nadmiarowe kopie zapasowe, aby być bezpiecznym.

Poleciłbym również zakup dobrej jakości ochrony przeciwprzepięciowej, nie takiej, jaką można kupić w Walmart obok przedłużaczy, ale dobrej jakości urządzenie od sprzedawcy takiego jak Best Buy lub innego sprzedawcy sprzętu komputerowego. UŻYWAM jednostki Belkin , która kosztuje około 40 USD .

Zaznacz to, jeśli potrzebujesz darmowego oprogramowania do monitorowania dysku twardego pod kątem potencjalnej awarii(Freeware to Monitor Hard Disk for Potential Failure) .(Check this if you need some Freeware to Monitor Hard Disk for Potential Failure.)

Autor tego gościnnego postu, Randy L. Miller, jest dyrektorem generalnym Alagad Incorporated.(The author of this Guest Post, Randy L. Miller is the C.E.O of Alagad Incorporated.)



About the author

Jestem inżynierem sprzętu i programistą z ponad 10-letnim doświadczeniem na platformach Apple i Google. Moje umiejętności polegają na tworzeniu wydajnych, przyjaznych dla użytkownika rozwiązań trudnych problemów inżynierskich. Miałem doświadczenie z urządzeniami MacOS i iOS, a także sterowaniem klawiaturą i myszą. W wolnym czasie lubię pływać, oglądać tenisa i słuchać muzyki.



Related posts