[awaria] WD Red 3TB padł. Co w zamian?

stanley99
Zawsze On-Line
Posty: 429
Rejestracja: śr mar 30, 2016 7:22 am
Lokalizacja: Dolny Śląsk

[awaria] WD Red 3TB padł. Co w zamian?

Post autor: stanley99 »

Witam
Po circa 8 latach służby w moim DS214play, padł mi jeden z dwóch WD-Red'ów WD30EFRX. Co gorsza dyski były w Raid0 - wiem, wiem, mea culpa. Jednak serwerek już znów żyje, na 1 dysku. Dane przywrócone z backupu, nie przekraczały rozmiaru 3TB. Kiedyś myślałem, że będą znacznie szybciej przyrastać, stąd się wziął Raid0.
Zastanawiam się co teraz nabyć do macierzy z ochroną danych SHR/Raid1. Zastanawiam się również czy jest sens znów kupować WD Red'a. Ceny modeli 3TB widzę dalej całkiem niechude, w okolicach 5 stów. Czyli kwotowo podobnie jak 8 lat temu, chociaż uwzględniając inflację zapewne trochę mniej.
Niemniej nie bardzo jestem przekonany, czy warto tyle inwestować. NAS już niemłody, a i drugi WD Red może przecież w każdej chwili wyzionąć ducha (wg. SMART - ok. 45000h).
Serwer w zastosowaniu domowym, głównie multimedia. Trochę plików osobistych, zdjęć itp. backupowanych na zewnętrzny HDD-USB i do chmury.
Co byście proponowali w mojej sytuacji?
DS214play | DSM 6.2.4-2556 Update 5
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
look12
Zawsze On-Line
Posty: 513
Rejestracja: ndz sty 24, 2016 10:46 am

Re: [awaria] WD Red 3TB padł. Co w zamian?

Post autor: look12 »

Skoro danych nie masz więcej niż 3TB, to ciągnącym dalej na tym jednym dysku. Jak padnie, to wówczas bym podmienił na 2 nowe z pojemnością dopasowaną do przyszłych potrzeb, ewentualnie pod nowego NAS’a. Oczywiście jak dopuszczasz, że po awarii kilka dni będzie w stanie off - do czasu zakupu nowego dysku/dysków.
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
Awatar użytkownika
mikhnal
Darth Vader
Posty: 2728
Rejestracja: pt gru 11, 2015 8:55 am
Lokalizacja: Warszawa

Re: [awaria] WD Red 3TB padł. Co w zamian?

Post autor: mikhnal »

@stanley99: WD Red 3TB EFRX (ale tylko ten!) to wyjątkowo nieudany konstrukcyjnie model, nie ma innego Reda, który pada w takich ilościach. Dla spokoju ducha przejdź na nowe 4TB WD Red Plus albo Toshiba N300.
DS3018xs
DSM 7.2.1-69057 Update 4
32GB RAM 2x KSM24SED8/16ME DDR4 2400 CL17 ECC mod
6x 10TB WD Red WD100EFAX RAID5 btrfs
2x SNV3500-400G read/write SSD cache @ E10M20-T1 + 10GbE LAN
2x Noctua NF-A9 fan mod
RT6600ax + WRX560
SRM 1.3.1-9346 Update 9
stanley99
Zawsze On-Line
Posty: 429
Rejestracja: śr mar 30, 2016 7:22 am
Lokalizacja: Dolny Śląsk

Re: [awaria] WD Red 3TB padł. Co w zamian?

Post autor: stanley99 »

Witam

Niestety zgodnie z prawami Murphyego, że jak coś ma paść to padnie, itd., drugi dysk nie dał na siebie długo czekać. Wczoraj zajrzałem do DSM i na widgecie kondycji systemu ujrzałem komunikat: “Uwaga stan dysku jest nienormalny. Aby uzyskać więcej informacji przejdź do sekcji Zarządzanie przechowywaniem.”
Co ciekawe tym razem nie otrzymałem żadnego powiadomienia, że coś jest nie tak. Jeszcze kilka dni temu dostałem maila z comiesięcznym raportem o kondycji - wszystko było ok. Dopiero gdy wymusiłem wczoraj manualnie szybki test dysku (automatycznie jest wykonywany co poniedziałek), zaraz nadszedł mail: “Dysk Drive 1 na DS214play jest poważnie uszkodzony i uległ awarii. “.
Kolejna ciekawostka: dysk nie zgłasza żadnych błędnych sektorów, błędów WE/WY, co miało miejsce przy awarii pierwszego HDD. Nie słyszę jakichś niepokojących dźwięków, etc. W ogóle wszystko w DSM wydaje się działać prawidłowo. Działają pakiety, można kopiować/usuwać pliki, diody na panelu czołowym świecą normalnie, itd. Gdyby nie wspomniany na początku komunikat, nie zorientowałbym się, że coś jest nie tak.

Dlatego wklejam screeny SMART i proszę o pomoc w “rozszyfrowaniu” co się właściwie dzieje. Zdaję sobie sprawę, że dysk zapewne jest już na wylocie. I tak jak na pechową serię chyba przetrwał dosyć długo ;-) (zakup: jesień 2013, czyli w zasadzie równo 8 lat) Jednak o ile pierwszy padnięty HDD zgłaszał błędy ewidentne, o tyle drugi jak dla mnie już nie bardzo.

Screen01_cut.jpg
Screen02_cut.jpg

P.S. Jakby co mogę dla porównania wkleić screeny SMART tego dysku sprzed około miesiąca (gdy padł 1-szy dysk, zrobiłem screeny obu)
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.
DS214play | DSM 6.2.4-2556 Update 5
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
Awatar użytkownika
mikhnal
Darth Vader
Posty: 2728
Rejestracja: pt gru 11, 2015 8:55 am
Lokalizacja: Warszawa

Re: [awaria] WD Red 3TB padł. Co w zamian?

Post autor: mikhnal »

Myślę, że są tu więksi spece od dysków, ale moim zdaniem na zrzucie kluczowe są dwa parametry: ID#200 oraz ID#1. ID#200 to jakby badanie i przygotowanie sektora do realokowania, dopóki nie zwiększa się drastycznie można z tym żyć. ID#1 to problemy z odczytem spowodowane właśnie przez takie "spowolnione" sektory z 200.
DS3018xs
DSM 7.2.1-69057 Update 4
32GB RAM 2x KSM24SED8/16ME DDR4 2400 CL17 ECC mod
6x 10TB WD Red WD100EFAX RAID5 btrfs
2x SNV3500-400G read/write SSD cache @ E10M20-T1 + 10GbE LAN
2x Noctua NF-A9 fan mod
RT6600ax + WRX560
SRM 1.3.1-9346 Update 9
look12
Zawsze On-Line
Posty: 513
Rejestracja: ndz sty 24, 2016 10:46 am

[awaria] WD Red 3TB padł. Co w zamian?

Post autor: look12 »

Trochę dużo cykli na ID#193 jak na całkowitą pracę dysku.
Oczywiście ten parametr nie jest krytyczny i od wielkości tej cyferki dysk nie jest uszkodzony. Natomiast dość często były parkowane głowice jak na dysk, który ma pracować 24/h - średnio to ponad 5 razy w ciągu dnia - może to taki urok tego modelu.
@mikhnal dobrze opisał problem dla tego dysku.
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
stanley99
Zawsze On-Line
Posty: 429
Rejestracja: śr mar 30, 2016 7:22 am
Lokalizacja: Dolny Śląsk

Re: [awaria] WD Red 3TB padł. Co w zamian?

Post autor: stanley99 »

Witam
Hm, ja zupełnie nie jestem specem od dysków, ale wklejam SMART tego dysku z momentu, gdy jeszcze system nie zgłaszał żadnych jego błędów.
Dysk1_SMART_merge_2021-08-26.jpg
Jak widać, parametry ID #1 i #200 uległy zwiększeniu o 1 (z 7 na 8 i z 1 na 2). Czy to jest aż tak istotne? Rzecz jasna zwiększeniu uległa np. ilość godzin pracy, ale to oczywista oczywistość.
Jednak "odkryłem" kolejną rzecz, w ferworze nie zauważyłem. Mianowicie maile, które dostaję z powiadomieniami o awarii tego dysku, zawierają informację o uszkodzeniu... SMART. Wygląda to tak:

"Dysk Drive 1 na DS214play jest poważnie uszkodzony i uległ awarii. Natychmiast wykonaj kopię zapasową danych, a następnie wymień dysk.
Informacje o dysku:
<< tu info o modelu, nr fabr., wersji oprogr, etc. >>
Status S.M.A.R.T.: Uległ awarii
Liczba złych sektorów: 0
Liczba ponownych podłączeń dysku: 0
Liczba ponownych identyfikacji dysku: 0
Aby uzyskać więcej informacji, zaloguj się w DiskStation."


Qrczę, nie bardzo tego rozumiem. Chodzi o to, że SMART uległ awarii? To w jaki sposób go odczytuję? ;-)
Porównałem z ciekawości maile, które dostawałem po awarii pierwszego dysku, opisanej na początku topicu. Fragment odnośnie SMART, sektorów, itd., wyglądał tak:
"Status S.M.A.R.T.: Normalny
Liczba złych sektorów: 15
Liczba ponownych podłączeń dysku: 0
Liczba ponownych identyfikacji dysku: 0"

Tutaj sytuacja i przyczyna usterki była dla mnie jasna - błędne sektory, których liczba zresztą powoli stopniowo rosła. Były jeszcze powiadomienia o błędach WE/WY. Jako jeszcze ciekawostka: Parametry ID #1 i #200 wynosiły w tamtym dysku odpowiednio 1710 i 124, lecz jak widać status SMART był wciąż normalny.

I jeszcze jedna niezrozumiała dla mnie ciekawostka. W harmonogramie mam ustawione wykonywanie testu rozszerzonego tego dysku na 1-szego każdego miesiąca. W historii testów mam ostatni poprawny 1.09 (nawiasem - nie wiem dlaczego nie wykonały się automatycznie 1.10 i 1.11).
Historia_testow_cut.jpg
Natomiast wg. tego screenu, wynik tego samego testu wskazuje, że... dysk uległ awarii. Ponadto jak widać na tym screenie, test szybki przechodzi normalnie (robiony parę minut temu), chociaż chwilę potem dostaję maila, że dysk jest poważnie uszkodzony.
Inf_o_kondycji_cut.jpg
Nic już z tego wszystkiego nie rozumiem. Dysk dobry ale zły, lub na odwrót? Może się wypowiedzieć jakiś spec? ;-)
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.
DS214play | DSM 6.2.4-2556 Update 5
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
stanley99
Zawsze On-Line
Posty: 429
Rejestracja: śr mar 30, 2016 7:22 am
Lokalizacja: Dolny Śląsk

Re: [awaria] WD Red 3TB padł. Co w zamian?

Post autor: stanley99 »

look12 pisze: wt lis 09, 2021 11:12 am Trochę dużo cykli na ID#193 jak na całkowitą pracę dysku.
Być może dlatego, że przez kilka lat NAS był automatycznie wyłączany na noc. Dopiero od circa 2, może 3 lat chodził 24h/dobę.

EDIT
Przed chwilą zapuściłem jeszcze raz test rozszerzony, bo wygląda na to, że ostatni był 1.09. Zobaczymy. Choć raczej wątpię, żeby się coś naprawiło...
DS214play | DSM 6.2.4-2556 Update 5
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
look12
Zawsze On-Line
Posty: 513
Rejestracja: ndz sty 24, 2016 10:46 am

Re: [awaria] WD Red 3TB padł. Co w zamian?

Post autor: look12 »

Test rozszerzony raczej niczego nie naprawi. Może za to dużo wyjaśnić.
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
Przemuss
Godfather
Posty: 1303
Rejestracja: wt gru 15, 2015 12:19 pm
Lokalizacja: Żyrardów

Re: [awaria] WD Red 3TB padł. Co w zamian?

Post autor: Przemuss »

Gdybyś przeskanował dysk zewnętrznym narzędziem było by wiadomo ile to jest słabych sektorów.
Ale mimo wszystko oba dyski nadają się do kosza. Pytanie czy dasz radę odzyskać wszystkie dane.
Administratorzy dzielą się na tych, którzy robią kopie zapasowe i tych, którzy będą je robili.

Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+

"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676
ODPOWIEDZ