[awaria] WD Red 3TB padł. Co w zamian?
-
- Zawsze On-Line
- Posty: 435
- Rejestracja: śr mar 30, 2016 7:22 am
- Lokalizacja: Dolny Śląsk
[awaria] WD Red 3TB padł. Co w zamian?
Witam
Po circa 8 latach służby w moim DS214play, padł mi jeden z dwóch WD-Red'ów WD30EFRX. Co gorsza dyski były w Raid0 - wiem, wiem, mea culpa. Jednak serwerek już znów żyje, na 1 dysku. Dane przywrócone z backupu, nie przekraczały rozmiaru 3TB. Kiedyś myślałem, że będą znacznie szybciej przyrastać, stąd się wziął Raid0.
Zastanawiam się co teraz nabyć do macierzy z ochroną danych SHR/Raid1. Zastanawiam się również czy jest sens znów kupować WD Red'a. Ceny modeli 3TB widzę dalej całkiem niechude, w okolicach 5 stów. Czyli kwotowo podobnie jak 8 lat temu, chociaż uwzględniając inflację zapewne trochę mniej.
Niemniej nie bardzo jestem przekonany, czy warto tyle inwestować. NAS już niemłody, a i drugi WD Red może przecież w każdej chwili wyzionąć ducha (wg. SMART - ok. 45000h).
Serwer w zastosowaniu domowym, głównie multimedia. Trochę plików osobistych, zdjęć itp. backupowanych na zewnętrzny HDD-USB i do chmury.
Co byście proponowali w mojej sytuacji?
Po circa 8 latach służby w moim DS214play, padł mi jeden z dwóch WD-Red'ów WD30EFRX. Co gorsza dyski były w Raid0 - wiem, wiem, mea culpa. Jednak serwerek już znów żyje, na 1 dysku. Dane przywrócone z backupu, nie przekraczały rozmiaru 3TB. Kiedyś myślałem, że będą znacznie szybciej przyrastać, stąd się wziął Raid0.
Zastanawiam się co teraz nabyć do macierzy z ochroną danych SHR/Raid1. Zastanawiam się również czy jest sens znów kupować WD Red'a. Ceny modeli 3TB widzę dalej całkiem niechude, w okolicach 5 stów. Czyli kwotowo podobnie jak 8 lat temu, chociaż uwzględniając inflację zapewne trochę mniej.
Niemniej nie bardzo jestem przekonany, czy warto tyle inwestować. NAS już niemłody, a i drugi WD Red może przecież w każdej chwili wyzionąć ducha (wg. SMART - ok. 45000h).
Serwer w zastosowaniu domowym, głównie multimedia. Trochę plików osobistych, zdjęć itp. backupowanych na zewnętrzny HDD-USB i do chmury.
Co byście proponowali w mojej sytuacji?
DS214play | DSM 6.2.4-2556 Update 5
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
-
- Zawsze On-Line
- Posty: 519
- Rejestracja: ndz sty 24, 2016 10:46 am
Re: [awaria] WD Red 3TB padł. Co w zamian?
Skoro danych nie masz więcej niż 3TB, to ciągnącym dalej na tym jednym dysku. Jak padnie, to wówczas bym podmienił na 2 nowe z pojemnością dopasowaną do przyszłych potrzeb, ewentualnie pod nowego NAS’a. Oczywiście jak dopuszczasz, że po awarii kilka dni będzie w stanie off - do czasu zakupu nowego dysku/dysków.
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
- mikhnal
- Darth Vader
- Posty: 2752
- Rejestracja: pt gru 11, 2015 8:55 am
- Lokalizacja: Warszawa
Re: [awaria] WD Red 3TB padł. Co w zamian?
@stanley99: WD Red 3TB EFRX (ale tylko ten!) to wyjątkowo nieudany konstrukcyjnie model, nie ma innego Reda, który pada w takich ilościach. Dla spokoju ducha przejdź na nowe 4TB WD Red Plus albo Toshiba N300.
DS3018xs
DSM 7.2.1-69057 Update 5
32GB RAM 2x KSM24SED8/16ME DDR4 2400 CL17 ECC mod
6x 10TB WD Red WD100EFAX RAID5 btrfs
2x SNV3500-400G read/write SSD cache @ E10M20-T1 + 10GbE LAN
2x Noctua NF-A9 fan mod
RT6600ax + WRX560
SRM 1.3.1-9346 Update 9
DSM 7.2.1-69057 Update 5
32GB RAM 2x KSM24SED8/16ME DDR4 2400 CL17 ECC mod
6x 10TB WD Red WD100EFAX RAID5 btrfs
2x SNV3500-400G read/write SSD cache @ E10M20-T1 + 10GbE LAN
2x Noctua NF-A9 fan mod
RT6600ax + WRX560
SRM 1.3.1-9346 Update 9
-
- Zawsze On-Line
- Posty: 435
- Rejestracja: śr mar 30, 2016 7:22 am
- Lokalizacja: Dolny Śląsk
Re: [awaria] WD Red 3TB padł. Co w zamian?
Witam
Niestety zgodnie z prawami Murphyego, że jak coś ma paść to padnie, itd., drugi dysk nie dał na siebie długo czekać. Wczoraj zajrzałem do DSM i na widgecie kondycji systemu ujrzałem komunikat: “Uwaga stan dysku jest nienormalny. Aby uzyskać więcej informacji przejdź do sekcji Zarządzanie przechowywaniem.”
Co ciekawe tym razem nie otrzymałem żadnego powiadomienia, że coś jest nie tak. Jeszcze kilka dni temu dostałem maila z comiesięcznym raportem o kondycji - wszystko było ok. Dopiero gdy wymusiłem wczoraj manualnie szybki test dysku (automatycznie jest wykonywany co poniedziałek), zaraz nadszedł mail: “Dysk Drive 1 na DS214play jest poważnie uszkodzony i uległ awarii. “.
Kolejna ciekawostka: dysk nie zgłasza żadnych błędnych sektorów, błędów WE/WY, co miało miejsce przy awarii pierwszego HDD. Nie słyszę jakichś niepokojących dźwięków, etc. W ogóle wszystko w DSM wydaje się działać prawidłowo. Działają pakiety, można kopiować/usuwać pliki, diody na panelu czołowym świecą normalnie, itd. Gdyby nie wspomniany na początku komunikat, nie zorientowałbym się, że coś jest nie tak.
Dlatego wklejam screeny SMART i proszę o pomoc w “rozszyfrowaniu” co się właściwie dzieje. Zdaję sobie sprawę, że dysk zapewne jest już na wylocie. I tak jak na pechową serię chyba przetrwał dosyć długo (zakup: jesień 2013, czyli w zasadzie równo 8 lat) Jednak o ile pierwszy padnięty HDD zgłaszał błędy ewidentne, o tyle drugi jak dla mnie już nie bardzo.
P.S. Jakby co mogę dla porównania wkleić screeny SMART tego dysku sprzed około miesiąca (gdy padł 1-szy dysk, zrobiłem screeny obu)
Niestety zgodnie z prawami Murphyego, że jak coś ma paść to padnie, itd., drugi dysk nie dał na siebie długo czekać. Wczoraj zajrzałem do DSM i na widgecie kondycji systemu ujrzałem komunikat: “Uwaga stan dysku jest nienormalny. Aby uzyskać więcej informacji przejdź do sekcji Zarządzanie przechowywaniem.”
Co ciekawe tym razem nie otrzymałem żadnego powiadomienia, że coś jest nie tak. Jeszcze kilka dni temu dostałem maila z comiesięcznym raportem o kondycji - wszystko było ok. Dopiero gdy wymusiłem wczoraj manualnie szybki test dysku (automatycznie jest wykonywany co poniedziałek), zaraz nadszedł mail: “Dysk Drive 1 na DS214play jest poważnie uszkodzony i uległ awarii. “.
Kolejna ciekawostka: dysk nie zgłasza żadnych błędnych sektorów, błędów WE/WY, co miało miejsce przy awarii pierwszego HDD. Nie słyszę jakichś niepokojących dźwięków, etc. W ogóle wszystko w DSM wydaje się działać prawidłowo. Działają pakiety, można kopiować/usuwać pliki, diody na panelu czołowym świecą normalnie, itd. Gdyby nie wspomniany na początku komunikat, nie zorientowałbym się, że coś jest nie tak.
Dlatego wklejam screeny SMART i proszę o pomoc w “rozszyfrowaniu” co się właściwie dzieje. Zdaję sobie sprawę, że dysk zapewne jest już na wylocie. I tak jak na pechową serię chyba przetrwał dosyć długo (zakup: jesień 2013, czyli w zasadzie równo 8 lat) Jednak o ile pierwszy padnięty HDD zgłaszał błędy ewidentne, o tyle drugi jak dla mnie już nie bardzo.
P.S. Jakby co mogę dla porównania wkleić screeny SMART tego dysku sprzed około miesiąca (gdy padł 1-szy dysk, zrobiłem screeny obu)
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.
DS214play | DSM 6.2.4-2556 Update 5
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
- mikhnal
- Darth Vader
- Posty: 2752
- Rejestracja: pt gru 11, 2015 8:55 am
- Lokalizacja: Warszawa
Re: [awaria] WD Red 3TB padł. Co w zamian?
Myślę, że są tu więksi spece od dysków, ale moim zdaniem na zrzucie kluczowe są dwa parametry: ID#200 oraz ID#1. ID#200 to jakby badanie i przygotowanie sektora do realokowania, dopóki nie zwiększa się drastycznie można z tym żyć. ID#1 to problemy z odczytem spowodowane właśnie przez takie "spowolnione" sektory z 200.
DS3018xs
DSM 7.2.1-69057 Update 5
32GB RAM 2x KSM24SED8/16ME DDR4 2400 CL17 ECC mod
6x 10TB WD Red WD100EFAX RAID5 btrfs
2x SNV3500-400G read/write SSD cache @ E10M20-T1 + 10GbE LAN
2x Noctua NF-A9 fan mod
RT6600ax + WRX560
SRM 1.3.1-9346 Update 9
DSM 7.2.1-69057 Update 5
32GB RAM 2x KSM24SED8/16ME DDR4 2400 CL17 ECC mod
6x 10TB WD Red WD100EFAX RAID5 btrfs
2x SNV3500-400G read/write SSD cache @ E10M20-T1 + 10GbE LAN
2x Noctua NF-A9 fan mod
RT6600ax + WRX560
SRM 1.3.1-9346 Update 9
-
- Zawsze On-Line
- Posty: 519
- Rejestracja: ndz sty 24, 2016 10:46 am
[awaria] WD Red 3TB padł. Co w zamian?
Trochę dużo cykli na ID#193 jak na całkowitą pracę dysku.
Oczywiście ten parametr nie jest krytyczny i od wielkości tej cyferki dysk nie jest uszkodzony. Natomiast dość często były parkowane głowice jak na dysk, który ma pracować 24/h - średnio to ponad 5 razy w ciągu dnia - może to taki urok tego modelu.
@mikhnal dobrze opisał problem dla tego dysku.
Oczywiście ten parametr nie jest krytyczny i od wielkości tej cyferki dysk nie jest uszkodzony. Natomiast dość często były parkowane głowice jak na dysk, który ma pracować 24/h - średnio to ponad 5 razy w ciągu dnia - może to taki urok tego modelu.
@mikhnal dobrze opisał problem dla tego dysku.
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
-
- Zawsze On-Line
- Posty: 435
- Rejestracja: śr mar 30, 2016 7:22 am
- Lokalizacja: Dolny Śląsk
Re: [awaria] WD Red 3TB padł. Co w zamian?
Witam
Hm, ja zupełnie nie jestem specem od dysków, ale wklejam SMART tego dysku z momentu, gdy jeszcze system nie zgłaszał żadnych jego błędów. Jak widać, parametry ID #1 i #200 uległy zwiększeniu o 1 (z 7 na 8 i z 1 na 2). Czy to jest aż tak istotne? Rzecz jasna zwiększeniu uległa np. ilość godzin pracy, ale to oczywista oczywistość.
Jednak "odkryłem" kolejną rzecz, w ferworze nie zauważyłem. Mianowicie maile, które dostaję z powiadomieniami o awarii tego dysku, zawierają informację o uszkodzeniu... SMART. Wygląda to tak:
"Dysk Drive 1 na DS214play jest poważnie uszkodzony i uległ awarii. Natychmiast wykonaj kopię zapasową danych, a następnie wymień dysk.
Informacje o dysku:
<< tu info o modelu, nr fabr., wersji oprogr, etc. >>
Status S.M.A.R.T.: Uległ awarii
Liczba złych sektorów: 0
Liczba ponownych podłączeń dysku: 0
Liczba ponownych identyfikacji dysku: 0
Aby uzyskać więcej informacji, zaloguj się w DiskStation."
Qrczę, nie bardzo tego rozumiem. Chodzi o to, że SMART uległ awarii? To w jaki sposób go odczytuję?
Porównałem z ciekawości maile, które dostawałem po awarii pierwszego dysku, opisanej na początku topicu. Fragment odnośnie SMART, sektorów, itd., wyglądał tak:
"Status S.M.A.R.T.: Normalny
Liczba złych sektorów: 15
Liczba ponownych podłączeń dysku: 0
Liczba ponownych identyfikacji dysku: 0"
Tutaj sytuacja i przyczyna usterki była dla mnie jasna - błędne sektory, których liczba zresztą powoli stopniowo rosła. Były jeszcze powiadomienia o błędach WE/WY. Jako jeszcze ciekawostka: Parametry ID #1 i #200 wynosiły w tamtym dysku odpowiednio 1710 i 124, lecz jak widać status SMART był wciąż normalny.
I jeszcze jedna niezrozumiała dla mnie ciekawostka. W harmonogramie mam ustawione wykonywanie testu rozszerzonego tego dysku na 1-szego każdego miesiąca. W historii testów mam ostatni poprawny 1.09 (nawiasem - nie wiem dlaczego nie wykonały się automatycznie 1.10 i 1.11). Natomiast wg. tego screenu, wynik tego samego testu wskazuje, że... dysk uległ awarii. Ponadto jak widać na tym screenie, test szybki przechodzi normalnie (robiony parę minut temu), chociaż chwilę potem dostaję maila, że dysk jest poważnie uszkodzony. Nic już z tego wszystkiego nie rozumiem. Dysk dobry ale zły, lub na odwrót? Może się wypowiedzieć jakiś spec?
Hm, ja zupełnie nie jestem specem od dysków, ale wklejam SMART tego dysku z momentu, gdy jeszcze system nie zgłaszał żadnych jego błędów. Jak widać, parametry ID #1 i #200 uległy zwiększeniu o 1 (z 7 na 8 i z 1 na 2). Czy to jest aż tak istotne? Rzecz jasna zwiększeniu uległa np. ilość godzin pracy, ale to oczywista oczywistość.
Jednak "odkryłem" kolejną rzecz, w ferworze nie zauważyłem. Mianowicie maile, które dostaję z powiadomieniami o awarii tego dysku, zawierają informację o uszkodzeniu... SMART. Wygląda to tak:
"Dysk Drive 1 na DS214play jest poważnie uszkodzony i uległ awarii. Natychmiast wykonaj kopię zapasową danych, a następnie wymień dysk.
Informacje o dysku:
<< tu info o modelu, nr fabr., wersji oprogr, etc. >>
Status S.M.A.R.T.: Uległ awarii
Liczba złych sektorów: 0
Liczba ponownych podłączeń dysku: 0
Liczba ponownych identyfikacji dysku: 0
Aby uzyskać więcej informacji, zaloguj się w DiskStation."
Qrczę, nie bardzo tego rozumiem. Chodzi o to, że SMART uległ awarii? To w jaki sposób go odczytuję?
Porównałem z ciekawości maile, które dostawałem po awarii pierwszego dysku, opisanej na początku topicu. Fragment odnośnie SMART, sektorów, itd., wyglądał tak:
"Status S.M.A.R.T.: Normalny
Liczba złych sektorów: 15
Liczba ponownych podłączeń dysku: 0
Liczba ponownych identyfikacji dysku: 0"
Tutaj sytuacja i przyczyna usterki była dla mnie jasna - błędne sektory, których liczba zresztą powoli stopniowo rosła. Były jeszcze powiadomienia o błędach WE/WY. Jako jeszcze ciekawostka: Parametry ID #1 i #200 wynosiły w tamtym dysku odpowiednio 1710 i 124, lecz jak widać status SMART był wciąż normalny.
I jeszcze jedna niezrozumiała dla mnie ciekawostka. W harmonogramie mam ustawione wykonywanie testu rozszerzonego tego dysku na 1-szego każdego miesiąca. W historii testów mam ostatni poprawny 1.09 (nawiasem - nie wiem dlaczego nie wykonały się automatycznie 1.10 i 1.11). Natomiast wg. tego screenu, wynik tego samego testu wskazuje, że... dysk uległ awarii. Ponadto jak widać na tym screenie, test szybki przechodzi normalnie (robiony parę minut temu), chociaż chwilę potem dostaję maila, że dysk jest poważnie uszkodzony. Nic już z tego wszystkiego nie rozumiem. Dysk dobry ale zły, lub na odwrót? Może się wypowiedzieć jakiś spec?
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.
DS214play | DSM 6.2.4-2556 Update 5
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
-
- Zawsze On-Line
- Posty: 435
- Rejestracja: śr mar 30, 2016 7:22 am
- Lokalizacja: Dolny Śląsk
Re: [awaria] WD Red 3TB padł. Co w zamian?
Być może dlatego, że przez kilka lat NAS był automatycznie wyłączany na noc. Dopiero od circa 2, może 3 lat chodził 24h/dobę.
EDIT
Przed chwilą zapuściłem jeszcze raz test rozszerzony, bo wygląda na to, że ostatni był 1.09. Zobaczymy. Choć raczej wątpię, żeby się coś naprawiło...
DS214play | DSM 6.2.4-2556 Update 5
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
RT2600ac
Człowiek nabiera doświadczenia z wiekiem. Szkoda tylko, że jest to wieko od trumny.
-
- Zawsze On-Line
- Posty: 519
- Rejestracja: ndz sty 24, 2016 10:46 am
Re: [awaria] WD Red 3TB padł. Co w zamian?
Test rozszerzony raczej niczego nie naprawi. Może za to dużo wyjaśnić.
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
-
- Godfather
- Posty: 1319
- Rejestracja: wt gru 15, 2015 12:19 pm
- Lokalizacja: Żyrardów
Re: [awaria] WD Red 3TB padł. Co w zamian?
Gdybyś przeskanował dysk zewnętrznym narzędziem było by wiadomo ile to jest słabych sektorów.
Ale mimo wszystko oba dyski nadają się do kosza. Pytanie czy dasz radę odzyskać wszystkie dane.
Ale mimo wszystko oba dyski nadają się do kosza. Pytanie czy dasz radę odzyskać wszystkie dane.
Administratorzy dzielą się na tych, którzy robią kopie zapasowe i tych, którzy będą je robili.
Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+
"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676
Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+
"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676