Przypadek statystycznie niemożliwy

ODPOWIEDZ
R70
Uczeń Mistrza
Posty: 661
Rejestracja: pn gru 18, 2017 12:53 am

Przypadek statystycznie niemożliwy

Post autor: R70 »

kilkadziesiąt minut temu dostałem maila z informacją o uszkodzeniu jeden z puli pamięci na moim serwerze. Maila odebrałem na smartfonie, w samochodzie (w korku) -adrenalina lekko skoczyła więc kiedy przeczytałem o awarii 3 z 4 dysków w R10 wydało mi się że chyba coś źle czytam ?! dojechałem do domu i szybki rzut okiem na DX517 to potwierdził 3 z 4 dysków uległo awarii !! Dysk nie NASowe - Samsungi i WD green 2TB (pula miała drugorzędne znacznie).
Teoretycznie wolumen jest tylko do odczytu więc włączyłem kopiowanie danych - ale co z tego wyjdzie nie wiem.

Mam oczywiście backup z 15.05.2021 który raczej jest aktualny (interwał backupu tygodniowy każe mi przypuszczać że dane na tym wolumenie raczej często się nie zmieniały) ale na wszelki wypadek staram się zrobić jeszcze jedną kopię.

Piszę żeby uczulić niektórych na backup i że niemożliwe przypadki jednak czasem się przytrafiają ;)
Pozdrawiam,
Paweł
DS1819+, 32GB ECC, 10GbE, DX517 DS916+ 8GB, DX513, DS710+, DX213, DS119j, DS120j
RT2600ac + RT2200ac
Awatar użytkownika
mikhnal
Darth Vader
Posty: 2728
Rejestracja: pt gru 11, 2015 8:55 am
Lokalizacja: Warszawa

Re: Przypadek statystycznie niemożliwy

Post autor: mikhnal »

WD Green w NASie? To powinno być prawnie zakazane...
DS3018xs
DSM 7.2.1-69057 Update 4
32GB RAM 2x KSM24SED8/16ME DDR4 2400 CL17 ECC mod
6x 10TB WD Red WD100EFAX RAID5 btrfs
2x SNV3500-400G read/write SSD cache @ E10M20-T1 + 10GbE LAN
2x Noctua NF-A9 fan mod
RT6600ax + WRX560
SRM 1.3.1-9346 Update 9
R70
Uczeń Mistrza
Posty: 661
Rejestracja: pn gru 18, 2017 12:53 am

Re: Przypadek statystycznie niemożliwy

Post autor: R70 »

E tam... ;) To była dodatkowa pula, nie krytyczna, utworzona do praktycznego przetestowania Raid10 na wolniejszych dyskach w stosunku do Raid5 na szybszych dyskach. Poza tym dyski green 2TB to akurat są statystycznie bardzo wytrzymałe a R10 jest wydaje się dla nich mniej uciążliwy niż R5 czy R6.
Obecnie tworzone było na nim dodatkowe zadanie ABfB (myślę że to właśnie ABfB przyczyniła się do awarii) i przechowywane jakieś duplikaty plików i stare pliki graficzne - które w wolnej chwili miałem przejrzeć ;) Oczywiści jest możliwe że w ferworze walki na którymś z wolumenów na tej puli było coś ważnego o czym nie pamięta (czyli być może nie było tak ważne) ale tak jak napisałem co tydzień zabezpieczałem wszystko zadanie HB na HDD USB.
Także że chłostanie mnie publiczne nie jest potrzebne ;)
Dodam że wszystkie dyski były z różnych serii i miały różną historię, ilość godzin, a mi nadal trudno uwierzyć w to co się stało.
Pozdrawiam,
Paweł
DS1819+, 32GB ECC, 10GbE, DX517 DS916+ 8GB, DX513, DS710+, DX213, DS119j, DS120j
RT2600ac + RT2200ac
j0seph
Trochę Wie
Posty: 126
Rejestracja: czw mar 31, 2016 1:45 pm
Lokalizacja: Gdańsk/Lublin

Re: Przypadek statystycznie niemożliwy

Post autor: j0seph »

mikhnal pisze: czw maja 20, 2021 12:52 pmWD Green w NASie? To powinno być prawnie zakazane...
Używałem WD Green w domowych macierzach (kompaktowy serwer/PC), a potem NAS długie lata zanim pojawiły się dedykowane do NAS dyski. Pojemności bardziej rzędu 320-500GB. Wydawały mi się najrozsądniejsze z dostenych na rynku pod typowe nisko obciążane archiwum danych.
Nie było żadnej awarii, nie licząc jednego zdarzenia gdzie winny był czynnik ludzki a nie sprzęt :D
DS1621xs+ | DS918+ | DS720+ | DS120j | DS119j | 22x DS115j
R70
Uczeń Mistrza
Posty: 661
Rejestracja: pn gru 18, 2017 12:53 am

Re: Przypadek statystycznie niemożliwy

Post autor: R70 »

Relacja z frontu ;)
W czasie próby kopiowania danych "wywalił" się ostatni z 4 dysków.
Pozostało usunąć pulę pamięci co nie jest łatwe, ponieważ dopiero za którymś razem udało się wejść do zarządzania przechowywaniem. W każdym razie, kiedy się udało, okazało się, że stan kondycji dysków jest dobry, natomiast dyski mają uszkodzony stan alokacji - system je odłączył od macierzy. "na ucho" na pewno któryś dysk jest kiepski, bo hałasuje.
Odłączyłem i załączyłem od nowa kolejno każdy z dysków i wszystkie mają status "nie zainicjowany"; oczywiście pula pamięci jest bezpowrotnie zdegradowana. Włączyłem test smart rozszerzony.
Pozdrawiam,
Paweł
DS1819+, 32GB ECC, 10GbE, DX517 DS916+ 8GB, DX513, DS710+, DX213, DS119j, DS120j
RT2600ac + RT2200ac
look12
Zawsze On-Line
Posty: 513
Rejestracja: ndz sty 24, 2016 10:46 am

Re: Przypadek statystycznie niemożliwy

Post autor: look12 »

Czy nie zgrało się to z rozszerzonym testem smart?
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
look12
Zawsze On-Line
Posty: 513
Rejestracja: ndz sty 24, 2016 10:46 am

Re: Przypadek statystycznie niemożliwy

Post autor: look12 »

mikhnal pisze:WD Green w NASie? To powinno być prawnie zakazane...
5 lat siedział u mnie w NAS’ie green 3TB, a teraz dzielnie służy jako Backup off-line i jak na razie nie ma żadnego błędu.
Także zależy jak się trafi.
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
R70
Uczeń Mistrza
Posty: 661
Rejestracja: pn gru 18, 2017 12:53 am

Re: Przypadek statystycznie niemożliwy

Post autor: R70 »

Test rozszerzony się zakończył i sugeruje że wszystkie dyski mają dobrą kondycję :/ To dość ciekawe, bo ewidentnie z DX517 dobiegały nieprzyjazne odgłosy. W każdym razie, bardziej prawdopodobne że jeden z dysków jest uszkodzony, natomiast pozostałe system wywalał z macierzy. Ciekawe dlaczego ?
Pozdrawiam,
Paweł
DS1819+, 32GB ECC, 10GbE, DX517 DS916+ 8GB, DX513, DS710+, DX213, DS119j, DS120j
RT2600ac + RT2200ac
ODPOWIEDZ