Serwer usunął wolumen - padły dwa dyski na raz?

#1
Witam,
piszę gdyż potrzebuję Waszej pomocy.
Mam serwer DS218+ a w nim dwa WD red 3TB (jeden przepracowane niewiele ponad 20000, drugi trochę ponad 10000) w RAID1.
Uruchomiłem dzisiaj serwer ponownie, po restarcie zaniepokoiły mnie błędy w centrum pakietów - każdy pakiet figurował jako REPERUJ. Nagle zobaczyłem, że serwer wyświetla napis Brak wolumenu. Wcześniej DS nie informował mnie o jakichkolwiek błędach systemu.

Postanowiłem skontaktować się z supportem synology gdyż jest to dla mnie co najmniej dziwne, że w jednym momencie uszkodziły się dwa dyski o różnej ilości przepracowanych godzin, o innej serii (zakupione w dużym odstępie czasu). Czy to możliwe że awarię dysków spowodował synology?

Otrzymałem odpowiedź aby przeprowadzić, najlepiej trzy razy test pamięci discstation poprzez aplikację synology assistant. Zgodnie z zaleceniami dziś cały dzień wykonywałem test pamięci z wynikiem pozytywnym - za każdym razem serwer się uruchamiał, co miało wykluczyć uszkodzenie dsa.
Kolejnym krokiem, zgodnie z zaleceniami, miało być wykonanie dla każdego z dysków z osobna rozszerzonego testu SMART. Tu pojawia się problem. Po około minucie - dwóch od uruchomienia wyskoczył komunikat "dysk uległ awarii" oraz mail "Dysk 1 na DS218+ jest poważnie uszkodzony i uległ awarii. Natychmiast wykonaj kopię zapasową danych, a następnie wymień dysk.".

Niestety powyższe jest dla dysku 1 i 2. Nie mam jak wykonać kopii zapasowej, na szczęście posiadam jeszcze jeden serwer który na bieżąco kopiował w czasie rzeczywistym dane z głównego dsa (z ds218+), jednak jest to jednozatokowiec i także teraz boję się o awarię w nim dysku (w nim znajduje się dysk z tej samej serii co ten w 218).

Co zrobić dalej? Jak przywrócić do życia ds218?

PS. Serwer podpięty do upsa APC - wykluczam awarię zasilania.

W załączniku screen z błędów dysków, plik o kondycji dysku przed wykonaniem testu pamięci (dobra kondycja dysku), oraz plik po wykonaniu zalecanego testu pamięci i informacją o awariach dysków.
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

#4
W oby dyskach parametr 01 winien mieć wartość zerową. Jedynie w seagate ta wartość jest bardzo duża.
Niestety ale z jakiegoś powodu ta wartość wrosła w obu mniej więcej równo. DSM przy skanowaniu powierzchni pewnie trafił na błędne dane dlatego też uznał je za felerne. SMART czasem nie pokazuje wszystkiego.
Gdzie synek stoi gdyż może ale nie musi mieć to znaczenie.
Administratorzy dzielą się na tych, którzy robią kopie zapasowe i tych, którzy będą je robili.

Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+

"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676

Re: Serwer usunął wolumen - padły dwa dyski na raz?

#5
Stoi w biurze.

Trudno mi uwierzyć że w ciągu dosłownie sekund dwa dyski padły. Dodatkowo jeden dysk był w miarę nowy, pochodził z .... wymiany gwarancyjnej gdyż sferis sprzedał mi dysk na który nie było gwarancji według oficjalnej strony WD. Teraz dopiero się zastanawiam, lecz z tej wymiany nie otrzymałem żadnego dokumentu i ciekawe jak będzie z następną gwarancją.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

#6
Według mnie są 2 przypadki w których DSM oznacza dyski jako uszkodzone (mówię tylko o bad sektorach). Pierwszy podczas pracy bieżącej natrafia na obszar sektora dysku, który się posypał. Drugi podczas pełnego testu SMART, gdzie sprawdzana jest cała powierzchnia HDD.
Czy tuż przed awarią serwer nie wykonywał harmonogramowego lub ręcznego rozszerzonego testu SMART ?

Wykluczasz działanie zewnętrzne ? czyli ktoś potrząsnął NAS’em.

P.S. Mnie jest trudno uwierzyć, że to NAS jest sprawcą fizycznego uszkodzenia kilku sektorów na 2 dyskach.
DS916+ / 6.2.1-23824 /
DS112+ / 6.2.1-23824 /
RT1900ac / SRM 1.2.1-7779 /

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 1 gość

cron