Serwer usunął wolumen - padły dwa dyski na raz?

dawidb33
Trochę Wie
Posty: 92
Rejestracja: czw gru 21, 2017 10:31 pm
Lokalizacja: Kielce

Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: dawidb33 »

Witam,
piszę gdyż potrzebuję Waszej pomocy.
Mam serwer DS218+ a w nim dwa WD red 3TB (jeden przepracowane niewiele ponad 20000, drugi trochę ponad 10000) w RAID1.
Uruchomiłem dzisiaj serwer ponownie, po restarcie zaniepokoiły mnie błędy w centrum pakietów - każdy pakiet figurował jako REPERUJ. Nagle zobaczyłem, że serwer wyświetla napis Brak wolumenu. Wcześniej DS nie informował mnie o jakichkolwiek błędach systemu.

Postanowiłem skontaktować się z supportem synology gdyż jest to dla mnie co najmniej dziwne, że w jednym momencie uszkodziły się dwa dyski o różnej ilości przepracowanych godzin, o innej serii (zakupione w dużym odstępie czasu). Czy to możliwe że awarię dysków spowodował synology?

Otrzymałem odpowiedź aby przeprowadzić, najlepiej trzy razy test pamięci discstation poprzez aplikację synology assistant. Zgodnie z zaleceniami dziś cały dzień wykonywałem test pamięci z wynikiem pozytywnym - za każdym razem serwer się uruchamiał, co miało wykluczyć uszkodzenie dsa.
Kolejnym krokiem, zgodnie z zaleceniami, miało być wykonanie dla każdego z dysków z osobna rozszerzonego testu SMART. Tu pojawia się problem. Po około minucie - dwóch od uruchomienia wyskoczył komunikat "dysk uległ awarii" oraz mail "Dysk 1 na DS218+ jest poważnie uszkodzony i uległ awarii. Natychmiast wykonaj kopię zapasową danych, a następnie wymień dysk.".

Niestety powyższe jest dla dysku 1 i 2. Nie mam jak wykonać kopii zapasowej, na szczęście posiadam jeszcze jeden serwer który na bieżąco kopiował w czasie rzeczywistym dane z głównego dsa (z ds218+), jednak jest to jednozatokowiec i także teraz boję się o awarię w nim dysku (w nim znajduje się dysk z tej samej serii co ten w 218).

Co zrobić dalej? Jak przywrócić do życia ds218?

PS. Serwer podpięty do upsa APC - wykluczam awarię zasilania.

W załączniku screen z błędów dysków, plik o kondycji dysku przed wykonaniem testu pamięci (dobra kondycja dysku), oraz plik po wykonaniu zalecanego testu pamięci i informacją o awariach dysków.
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.
Przemuss
Wyrocznia
Posty: 1086
Rejestracja: wt gru 15, 2015 12:19 pm
Lokalizacja: Żyrardów

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: Przemuss »

Pokaż SMART dysków.

Wysłane z mojego HTC One M8s przy użyciu Tapatalka

Administratorzy dzielą się na tych, którzy robią kopie zapasowe i tych, którzy będą je robili.

Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+

"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676
dawidb33
Trochę Wie
Posty: 92
Rejestracja: czw gru 21, 2017 10:31 pm
Lokalizacja: Kielce

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: dawidb33 »

W załączniku wyniki rozszerzonego SMART na dzień 11.04.19 r. Dysk 1 i Dysk 2.
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.
Przemuss
Wyrocznia
Posty: 1086
Rejestracja: wt gru 15, 2015 12:19 pm
Lokalizacja: Żyrardów

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: Przemuss »

W oby dyskach parametr 01 winien mieć wartość zerową. Jedynie w seagate ta wartość jest bardzo duża.
Niestety ale z jakiegoś powodu ta wartość wrosła w obu mniej więcej równo. DSM przy skanowaniu powierzchni pewnie trafił na błędne dane dlatego też uznał je za felerne. SMART czasem nie pokazuje wszystkiego.
Gdzie synek stoi gdyż może ale nie musi mieć to znaczenie.
Administratorzy dzielą się na tych, którzy robią kopie zapasowe i tych, którzy będą je robili.

Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+

"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676
dawidb33
Trochę Wie
Posty: 92
Rejestracja: czw gru 21, 2017 10:31 pm
Lokalizacja: Kielce

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: dawidb33 »

Stoi w biurze.

Trudno mi uwierzyć że w ciągu dosłownie sekund dwa dyski padły. Dodatkowo jeden dysk był w miarę nowy, pochodził z .... wymiany gwarancyjnej gdyż sferis sprzedał mi dysk na który nie było gwarancji według oficjalnej strony WD. Teraz dopiero się zastanawiam, lecz z tej wymiany nie otrzymałem żadnego dokumentu i ciekawe jak będzie z następną gwarancją.
look12
Stały Bywalec
Posty: 314
Rejestracja: ndz sty 24, 2016 10:46 am

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: look12 »

Według mnie są 2 przypadki w których DSM oznacza dyski jako uszkodzone (mówię tylko o bad sektorach). Pierwszy podczas pracy bieżącej natrafia na obszar sektora dysku, który się posypał. Drugi podczas pełnego testu SMART, gdzie sprawdzana jest cała powierzchnia HDD.
Czy tuż przed awarią serwer nie wykonywał harmonogramowego lub ręcznego rozszerzonego testu SMART ?

Wykluczasz działanie zewnętrzne ? czyli ktoś potrząsnął NAS’em.

P.S. Mnie jest trudno uwierzyć, że to NAS jest sprawcą fizycznego uszkodzenia kilku sektorów na 2 dyskach.
DS916+ / 6.2.3-25426 /
DS112+ / 6.2.3-25426 /
RT1900ac / SRM 1.2.4-8081/
dawidb33
Trochę Wie
Posty: 92
Rejestracja: czw gru 21, 2017 10:31 pm
Lokalizacja: Kielce

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: dawidb33 »

Wykluczam potrząśnięcie lub upadek gdyż nas doczepiony był plastikową opaską.

Odnośnie testu rozszerzonego, ostatnio przeprowadzany był 1 kwietnia, a błędy zaczęły się pojawiać 25 kwietnia.
dawidb33
Trochę Wie
Posty: 92
Rejestracja: czw gru 21, 2017 10:31 pm
Lokalizacja: Kielce

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: dawidb33 »

Pomoc techniczna prosi o dostęp do danych administratora. Czy to jest bezpieczne?
Jeżeli dyski padły a ja mam kopię zapasową to w czym oni mogą mi jeszcze pomóc?
dawidb33
Trochę Wie
Posty: 92
Rejestracja: czw gru 21, 2017 10:31 pm
Lokalizacja: Kielce

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: dawidb33 »

Napisali informację że musi być oryginale konto administratora, nie nowe, użytkownika z prawami administratora.

Ciekawy jestem jak teraz WD podejdzie do wymiany dysku który był na gwarancji .... Który pierwotnie zakupiłem w 2016 roku, został wymieniony na nowy, i ponownie padł w 2019 r.
R70
Uczeń Mistrza
Posty: 654
Rejestracja: pn gru 18, 2017 12:53 am

Re: Serwer usunął wolumen - padły dwa dyski na raz?

Post autor: R70 »

dawidb33 pisze: czw maja 02, 2019 7:42 am Pomoc techniczna prosi o dostęp do danych administratora. Czy to jest bezpieczne?
Jeżeli dyski padły a ja mam kopię zapasową to w czym oni mogą mi jeszcze pomóc?
Kilka razy korzystałem z ich pomocy i na czas realizowania serwisu tworzyłem dodatkowe konto admina z ograniczeniem czasowym.
Być może mogą ustalić co mogło być powodem takiej sytuacji poza oczywiście nieszczęśliwym zbiegiem okoliczności ?
Pozdrawiam,
Paweł
DS1819+, 32GB ECC, 10GbE, DX517 DS916+ 8GB, DX513, DS710+, DX213, DS119j, DS120j
RT2600ac + RT2200ac
ODPOWIEDZ