Strona 1 z 5

Serwer usunął wolumen - padły dwa dyski na raz?

: pn kwie 29, 2019 7:22 pm
autor: dawidb33
Witam,
piszę gdyż potrzebuję Waszej pomocy.
Mam serwer DS218+ a w nim dwa WD red 3TB (jeden przepracowane niewiele ponad 20000, drugi trochę ponad 10000) w RAID1.
Uruchomiłem dzisiaj serwer ponownie, po restarcie zaniepokoiły mnie błędy w centrum pakietów - każdy pakiet figurował jako REPERUJ. Nagle zobaczyłem, że serwer wyświetla napis Brak wolumenu. Wcześniej DS nie informował mnie o jakichkolwiek błędach systemu.

Postanowiłem skontaktować się z supportem synology gdyż jest to dla mnie co najmniej dziwne, że w jednym momencie uszkodziły się dwa dyski o różnej ilości przepracowanych godzin, o innej serii (zakupione w dużym odstępie czasu). Czy to możliwe że awarię dysków spowodował synology?

Otrzymałem odpowiedź aby przeprowadzić, najlepiej trzy razy test pamięci discstation poprzez aplikację synology assistant. Zgodnie z zaleceniami dziś cały dzień wykonywałem test pamięci z wynikiem pozytywnym - za każdym razem serwer się uruchamiał, co miało wykluczyć uszkodzenie dsa.
Kolejnym krokiem, zgodnie z zaleceniami, miało być wykonanie dla każdego z dysków z osobna rozszerzonego testu SMART. Tu pojawia się problem. Po około minucie - dwóch od uruchomienia wyskoczył komunikat "dysk uległ awarii" oraz mail "Dysk 1 na DS218+ jest poważnie uszkodzony i uległ awarii. Natychmiast wykonaj kopię zapasową danych, a następnie wymień dysk.".

Niestety powyższe jest dla dysku 1 i 2. Nie mam jak wykonać kopii zapasowej, na szczęście posiadam jeszcze jeden serwer który na bieżąco kopiował w czasie rzeczywistym dane z głównego dsa (z ds218+), jednak jest to jednozatokowiec i także teraz boję się o awarię w nim dysku (w nim znajduje się dysk z tej samej serii co ten w 218).

Co zrobić dalej? Jak przywrócić do życia ds218?

PS. Serwer podpięty do upsa APC - wykluczam awarię zasilania.

W załączniku screen z błędów dysków, plik o kondycji dysku przed wykonaniem testu pamięci (dobra kondycja dysku), oraz plik po wykonaniu zalecanego testu pamięci i informacją o awariach dysków.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

: pn kwie 29, 2019 10:19 pm
autor: Przemuss
Pokaż SMART dysków.

Wysłane z mojego HTC One M8s przy użyciu Tapatalka


Re: Serwer usunął wolumen - padły dwa dyski na raz?

: wt kwie 30, 2019 7:45 am
autor: dawidb33
W załączniku wyniki rozszerzonego SMART na dzień 11.04.19 r. Dysk 1 i Dysk 2.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

: wt kwie 30, 2019 8:16 am
autor: Przemuss
W oby dyskach parametr 01 winien mieć wartość zerową. Jedynie w seagate ta wartość jest bardzo duża.
Niestety ale z jakiegoś powodu ta wartość wrosła w obu mniej więcej równo. DSM przy skanowaniu powierzchni pewnie trafił na błędne dane dlatego też uznał je za felerne. SMART czasem nie pokazuje wszystkiego.
Gdzie synek stoi gdyż może ale nie musi mieć to znaczenie.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

: wt kwie 30, 2019 8:26 am
autor: dawidb33
Stoi w biurze.

Trudno mi uwierzyć że w ciągu dosłownie sekund dwa dyski padły. Dodatkowo jeden dysk był w miarę nowy, pochodził z .... wymiany gwarancyjnej gdyż sferis sprzedał mi dysk na który nie było gwarancji według oficjalnej strony WD. Teraz dopiero się zastanawiam, lecz z tej wymiany nie otrzymałem żadnego dokumentu i ciekawe jak będzie z następną gwarancją.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

: wt kwie 30, 2019 6:26 pm
autor: look12
Według mnie są 2 przypadki w których DSM oznacza dyski jako uszkodzone (mówię tylko o bad sektorach). Pierwszy podczas pracy bieżącej natrafia na obszar sektora dysku, który się posypał. Drugi podczas pełnego testu SMART, gdzie sprawdzana jest cała powierzchnia HDD.
Czy tuż przed awarią serwer nie wykonywał harmonogramowego lub ręcznego rozszerzonego testu SMART ?

Wykluczasz działanie zewnętrzne ? czyli ktoś potrząsnął NAS’em.

P.S. Mnie jest trudno uwierzyć, że to NAS jest sprawcą fizycznego uszkodzenia kilku sektorów na 2 dyskach.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

: śr maja 01, 2019 9:25 am
autor: dawidb33
Wykluczam potrząśnięcie lub upadek gdyż nas doczepiony był plastikową opaską.

Odnośnie testu rozszerzonego, ostatnio przeprowadzany był 1 kwietnia, a błędy zaczęły się pojawiać 25 kwietnia.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

: czw maja 02, 2019 7:42 am
autor: dawidb33
Pomoc techniczna prosi o dostęp do danych administratora. Czy to jest bezpieczne?
Jeżeli dyski padły a ja mam kopię zapasową to w czym oni mogą mi jeszcze pomóc?

Re: Serwer usunął wolumen - padły dwa dyski na raz?

: czw maja 02, 2019 8:29 am
autor: dawidb33
Napisali informację że musi być oryginale konto administratora, nie nowe, użytkownika z prawami administratora.

Ciekawy jestem jak teraz WD podejdzie do wymiany dysku który był na gwarancji .... Który pierwotnie zakupiłem w 2016 roku, został wymieniony na nowy, i ponownie padł w 2019 r.

Re: Serwer usunął wolumen - padły dwa dyski na raz?

: pt maja 03, 2019 8:29 am
autor: R70
dawidb33 pisze: czw maja 02, 2019 7:42 am Pomoc techniczna prosi o dostęp do danych administratora. Czy to jest bezpieczne?
Jeżeli dyski padły a ja mam kopię zapasową to w czym oni mogą mi jeszcze pomóc?
Kilka razy korzystałem z ich pomocy i na czas realizowania serwisu tworzyłem dodatkowe konto admina z ograniczeniem czasowym.
Być może mogą ustalić co mogło być powodem takiej sytuacji poza oczywiście nieszczęśliwym zbiegiem okoliczności ?