Serwer usunął wolumen - padły dwa dyski na raz?
-
- Trochę Wie
- Posty: 133
- Rejestracja: czw gru 21, 2017 10:31 pm
- Lokalizacja: Kielce
Serwer usunął wolumen - padły dwa dyski na raz?
Witam,
piszę gdyż potrzebuję Waszej pomocy.
Mam serwer DS218+ a w nim dwa WD red 3TB (jeden przepracowane niewiele ponad 20000, drugi trochę ponad 10000) w RAID1.
Uruchomiłem dzisiaj serwer ponownie, po restarcie zaniepokoiły mnie błędy w centrum pakietów - każdy pakiet figurował jako REPERUJ. Nagle zobaczyłem, że serwer wyświetla napis Brak wolumenu. Wcześniej DS nie informował mnie o jakichkolwiek błędach systemu.
Postanowiłem skontaktować się z supportem synology gdyż jest to dla mnie co najmniej dziwne, że w jednym momencie uszkodziły się dwa dyski o różnej ilości przepracowanych godzin, o innej serii (zakupione w dużym odstępie czasu). Czy to możliwe że awarię dysków spowodował synology?
Otrzymałem odpowiedź aby przeprowadzić, najlepiej trzy razy test pamięci discstation poprzez aplikację synology assistant. Zgodnie z zaleceniami dziś cały dzień wykonywałem test pamięci z wynikiem pozytywnym - za każdym razem serwer się uruchamiał, co miało wykluczyć uszkodzenie dsa.
Kolejnym krokiem, zgodnie z zaleceniami, miało być wykonanie dla każdego z dysków z osobna rozszerzonego testu SMART. Tu pojawia się problem. Po około minucie - dwóch od uruchomienia wyskoczył komunikat "dysk uległ awarii" oraz mail "Dysk 1 na DS218+ jest poważnie uszkodzony i uległ awarii. Natychmiast wykonaj kopię zapasową danych, a następnie wymień dysk.".
Niestety powyższe jest dla dysku 1 i 2. Nie mam jak wykonać kopii zapasowej, na szczęście posiadam jeszcze jeden serwer który na bieżąco kopiował w czasie rzeczywistym dane z głównego dsa (z ds218+), jednak jest to jednozatokowiec i także teraz boję się o awarię w nim dysku (w nim znajduje się dysk z tej samej serii co ten w 218).
Co zrobić dalej? Jak przywrócić do życia ds218?
PS. Serwer podpięty do upsa APC - wykluczam awarię zasilania.
W załączniku screen z błędów dysków, plik o kondycji dysku przed wykonaniem testu pamięci (dobra kondycja dysku), oraz plik po wykonaniu zalecanego testu pamięci i informacją o awariach dysków.
piszę gdyż potrzebuję Waszej pomocy.
Mam serwer DS218+ a w nim dwa WD red 3TB (jeden przepracowane niewiele ponad 20000, drugi trochę ponad 10000) w RAID1.
Uruchomiłem dzisiaj serwer ponownie, po restarcie zaniepokoiły mnie błędy w centrum pakietów - każdy pakiet figurował jako REPERUJ. Nagle zobaczyłem, że serwer wyświetla napis Brak wolumenu. Wcześniej DS nie informował mnie o jakichkolwiek błędach systemu.
Postanowiłem skontaktować się z supportem synology gdyż jest to dla mnie co najmniej dziwne, że w jednym momencie uszkodziły się dwa dyski o różnej ilości przepracowanych godzin, o innej serii (zakupione w dużym odstępie czasu). Czy to możliwe że awarię dysków spowodował synology?
Otrzymałem odpowiedź aby przeprowadzić, najlepiej trzy razy test pamięci discstation poprzez aplikację synology assistant. Zgodnie z zaleceniami dziś cały dzień wykonywałem test pamięci z wynikiem pozytywnym - za każdym razem serwer się uruchamiał, co miało wykluczyć uszkodzenie dsa.
Kolejnym krokiem, zgodnie z zaleceniami, miało być wykonanie dla każdego z dysków z osobna rozszerzonego testu SMART. Tu pojawia się problem. Po około minucie - dwóch od uruchomienia wyskoczył komunikat "dysk uległ awarii" oraz mail "Dysk 1 na DS218+ jest poważnie uszkodzony i uległ awarii. Natychmiast wykonaj kopię zapasową danych, a następnie wymień dysk.".
Niestety powyższe jest dla dysku 1 i 2. Nie mam jak wykonać kopii zapasowej, na szczęście posiadam jeszcze jeden serwer który na bieżąco kopiował w czasie rzeczywistym dane z głównego dsa (z ds218+), jednak jest to jednozatokowiec i także teraz boję się o awarię w nim dysku (w nim znajduje się dysk z tej samej serii co ten w 218).
Co zrobić dalej? Jak przywrócić do życia ds218?
PS. Serwer podpięty do upsa APC - wykluczam awarię zasilania.
W załączniku screen z błędów dysków, plik o kondycji dysku przed wykonaniem testu pamięci (dobra kondycja dysku), oraz plik po wykonaniu zalecanego testu pamięci i informacją o awariach dysków.
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.
-
- Godfather
- Posty: 1318
- Rejestracja: wt gru 15, 2015 12:19 pm
- Lokalizacja: Żyrardów
Re: Serwer usunął wolumen - padły dwa dyski na raz?
Pokaż SMART dysków.
Wysłane z mojego HTC One M8s przy użyciu Tapatalka
Wysłane z mojego HTC One M8s przy użyciu Tapatalka
Administratorzy dzielą się na tych, którzy robią kopie zapasowe i tych, którzy będą je robili.
Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+
"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676
Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+
"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676
-
- Trochę Wie
- Posty: 133
- Rejestracja: czw gru 21, 2017 10:31 pm
- Lokalizacja: Kielce
Re: Serwer usunął wolumen - padły dwa dyski na raz?
W załączniku wyniki rozszerzonego SMART na dzień 11.04.19 r. Dysk 1 i Dysk 2.
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.
-
- Godfather
- Posty: 1318
- Rejestracja: wt gru 15, 2015 12:19 pm
- Lokalizacja: Żyrardów
Re: Serwer usunął wolumen - padły dwa dyski na raz?
W oby dyskach parametr 01 winien mieć wartość zerową. Jedynie w seagate ta wartość jest bardzo duża.
Niestety ale z jakiegoś powodu ta wartość wrosła w obu mniej więcej równo. DSM przy skanowaniu powierzchni pewnie trafił na błędne dane dlatego też uznał je za felerne. SMART czasem nie pokazuje wszystkiego.
Gdzie synek stoi gdyż może ale nie musi mieć to znaczenie.
Niestety ale z jakiegoś powodu ta wartość wrosła w obu mniej więcej równo. DSM przy skanowaniu powierzchni pewnie trafił na błędne dane dlatego też uznał je za felerne. SMART czasem nie pokazuje wszystkiego.
Gdzie synek stoi gdyż może ale nie musi mieć to znaczenie.
Administratorzy dzielą się na tych, którzy robią kopie zapasowe i tych, którzy będą je robili.
Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+
"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676
Serwery NAS:
Synology DS211j, DS1511+, RS2212RP+ DS1513+
"Zasłanianie się dysleksją, to jak chwalenie się małym fiu...."- by Pati
gg 2101676
-
- Trochę Wie
- Posty: 133
- Rejestracja: czw gru 21, 2017 10:31 pm
- Lokalizacja: Kielce
Re: Serwer usunął wolumen - padły dwa dyski na raz?
Stoi w biurze.
Trudno mi uwierzyć że w ciągu dosłownie sekund dwa dyski padły. Dodatkowo jeden dysk był w miarę nowy, pochodził z .... wymiany gwarancyjnej gdyż sferis sprzedał mi dysk na który nie było gwarancji według oficjalnej strony WD. Teraz dopiero się zastanawiam, lecz z tej wymiany nie otrzymałem żadnego dokumentu i ciekawe jak będzie z następną gwarancją.
Trudno mi uwierzyć że w ciągu dosłownie sekund dwa dyski padły. Dodatkowo jeden dysk był w miarę nowy, pochodził z .... wymiany gwarancyjnej gdyż sferis sprzedał mi dysk na który nie było gwarancji według oficjalnej strony WD. Teraz dopiero się zastanawiam, lecz z tej wymiany nie otrzymałem żadnego dokumentu i ciekawe jak będzie z następną gwarancją.
-
- Zawsze On-Line
- Posty: 515
- Rejestracja: ndz sty 24, 2016 10:46 am
Re: Serwer usunął wolumen - padły dwa dyski na raz?
Według mnie są 2 przypadki w których DSM oznacza dyski jako uszkodzone (mówię tylko o bad sektorach). Pierwszy podczas pracy bieżącej natrafia na obszar sektora dysku, który się posypał. Drugi podczas pełnego testu SMART, gdzie sprawdzana jest cała powierzchnia HDD.
Czy tuż przed awarią serwer nie wykonywał harmonogramowego lub ręcznego rozszerzonego testu SMART ?
Wykluczasz działanie zewnętrzne ? czyli ktoś potrząsnął NAS’em.
P.S. Mnie jest trudno uwierzyć, że to NAS jest sprawcą fizycznego uszkodzenia kilku sektorów na 2 dyskach.
Czy tuż przed awarią serwer nie wykonywał harmonogramowego lub ręcznego rozszerzonego testu SMART ?
Wykluczasz działanie zewnętrzne ? czyli ktoś potrząsnął NAS’em.
P.S. Mnie jest trudno uwierzyć, że to NAS jest sprawcą fizycznego uszkodzenia kilku sektorów na 2 dyskach.
DS916+ /7.1-42661/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
DS112+ /6.2.4-25556/
RT2600ac /SRM 1.3-9193/
-
- Trochę Wie
- Posty: 133
- Rejestracja: czw gru 21, 2017 10:31 pm
- Lokalizacja: Kielce
Re: Serwer usunął wolumen - padły dwa dyski na raz?
Wykluczam potrząśnięcie lub upadek gdyż nas doczepiony był plastikową opaską.
Odnośnie testu rozszerzonego, ostatnio przeprowadzany był 1 kwietnia, a błędy zaczęły się pojawiać 25 kwietnia.
Odnośnie testu rozszerzonego, ostatnio przeprowadzany był 1 kwietnia, a błędy zaczęły się pojawiać 25 kwietnia.
-
- Trochę Wie
- Posty: 133
- Rejestracja: czw gru 21, 2017 10:31 pm
- Lokalizacja: Kielce
Re: Serwer usunął wolumen - padły dwa dyski na raz?
Pomoc techniczna prosi o dostęp do danych administratora. Czy to jest bezpieczne?
Jeżeli dyski padły a ja mam kopię zapasową to w czym oni mogą mi jeszcze pomóc?
Jeżeli dyski padły a ja mam kopię zapasową to w czym oni mogą mi jeszcze pomóc?
-
- Trochę Wie
- Posty: 133
- Rejestracja: czw gru 21, 2017 10:31 pm
- Lokalizacja: Kielce
Re: Serwer usunął wolumen - padły dwa dyski na raz?
Napisali informację że musi być oryginale konto administratora, nie nowe, użytkownika z prawami administratora.
Ciekawy jestem jak teraz WD podejdzie do wymiany dysku który był na gwarancji .... Który pierwotnie zakupiłem w 2016 roku, został wymieniony na nowy, i ponownie padł w 2019 r.
Ciekawy jestem jak teraz WD podejdzie do wymiany dysku który był na gwarancji .... Który pierwotnie zakupiłem w 2016 roku, został wymieniony na nowy, i ponownie padł w 2019 r.
-
- Uczeń Mistrza
- Posty: 661
- Rejestracja: pn gru 18, 2017 12:53 am
Re: Serwer usunął wolumen - padły dwa dyski na raz?
Kilka razy korzystałem z ich pomocy i na czas realizowania serwisu tworzyłem dodatkowe konto admina z ograniczeniem czasowym.
Być może mogą ustalić co mogło być powodem takiej sytuacji poza oczywiście nieszczęśliwym zbiegiem okoliczności ?
Pozdrawiam,
Paweł
DS1819+, 32GB ECC, 10GbE, DX517 DS916+ 8GB, DX513, DS710+, DX213, DS119j, DS120j
RT2600ac + RT2200ac
Paweł
DS1819+, 32GB ECC, 10GbE, DX517 DS916+ 8GB, DX513, DS710+, DX213, DS119j, DS120j
RT2600ac + RT2200ac