Wymiana wadliwego dysku podczas procesu weryfikacji dysków w tle...??

#1
Mam nadzieję, że w dobrym dziale - jeśli nie - proszę o przesunięcie...

Pytanie główne - czy możliwa jest wymiana wadliwego dysku na nowy podczas procesu weryfikacji dysków w tle (Parity Consistency Check - Data Scrubbing)??

Sytuacja jest o tyle nietypowa, że dysk chyba "żyje" (albo tylko elektronika) - Allocation status: Normal, ale Health status: Failing... Zazwyczaj albo pojawiały się bad sectory i następowała wymiana dysku albo dysk padał i wtedy diagnoza, jak i proces, były łatwe...
Tym razem trwa weryfikacja dysków, która ruszyła po wymuszonym zamknięciu (jak się później okazało (pkt. 3 i dalsze)). Sama weryfikacja zasadniczo nie za bardzo mi przeszkadza (bo i tak wykonuje się co miesiąc) ale w tym przypadku, po prawie tygodniu jest na poziomie 3,2% - przy wyłączeniu większości pakietów i usług...

Cała historia poniżej...

Na początek kilka suchych faktów - sprzęt - Synology DS-1511+ (SHR 5x4TB WD RED) + DX-510 (SHR 5x3TB WD RED).

1. Od jakiegoś czasu jeden z dysków w jednostce centralnej (ściślej nr 3, btw. numery 1 i 2 zostały rok temu wymienione na nowe) zaczął sypać błędami (bad sectors - ale nie działo się to często), co, niestety przez sytuację okołocovidową i co tu dużo mówić, moje lenistwo, zostało przeze mnie trochę zbagatelizowane... Do tego doszły w ostatnim czasie problemy z identyfikacją (idnf) i jakby wolniejsze działanie...
2. Koniec końców zapadła szybka decyzja o zakupie nowego dysku - nowy dysk został zamówiony u dostawcy i czekał na dostarczenie do nich a potem na wysyłkę do mnie...
3. W tzw. międzyczasie, kilka dni temu pojawiła się nowa aktualizacja DSM, którą (przyznaję) bez zastanowienia zaaplikowałem... System zaktualizował się prawidłowo, wykonał restart i zaczął wstawać...
4. Po 2 godzinach wstawania i świecenia się kontrolek dysków jedynie w DX-510 (w DS-1511+ żadna kontrolka się nie paliła, migał na niebiesko guzik włączania i oba LANy z tą samą częstością (to też dziwne)), braku kontaktu przez web, ssh, nawet ping nie odpowiadał - stwierdziłem, że mu "pomogę"...
5. "Pomoc" (wymuszenie zamknięcia) zakończyła się połowicznym sukcesem - co prawda po 15 minutach system wstał, ale od razu ruszył weryfikacji dysków na tej puli i woluminie oraz do sypania błędami na potęgę... A to kolejne bad sectory, idnf, ioerr, unc, aż w końcu do Read error at internal disk [3] sector jakiśtam itp. W końcu po kilkudziesięciu godzinach otrzymał Health status: Failing...
6. Jak na razie od tamtej chwili nie zmieniło się nic, tylko częstotliwość komunikatów błędów jakby zmalała (1 błąd na 8/10 godzin). Dostęp do urządzenia działa poprawnie przez ssh, web i smb, lecz prędkości oscylują w granicach 200K/s (choć były i przypadki 1700K/sec - może ze 2 razy :)) - co uniemożliwia (lub baaardzo utrudnia) przeniesienie danych na inne dyski wew/zew...

I teraz zastanawiam jakie jest właściwe postępowanie w tej sytuacji - czy wymieniać dysk i jak (hot/cold), co z weryfikacją (zatrzymać?? zbagatelizować??)? Moje poszukiwania rozwiązania nie bardzo naprowadziły mnie na właściwy trop a nie mam w tej materii zbyt dużego doświadczenia...

Poniżej i w załącznikach kilka screenów/informacji.

Kod: Zaznacz cały

root@DiskStation:~# cat /proc/mdstat
Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md5 : active raid5 sda7[6] sde7[4] sdd7[3] sdc7[2] sdb7[5]
      3906585344 blocks super 1.2 level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]
      [=====>...............]  resync = 25.6% (250969928/976646336) finish=52763.6min speed=229K/sec

md4 : active raid5 sdb6[6] sdc6[7] sdd6[8] sde6[9] sda6[5]
      3906971136 blocks super 1.2 level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]
        resync=DELAYED

md2 : active raid5 sda5[7] sde5[5] sdd5[9] sdc5[8] sdb5[6]
      7795118592 blocks super 1.2 level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]
        resync=DELAYED

md3 : active raid5 sdga5[6] sdge5[7] sdgd5[9] sdgc5[8] sdgb5[5]
      7795118592 blocks super 1.2 level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]

md6 : active raid5 sdgb6[0] sdge6[4] sdgd6[3] sdgc6[2] sdga6[1]
      3906585344 blocks super 1.2 level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]

md1 : active raid1 sda2[0] sdb2[1] sdc2[2] sdd2[3] sde2[4]
      2097088 blocks [5/5] [UUUUU]

md0 : active raid1 sda1[0] sdb1[1] sdc1[2] sdd1[3] sde1[4]
      2490176 blocks [5/5] [UUUUU]

unused devices: <none>

Volume.png


Storage Pool.png


HDD.png
Nie masz wymaganych uprawnień, aby zobaczyć pliki załączone do tego posta.

Kto jest online

Użytkownicy przeglądający to forum: Obecnie na forum nie ma żadnego zarejestrowanego użytkownika i 1 gość

cron