Pomoc RAID5 odbudowa i dysk w statusie spare rebuilding przez długi czas

mKotek

Nowy użytkownik
Noobie
6 Styczeń 2016
1
2
3
49
QNAP
TS-x69L
Ethernet
1 GbE
Mam Qnapa TS-469L z 4 dyskami w macierzy od 2013 roku, firmware 4.2.
Ostantio SMART zasygnalizował problem z dyskiem nr 1, jako ostrzeżenie. Nabyłem dysk na wymianę i zamierzałem go wymienić. Niestety w wyniku zaćmienia, byłem przekonany, że mam jedynie 3 dyski i chciałem dołożyć kolejny, a dopiero potem wyjąć ten niedomagający.
Po odpięciu szuflady zorientowałem się w pomyłce i wpiąłem dysk z powrotem.
Niestety macierz zmieniła stan na degraded, ale po tem zaczął się proces recovery, który trwał ponad 8h.
Po zakońćzeniu recovery, dysk pokazuje sie jako spare rebuilding od prawie 24h, a macierz jest w trybie read only. Weryfikacja dysku, który doprowadził do sytuacji skończyła się wyświetleniem komunikatu o 4 bad blocks.

Wyniki poleceń dot. macierzy:
Kod:
[~] # mdadm -D /dev/md0
/dev/md0:
        Version : 0.90
  Creation Time : Sun Apr  7 12:31:21 2013
    Raid Level : raid5
    Array Size : 4390708800 (4187.31 GiB 4496.09 GB)
  Used Dev Size : 1463569600 (1395.77 GiB 1498.70 GB)
  Raid Devices : 4
  Total Devices : 4
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Fri Jan 29 18:26:12 2016
          State : clean, degraded
Active Devices : 3
Working Devices : 4
Failed Devices : 0
  Spare Devices : 1

        Layout : left-symmetric
    Chunk Size : 64K

          UUID : d42a8fbc:e1b75c3d:a0b86271:0dc40e0d
        Events : 0.53025

    Number  Major  Minor  RaidDevice State
      0      8        3        0      active sync  /dev/sda3
      1      8      19        1      active sync  /dev/sdb3
      2      8      35        2      active sync  /dev/sdc3
      4      8      51        3      spare rebuilding  /dev/sdd3

Kod:
[~] # cat /proc/mdstat
Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath]
md0 : active raid5 sdd3[4] sda3[0] sdc3[2] sdb3[1]
                4390708800 blocks level 5, 64k chunk, algorithm 2 [4/3] [UUU_]

md256 : active raid1 sdd2[3](S) sdc2[2](S) sdb2[1] sda2[0]
                530112 blocks super 1.0 [2/2] [UU]
                bitmap: 0/1 pages [0KB], 65536KB chunk

md13 : active raid1 sda4[0] sdb4[1] sdd4[3] sdc4[2]
                458880 blocks [4/4] [UUUU]
                bitmap: 0/57 pages [0KB], 4KB chunk

md9 : active raid1 sda1[0] sdb1[1] sdd1[3] sdc1[2]
                530048 blocks [4/4] [UUUU]
                bitmap: 0/65 pages [0KB], 4KB chunk

unused devices: <none>

Nie mogę wykonać żadnej operacji na macierzy, za każdym razem dostaję komunikat Device or resource busy.

1. Czy powinienem poczekać spokojnie na zakończenie odbudowy dysku SDD3? Czy 24h to nie jest zbyt dużo czasu na odbudowę?
2. Czy można jakoś przekonać się, czy odbudowa faktycznie trwa? W UI QNAP-a, macierz ma status Read only i nie można nic z nią zrobić.
3. Jak można przywrócić pełną sprawność QNAP-a i wymienić wadliwy dysk nr 1?
Operacja zakończyła się sukcesem. Niestety do rozwiązania problemu niezbędne okazało się zaangażowanie inżyniera wsparcia Qnapa, któremu bardzo dziękuję, choć pewnie tego forum nie czyta. Problem polegał na tym, że odbudowa się nie odbywała - dysk pozostawał jako spare, a macierz w trybie degraded.
Po zakończeniu działań Lukasa, możliwe było wyjęcie dysku nr 1 i jego wymiana na nowy dysk, pozbawiony błędów. Całość wymagała dużej cierpliwości (trwałą w sumie 2 tygodnie).