Pomoc TS-809U-RP - nie mogę zdiagnozować problemu

mhm

Passing Basics
Beginner
31 Grudzień 2009
17
0
1
www.skc.org.pl
QNAP
TS-410
Ethernet
1 GbE
Szanowni specjaliści od QNAPa - liczę na waszą pomoc. Nie wiem do którego działu wrzucić ten problem więc proszę administratora o ewentualne przeniesienie.

Pacjent:
QNAP TS-809U-RP
Firmware: 4.0.7
Dyski: pierwotnie 8x 1TB Seagate w RAID 6

Opis problemu:
We wtorek przed majówka straciłem (tzn. firma straciła) dostęp do zasobów na NASie. Okazało się, że sprzęt się samodzielnie zrestartował. Po restarcie rozpoczęła się procedura rebuildu macierzy. Dysk 3 w opisie nośników pokazał "Błąd zapisu/odczytu". Po odbudowaniu macierzy zapuściłem sprawdzanie dysku 3 - efekt to 30 bad blocków. Zanim zdążyłem wymienić dysk nastąpił kolejny samoczynny restart NASa. Tym razem po restarcie znowu zaczęło odbudowywać macierz, ale na liście dysków pokazało mi, że dysk 4 został wyrzucony z macierzy. Dysk 8 został wciągnięty na jego miejsce. Dysk 4 mogłem tylko ustawić jako globalny zapasowy. Po odbudowie macierzy w Zarządzaniu RAIDem musiałem dać "Przywróć wolumin". Zasoby pokazały się w sieci. Wymieniłem dysk 3 na nowy Seagate 3TB (nie mam innych dostępnych). Zaczęło się ponowne odtwarzanie macierzy. Poszedłem do domu na majówkę. Rano 1.05 chciałem się zdalnie dostać do NASa. Przy stanie ok 40-45% odtwarzania maszyna zawisła - brak dostępu przez WWW i SSH. Pingi do NASa chodzą, SSH woła o login i hasło, ale po haśle nic więcej się nie dzieje. Brak shella. Wczoraj rano przychodzę i widzę, że mam czerwoną diodę na Dysku 4. Restart maszyny. Uruchomiła się, macierz rebulding, Dysk 4 pokazuje "Błąd zapisu/odczytu". Status woluminu i dysku 4 - odmontowany. Brak możliwości "Przywróć". Dysk 4 wymieniłem na nowy 3TB. Po ok. 4h (stan rebuild macierzy ok 50%) maszyna się restartuje. Rebuild od nowa. Dzisiaj rano przychodzę i maszyna wisi - brak dostępu przez WWW i SSH. W między czasie kontaktowałem się z serwisem firmy która nam sprzedała tego QNAPa. Serwisant nie potrafił mi nic konkretnego poradzić. W ramach metodologi diagnostycznej poradził, abym wyciągnął wszystkie dyski i włączył samego NASa i obserwował czy się zawiesi/zrestartuje bez dysków. Od 2h maszyna chodzi bez dysków, ale niepokoi mnie to, że wystartowała na domyślnym firmware 3.4.2. Czy ja w ten sposób czegoś nie spaprałem ? Czy jeśli wsadzę na powrót wszystkie dyski to ruszy mi z moją konfiguracją ?

Na tych dyskach mam parę GB działowych które muszę odzyskać.

Liczę na Waszą pomoc i z góry dziękuje za zainteresowanie.
Czy jeśli wsadzę na powrót wszystkie dyski to ruszy mi z moją konfiguracją ?

Sam sobie odpowiem (może komuś się to info przyda): po wsadzeniu ponownym dysków NAS ruszył ze starą konfiguracją.

Po 3h wyłączyłem NASa z pracy bezdyskowej. Nic mi to prawda nie dało, ale szkoda mi czasu. Może na popołudnie i noc znowu go wyłączę. Wsadziłem Dysk 4 (stary 1TB) do PCeta z Windowsem, usunąłem wszystkie partycje, podmieniłem go za Dysk 3 (3TB usunąłem, zamontowałem 1TB). Po włączeniu w "Zarządzaniu woluminem" widzę status tego dysku jako GOTOWY. SMART na wszystkich dyskach pokazuje DOBRZE. Trwa odbudowa macierzy.Po 5h pracy i 10% do końca odtwarzania macierzy NAS raczył się zrestartować :( W ramach eksperymentu odpiąłem mu górny zasilacz. Zapiskał i się wyłączył. Podłączyłem górny zasilacz, odpiąłem dolny. Ruszył. Odtwarzanie macierzy wystartowało od nowa.

Czy to może być winowajca moich męczarni w ciągu ostatnich dni ?Niestety, po kolejnych 5h odtwarzania (pracował na 1 zasilaczu) nastąpił ponowny restart.

Zauważyłem powtarzalność restartów/zawieszeń się NASa co ok. 5h.

Nie ma ktoś pomysłu co mogę jeszcze sprawdzić ?
 
jak masz jeden wolny dysk to zainstaluj na nim system od nowa i zobacz czy coś się nie dzieje.

Ano mam. Spróbuję jutro, bo dzisiaj już nie mam dostępu fizycznego do maszyny.

Oczywiście masz kopie zapasową ?

To jest maszyna robiąca za magazyn backupowy danych z serwera domeny :( Niestety, część danych wydziałowych jest tylko na QNAPie, bo na serwerze domenowym zabrakło miejsca i musiałem zwolnić miejsce. Nowy serwer domenowy jest w trakcie zakupu (przetarg).
 
niedobrze - zadziałało prawo Murphiego, jak coś ma sie spieprzyć to spieprzy sie wtedy kiedy nie powinnoi nikt na to nie patrzy ...

oczywiście zdajesz sobie sprawe RAID is not a backup ?
Niestety, część danych wydziałowych jest tylko na QNAPie, bo na serwerze domenowym zabrakło miejsca i musiałem zwolnić miejsce.

No to trzeba kogoś zwolnić, gdzie capacity planning ? Takie sytuacje są ... karygodne .. zwłaszcza że wiesz jaką masz procedure zakupu :(
 
niedobrze - zadziałało prawo Murphiego, jak coś ma sie spieprzyć to spieprzy sie wtedy kiedy nie powinnoi nikt na to nie patrzy ...

Ano

oczywiście zdajesz sobie sprawe RAID is not a backup ?

Wiem, ale robiąc w budżetówce trzeba sobie radzić :(
No to trzeba kogoś zwolnić, gdzie capacity planning ? Takie sytuacje są ... karygodne .. zwłaszcza że wiesz jaką masz procedure zakupu :-(

Od 2 lat walczyłem o ten nowy serwer i w końcu w tym roku dostałem zgodę.
 
Tzn ?? Nie rozumiem co masz na myśli ?Możecie podpowiedzieć jakieś komendy aby sprawdzić jakoś lepiej stan dysków, struktury macierzy. Jakoś do softu do zarządzania NASem przez WWW nie do końca mam zaufanie.
 
Ano nic niepokojącego nie pokazało.

Kod:
/dev/md0:
  Version : 00.90.03
  Creation Time : Wed Apr 30 13:27:19 2014
  Raid Level : raid6
  Array Size : 4875968000 (4650.09 GiB 4992.99 GB)
  Used Dev Size : 975193600 (930.02 GiB 998.60 GB)
  Raid Devices : 7
  Total Devices : 7
Preferred Minor : 0
  Persistence : Superblock is persistent

  Update Time : Tue May  6 20:55:16 2014
  State : clean, degraded, recovering
Active Devices : 5
Working Devices : 7
Failed Devices : 0
  Spare Devices : 2

  Chunk Size : 64K

Rebuild Status : 42% complete

  UUID : 6aadc9c9:1b65d4e9:209c2070:0a8eabbb
  Events : 0.20511

  Number  Major  Minor  RaidDevice State
  0  8  3  0  active sync  /dev/sda3
  1  8  19  1  active sync  /dev/sdb3
  7  8  115  2  spare rebuilding  /dev/sdh3
  8  8  35  3  spare rebuilding  /dev/sdc3
  4  8  83  4  active sync  /dev/sdf3
  5  8  99  5  active sync  /dev/sdg3
  6  8  67  6  active sync  /dev/sde3
 
ano prosto - jeśli masz odpowiednio dużo miejsca na dysku wbudowanym w kompa to możesz zrobić kopię dysku bit-to-bit do pliku - jakiś plik IMG, a potem zapodać ten pliki jak dyski do programu i tak odzyskiwać dane.

RAID 6 widziałem 2 razy w życiu, jeden jak padł, drugi tylko konserwowałem ;)

pozostaje tylko czekać =D
 
No cóż. Nadal nie wiem co dolega QNAPowi. Właśnie zmontowałem PCeta i podłączyłem dyski z NAS. Nie za bardzo tylko mogę rozgryźć RStudio. Próbowałem z moich dysków zrobić wirtualny RAID, ale Rstudio mi nie pozwala. Wszystkie opcje raidowe ma na szaro. Na razie próbuje pojedyncze dyski analizować i odnaleźć moje najważniejsze dane. Poratuje ktoś linkiem how-to dla Rstudio ?Odwołuje narzekania :) Dało się zrobić virtual RAIDa. Znalazłem how-to. Analiza RAIDa w toku.Dalej jestem w lesie :( Analiza się wysypała po ok. 40h. Ustawiłem parametry RAIDa na czuja, bo nie wiem jakie powinny być. Efekt: tak samo jak NAS się restartował po ok. 80-85% rebildingu tak RStudio zawisło po przeszukaniu 80% RAIDa . Ki czort ? Nie ma ktoś sprawnej szklanej kuli ?
 
Eeee... RStudio się wysypało z innego powodu. Zabrakło mu pamięci.Tyle, że 3x już się z błędem pamięci sypnął. Zawsze w okolicy 80% procesu
upload_2014-5-9_19-37-23.png

A ustawiłem tak
upload_2014-5-9_19-47-51.png
 
R-Studio wiesza się mówisz... :s
Wspominałeś na początku, że NAS też się wieszał podczas próby odbudowy RAID, prawda?
Niestety, po kolejnych 5h odtwarzania (pracował na 1 zasilaczu) nastąpił ponowny restart.
Zauważyłem powtarzalność restartów/zawieszeń się NASa co ok. 5h.
Nie ma ktoś pomysłu co mogę jeszcze sprawdzić ?

Także zaprzestałbym prac z RAID'em, odłączył wszystkie dyski... I po kolei każdy z nich dokładnie przetestował programem producenta. Oczywiście bez usuwania danych - tylko odczyt.
 

Użytkownicy znaleźli tą stronę używając tych słów:

  1. odpiąłem dysk bład