Pomoc TS-410 RAID10 is inactive / degraded

Status
Brak możliwości dodawania odpowiedzi.

Lisek Muldelek

Entry Technician
Q Associate
24 Marzec 2017
50
1
8
54
QNAP
TS-410
Ethernet
1 GbE
Witam,

Przeszukując wspaniałe forum pasjonatów NASów QNAP niestety nie natrafiłem na sytuację podobną do mojej, tj. TS-410 (choć może nie ma to znaczenia) + RAID10 inactive/degraded.

Pozwólcie, że opiszę historię choroby, gdyż wydawać się mogło, że wymiana dysku na nowy spowoduje odbudowanie macierzy i spokojny sen.
Niestety o 5ej nad ranem sen się skończył :)

Zrobiłem sobie kiedyś RAID10 aby nie mieć już problemów z dyskami.
Ustawiłem nawet powiadomienia mailowe gdyby coś się z dyskami działo.
Niestety coś mnie kiedyś podkusiło aby na GMailu dać filtr, który przenosił maile QNAPa do folderu, którego właściwie rzadko czytałem skoro wszystko działało jak ta lala :)
A teraz do rzeczy bazując na informacjach z powiadomień i logu samego QNAPa.

TS-410 ma 4 dyski po 2TB.
RAID 10 ustawiony był tak: 1-2 3-4 --> czyli łącznie miałem tylko 2TB wolnego miejsca (mając aż 4 dyski)

Mam też ustawione regularne testy dysków przy informacjach SMART.
We wrześniu 2016 dysk 3 miał ostrzeżenia ale wg QNAPa pracował prawidłowo.
Nie widziałem i nie czytałem tych maili... (moja wina, ale zajęty byłem sprawami życia)
Pod koniec lutego 2017 doszło do uszkodzenia dysku 4, gdzie wg powiadomień i logów był I/O error oraz Medium Error.
Stan macierzy był taki: RAID in degraded mode, RADID10 Dyski 1-2 3- (nie widać było dysku 4)
Zdecydowałem się kupić dwa nowe dyski i odebrałem je wczoraj.
Uradowany wymieniłem 4 dysk na nowy (taki sam jak 1-szy czyli Seagate SATA 2TB RPM 5900) i QNAP wypisuje "Brak dysku" :(
Kilkakrotnie wyjmowałem i ponownie wkładałem dysk (nawet odczekałem kilka sekund) - Brak dysku.
Zrobiłem reset NASa - pomogło i dysk był widoczny i automatycznie rozpoczęła się odbudowa macierzy.
Poczekałem chwilkę i ok. północy poszedłem spać na 4% odbudowy macierzy.
Niestety coś długo nie pospałem bo już nad ranem o 5ej z kawałkiem odbudowa macierzy została przerwana.
Dysk 3 i 4 - czerwone diody. Wg logów/powiadomień: dysk 3 (miał wcześniej ostrzeżenia) miał I/O Error i Medium Error, natomiast dysk 4 (nowy) "wypiął się" i była tylko informacja "Brak dysku"... aż mnie ciarki przeszły...
Wysunąłem więc dysk 4 i włożyłem jeszcze raz - Brak dysku. I tak kilkakrotnie - nadal Brak dysku.
Pomyśłałem sobie, że jak zrobie reset QNAPa to mi ten dysk zobaczy ale znowu macierz się nie odbuduje, gdyż dysk 3 ma Medium Error i bad blocki, więc wymieniłem dysk 3 na nowy (kupiłem dwa nowe) - Brak dysku. I tak kilkakrotnie wyjąłem i włożyłem hot-swap'owo dysk 3 -- Brak dysku.
Warto tu wspomnieć, że dysk 3 i dysk 4 - diody palą się na czerwono a oba dyski są nowe, natomiast a menedżerze pamięci - oba dyski 3 i 4 -- Brak dysku.
Stan macierzy -- RAID10 1-2 3- czyli jakby 1-2 miały macierz a do "drugiej części" brakowało dysku 4.
No więc restart... wszystkie diody palą się na zielono -- uf...
Gdy QNAP wystartował patrze do Menedżera pamięci i... macierz jest nieaktywna.
Pewnie dlatego że dla QNAPa zmieniła się konfiguracja sprzętu (dyski 3 i 4 teraz są nowe).
Nie chiałem nic kombinować z zakładaniem macierzy bo wiem, że mam dane i lepiej aby nadal były :)
Spiesząc się do pracy wpadłem na pomysł przywrócenia 3 dysku, więc włożyłem poprzedni dysk 3 (który ma ostrzeżenia i medium error, I/O error).
Samo nic się nie pojawiło, więc znowu resetnąłem QNAPa i wszystkie dyski były widoczne, tzn. 1-2 oryginalne nieruszane, 3 z ostrzeżeniami, 4 nowy, ale niestety RAID10 nadal nieaktywny.
Ale za to pojawiła się możliwość przeskanowania dysku 3 celem wyszukania bad blocków.
Włączyłem i tak zostawiłem na 3% skanowania badk blocków wychodząc do pracy...

I teraz pytania:
Co zrobiłem źle? :)
Czy dobrze myślę, że w RAID10 1-2 3-4 jest tak, że pojemność = 1+2 , natomiast backup = 3+4? Czy może w QNAP działa to inaczej dlatego z nowymi dyskami 3 i 4 macierz jest nieaktywna i nic sie samo nie odudowywało?
Czy można odbudowywać macierz RAID mając więcej niż jeden dysk felerny albo nowy czy to tylko można zrobić z jednym niedobrym dyskiem?
Co moge zrobić aby odzyskać dane i macierz?

Wersja oprogramowania Firmware: przedostatnia (dokładny numer podam później - teraz nie mam jak sprawdzić
Model serwera: QNAP TS-410
 
RADID10 Dyski 1-2 3- (nie widać było dysku 4)
uszk dysk 4. - wymienić - poczekać na odbudowe, jak opory to restart (łagodnie przez menu)
Restarty robione tylko łagodnie - przez menu.
Dyski 3 i 4 zostały wymienione (1 i 2 sa stare i dobre) - czy teraz można odbudować RAID10?
Jak popchnąc odbudowe skoro w tabelce z Raidem mam informacje "inactive" ?
Czy mam "utworzyć" RAID10 od nowa i dane (z dysków 1 i 2) nie zostaną utracone?

dysk 3 (miał wcześniej ostrzeżenia) miał I/O Error i Medium Error,
bezwględnie dysk do wymiany, awaria drugiego dysku w raid = problem , czemu ? ano przeczytaj RAID – Wikipedia, wolna encyklopedia
Znam tą stronkę jeszcze sprzed kilku lat, keidy zdecydowałem się na migracje: RAID1 --> RAID10.
Tylko potwierdź proszę moje rozumowanie: RaID10 z 4 dyskami działa tak: sumuje się pojemność 1 i 2 oraz 3 i 4. Dyski 1 i 2 (łącznie) są "mirrorowane" na 3 i 4 (łącznie). Tak rozumiem RAID10.
Czy da się odzyskać dane lub macierz? :)
 
składa się dwóch RAIDów 1(bezpieczeństwo) połączonych w RAID 0 (szybkosc)

upload_2017-3-24_10-55-48.png

Free RAID Calculator - Caclulate RAID Array Capacity and Fault Tolerance.

jeśli padł tylko jeden dysk to spoko, jeśli więcej to tylko rzeźba w R-Studio albo oddanie do firmy odzyskującej dane
 
Hmmm no to słabo :-(
Dysk 3 ma bad blocki, dysk 4 też ma bad blocki - czy nie da się zrobić tak, że:
1. przeskanujemy dyski 3 i 4 aby system oznaczył bad blocki (o ile dyski będą widzialne przez NASa)
2. odbudowa raida10 - o ile sie da
3. wymiana jednego z tych dysków na nowy + odbudowa raida
4. wymiana drugiego z tych dysków na nowy + odbudowa raida
Czy da się tak zrobić?
 
Skanowanie dysku 3 ukończone
Typ Data Czas Użytkownicy Źródło IP Nazwa komputera Zawartość
Ostrzeżenie 2017/03/24 14:10:50 System 127.0.0.1 localhost [Drive 3] Bad Blocks Scan completed. 1 bad block(s) found.

Włożyłem poprzedni dysk 4, po dłuższej chwili QNAP zobaczył dysk, który też ma ostrzeżenie.

Ale za to mogłem przeskanować RAIDa - wcześniej guziki nie były aktywne... to włączyłem (od dołu najstarsze):
Kod:
Typ	Data	Czas	Użytkownicy	Źródło IP	Nazwa komputera	Zawartość	
Informacja	2017/03/24	17:52:58	System	127.0.0.1	localhost	Host: Drive4 read error corrected.	
Informacja	2017/03/24	17:52:57	System	127.0.0.1	localhost	Host: Drive4 read error corrected.	
Informacja	2017/03/24	17:52:57	System	127.0.0.1	localhost	Host: Drive4 read error corrected.	
Informacja	2017/03/24	17:52:56	System	127.0.0.1	localhost	Host: Drive4 read error corrected.	
Informacja	2017/03/24	17:49:18	System	127.0.0.1	localhost	Host: Drive4 read error corrected.	
Informacja	2017/03/24	17:47:27	System	127.0.0.1	localhost	Host: Drive4 read error corrected.	
Ostrzeżenie	2017/03/24	17:47:23	System	127.0.0.1	localhost	[Harddisk 4] medium error. Please run bad block scan on this drive or replace the drive if the error persists.	
Informacja	2017/03/24	17:46:29	System	127.0.0.1	localhost	[RAID10 Disk Volume: Drive 1 2 3 4] Start examination.	
Informacja	2017/03/24	17:44:19	System	127.0.0.1	localhost	Drive 4 plugged in.	
Błąd	2017/03/24	17:42:42	System	127.0.0.1	localhost	[RAID10 Disk Volume: Drive 1 2 3 4] RAID device is inactive.	
Informacja	2017/03/24	17:42:40	System	127.0.0.1	localhost	[RAID10 Disk Volume: Drive 1 2 3 4] Drive 4 removed.

Kontynuując mój temat, nie mogłem odtworzyć macierzy, ale mam za to dwa dyski felerne - 3 i 4.
Pojawił się również problem widoczności NASa w Finderze.
Poszukałem na tym forum odpowiedzi na zagadnienie poszedłem wg wskazówek dot. konfiguracji bez dysków.
Delikatne wyunięcie spowodowało, że NAS zaczął działać ale z innym IP (to akurat nie problem).
Po ponownym włożeniu dyskow NAS zawieszał się (jaja jak berety, a zainwestowałem w 4 dyski i w RAID10).
Nadal nie mogę się dostać do panelu admina przez Web, natomiast wchodzę przez SSH i to jest sukces, bowiem na szczęście znam linuksy :)
W dodatku "wróciła" macierz --> /usr/share/MD0_DATA.
Na moim Ubuntu odpalam konsole i po SSH udało mi się podpiąć po sieci ethernet do NASa do widocznych folderów. Chodzi o standardowe QNAPowe foldery np. Multimedia, Public, itp. Do moich celów zawsze tworzyłem odrębny folder, m.in. dlatego, że jesli jakas konfiguracja jest resetowana to standardowe foldery moga byc "wyczyszczone". Różnie bywa, dlatego robię swoje foldery. Niestety mój folder po ethernecie nie był widoczny więc musiałem przenieść (poleceniem mv) dane do jednego z tych publicznych folderów.
Hurra, dostałem się do danych!
No nic... kopiowanie 3.5TB trwa. Dopiero kombinuje gdzie to zgram, bo z reguły wszystko trzymam w NASie.

Zastanawiam się teraz czy od razu przy okazji nie lepiej jest wymienić dyski z RPM 5900 na RPM 7200?
Wyższy RPM - tańsze dyski i większy wachlarz, ale czy pasują do NASa, gdzie dane mają byc głównie przechowywane?

Odnośnie firmy - Seagate jest droższy i dobry, ale tak do 2 lat, potem - tak jak u mnie - pojawiają sie bad blocki.

Czytałem, że dyski Hitachi 2TB z RPM 7200 są bardzo dobre w sensie bezawaryjności.
Jakie macie doświadczenia z Hitachi?
 
Niestety mój folder po ethernecie nie był widoczny więc musiałem przenieść (poleceniem mv) dane do jednego z tych publicznych folderów.
bo przecież SMB z QNAPa nie włączyło się :)

Zastanawiam się teraz czy od razu przy okazji nie lepiej jest wymienić dyski z RPM 5900 na RPM 7200?
Wyższy RPM - tańsze dyski i większy wachlarz, ale czy pasują do NASa, gdzie dane mają byc głównie przechowywane?
Więcej RPM = głośniej.
Dopóki dysk jest na liście zgodności , to czemu nie.

Czytałem, że dyski Hitachi 2TB z RPM 7200 są bardzo dobre w sensie bezawaryjności.
Zabawne, to samo czytałem o WD i Seagate.
 
Pierwszy mój większy dysk, który dawno temu "dupnął" był to dysk Samsung.
To były czasy, kiedy pokładałem nadzieje na ta firmę w kontekście jakości i bezawaryjności ich sprzętu.
Nic bardziej mylnego.
Pierwsze dane z 1.5GB dysku poszły się kochać, gdyż - jak sam serwis stwierdził - "poszła elektronika na tyle, że dane się skasowały".
Nie chce wnikać jak to było wiele lat temu, aczkolwiek po naprawie ten dysk smiga do dziś i jest bardzio cichutki.
Czekam aż ponownie dupnie, dlatego nie trzymam tam istotnych danych. Zaufanie już nie to samo. Podobnie z ichnimi TV i monitorami.

Samba śmiga - no jo... ale wiesz mogło być różnie, skoro macierz niby się wyświetla (config_default 1 czy jakoś tak pokazywał błędy z oryginalnym 4 dyskiem z errorami). Po SSH dostep do MD0_DATA jest, wszystkie katalogi i pliki też, więc domniemam, że to sa dyski 1-2 z całej macierzy, gdyż 4 dysk musiałem wysunąć, bo NAS nie chciał startować :)

Co do samych dysków to chyba zostane przy RPM 5900, już się przyzwyczaiłem, ponadto mam dwa nowiutkie Seagate'y, więc po co marnować czas.
nie wiem czy TS-410 łyknie dyski większe niż 2TB, w teorii wg. supoort listy można wcisknać max 2TB, ale ciekawi mnie jak to jest w praktyce.


Kontynuując wątek....

Niestety mój folder po ethernecie nie był widoczny więc musiałem przenieść (poleceniem mv) dane do jednego z tych publicznych folderów.
bo przecież SMB z QNAPa nie włączyło się :)
SMB było włączone, natomiast mój folder był ukryty a po zastosowaniu w powłoce SSH QNAPa poleceń do przywrócenia konfiguracji - wg. tutoriali znalezionych gdzieś na forum, np. tutaj: How-To - System nie startuje i Finder nie wykrywa serwera
tego folderu nie było w otoczeniu sieciowym, nawet mapując na Ubuntu standardowym hasłem admina QNAPa..
Ważne, że miałem dostęp do /share/MD0_DATA, w którym obok mojego ukrytego folderu był folder Public (standardowy QNAPa).

Cały tydzień kopiowałem dane ale przynajmniej mam wszystko.
:)
Z myślą o nowej konfiguracji dysków (2 nowe + 2 dobre stare) zamontowałem nowe dyski oczywiście do RAID10: 1-2 3-4, gdzie 1-2 dyski nowe, 3-4 dyski stare.
Zostałem jednak przy RPM 5900, chociażby dlatego, że dyski maiłem już kupione.
Qfinder znalazł QNAPa bezproblemowo, inicjacja dysków przebiegła szybko i sprawnie.
Konfiguracja wszystkiego jak sprzed awarii trwała 10-15 minut, przy okazji poleciała instalacja najnowszego firmware.
Synchronizacja na macierzy RAID10 trwała dobre kolejne 3 dni.
Teraz wrzucam dane z powrotem, przy czym patrzę dokładniej czy na pewno wszystko jest potrzebne
:)
Najnowszy firmware nie ma już Twonky Media, lecz jest rozbudowany Sewer mediów DLNA, który po dłuższej konfiguracji działa w subie lepiej od Twonky'iego, który teraz jest licencjonowany.

Najważniejsze, że odzyskałem dane. Uff...

Dzięki za pomoc i pozdrawiam. Temat do zamknięcia.
 
Status
Brak możliwości dodawania odpowiedzi.

Użytkownicy znaleźli tą stronę używając tych słów:

  1. czerwone led hdd wszystkie
  2. przeskanować dysk
  3. raid device is inactive
  4. inactive
  5. raid10