Wiedza Jak skonfigurować lokalny RAG Qsirch (On-Prem)

Qsirch 6.0.0 (lub nowszy) na platformie QuTS hero



Lokalne wyszukiwanie RAG (On-Premise)​


Dla zaawansowanych użytkowników i przedsiębiorstw wymagających pełnej prywatności danych lub działania AI w trybie offline, Qsirch uruchamia RAG na lokalnie hostowanych modelach LLM. Wszystkie operacje są wykonywane na urządzeniu NAS lub podłączonym sprzęcie – żadne dane nie opuszczają środowiska użytkownika.



Sprzęt i konfiguracja​


Zalecenia sprzętowe

- NAS: TS-h1290FX (https://www.qnap.com/zh-tw/product/ts-h1290fx)

- Karty GPU: RTX 6000 Ada i RTX 4000 Ada

- QuTS hero 5.2.1 lub nowszy

- LLM Core jest zainstalowany i włączony

- Przejdź do Panel sterowania > Sprzęt > Zasoby sprzętowe > Użycie zasobów > Tryb Container Station

24470a5702fbe91400cf3aab1cf82e56.png




LLM Core (aplikacja) – modele obsługiwane przez lokalny RAG (On-Prem)​


LLM Core przenosi duże modele językowe bezpośrednio na urządzenie NAS, umożliwiając Qsirch prywatne i wydajne uruchamianie RAG bez korzystania z usług chmurowych. Dzięki wbudowanemu zarządzaniu modelami można pobierać modele lokalne, organizować je i przełączać się między nimi, a następnie używać ich w Qsirch do generowania odpowiedzi. Wszystko działa na sprzęcie użytkownika, zapewniając pełną kontrolę nad wydajnością i prywatnością.

Aktualnie obsługiwane modele lokalne (lista jest aktualizowana; sprawdź w aplikacji, aby zobaczyć najnowsze modele):

Nazwa wyświetlanaParametryKwantyzacjaRozmiar
DeepSeek R1 7B7,628BQ4_K_M4,70 GB
DeepSeek R1 14B14,8BQ4_K_M9,00 GB
Gemma3 12B12,2BQ4_K_M8,10 GB
DeepSeek R1 8B8,03BQ4_K_M4,90 GB
DeepSeek R1 32B32,8BQ4_K_M20,00 GB
Gemma3 1B1,0BQ4_K_M0,815 GB
Gemma3 4B4,38BQ4_K_M3,30 GB
Gemma3 27B27,4BQ4_K_M18,00 GB
gpt-oss 20B20,98BMXFP414,00 GB
Mistral 7B7,25BQ4_K_M4,10 GB
Microsoft Phi-4 14B14,7BQ4_K_M9,10 GB



Jak skonfigurować usługę lokalną (On-Premise) w Qsirch​


  1. Przejdź do Ustawienia > Ustawienia administratora > Wyszukiwanie RAG > Usługa lokalna (On-Premise).
    eda9ab34b16ef91402505acdfd9419f9.png
  2. Jeśli LLM Core nie jest zainstalowany/włączony, kliknij Włącz teraz, aby przejść do centrum aplikacji i zainstalować/włączyć LLM Core.
    d0cf61d1790f99113d12953be10f0e19.png


    002b3ffb099d308da6501570da91f1ab.png
  3. Jeśli karta GPU nie jest ustawiona w trybie Container Station, kliknij Włącz teraz, aby przejść do Panelu sterowania i ustawić kartę GPU w trybie Container Station.

c095aef0ca1bf5ceed7e0772171c08fa.png


24470a5702fbe91400cf3aab1cf82e56.png