Instrukcja obsługi Jak używać OCR Converter do rozpoznawania i wyodrębniania tekstu z obrazów?

  • Informacje o OCR Converter
  • Wymagania systemowe i kompatybilność
  • Instalacja
  • Tworzenie zadania OCR
    • Zadanie jednorazowe
    • Zadanie zaplanowane
  • Inne ustawienia i operacje
  • Poprawa wyników konwersji

Informacje o OCR Converter​


OCR Converter rozpoznaje teksty na obrazach i konwertuje je na edytowalne dokumenty przy użyciu technologii OCR (Optical Character Recognition). Można określić formaty plików tekstowych oraz języki tekstów na obrazach źródłowych. Można również tworzyć harmonogramy w celu wykonywania zadań konwersji w określonych godzinach, aby zwiększyć wydajność konwersji.

Wymagania systemowe i kompatybilność​


Aby korzystać z OCR Converter, urządzenie NAS musi działać pod kontrolą systemu QTS 4.3.4 (lub nowszej wersji) i mieć co najmniej 2 GB pamięci. OCR Converter obsługuje modele oparte zarówno na architekturze x86, jak i ARM, z wyjątkiem serii TAS. Do uruchomienia OCR Converter wymagany jest Text Editor.

OCR Converter obsługuje obecnie rozpoznawanie tekstów napisanych w języku angielskim, chińskim tradycyjnym, chińskim uproszczonym i niemieckim. W przyszłych wydaniach dodamy obsługę kolejnych języków.

Instalacja​


Aby zainstalować i włączyć OCR Converter, zaloguj się do systemu QTS, a następnie przejdź do App Center. Należy pamiętać, że QTS automatycznie pobiera i instaluje Text Editor podczas instalacji OCR Converter.

Tworzenie zadania OCR​


Aby utworzyć zadanie OCR, kliknij „Utwórz zadanie OCR” w prawym górnym rogu, a następnie wybierz typ zadania.

ocr-converter_01.png


Zadanie jednorazowe​


Można tworzyć zadania OCR, które są wykonywane tylko jeden raz.

  1. Wybierz „Jednorazowe”.
  2. Określ nazwę zadania.
  3. Kliknij foldery w strukturze drzewa, aby wyświetlić foldery i wybrać pliki. Można dwukrotnie kliknąć foldery, aby wyświetlić ich podfoldery.

    ocr-converter_02.png
  4. Skonfiguruj ustawienia konwersji.
    Można ręcznie skonfigurować ustawienia lub kliknąć „Zastosuj ustawienia domyślne”, aby zastosować ustawienia domyślne do wszystkich plików na liście konwersji.

    ocr-converter_03.png

    1. Języki OCR: Wybierz maksymalnie trzy języki występujące na obrazach źródłowych i uszereguj je według ich udziału w obrazach.
      Uwaga: Ta kolejność wpływa na wynik konwersji. Można przeciągać języki, aby dostosować kolejność.

      ocr-converter_04.png
    2. Format wyjściowy: Jako format wyjściowy można wybrać TXT lub PDF. Konwertowany plik tekstowy można dalej edytować za pomocą „Text Editor”.
    3. Kierunek tekstu: Określ kierunek tekstu na obrazach źródłowych, aby poprawić wydajność rozpoznawania tekstu.
    4. Foldery pobierania: Konwertowane pliki będą zapisywane w tej samej ścieżce co pliki źródłowe. Pozwala to uniknąć wielokrotnej konwersji tych samych obrazów.
  5. Sprawdź ustawienia zadania, a następnie kliknij „Zastosuj”.
    Status zadań można wyświetlić na stronie głównej.

    ocr-converter_05.png

Zadanie zaplanowane​


Można konwertować pliki obrazów w określonych godzinach przy użyciu tych samych ustawień (takich jak języki i kierunek tekstu). Zalecamy umieszczanie obrazów z tymi samymi językami w tych samych folderach.

ocr-converter_06.png


  1. Wybierz „Harmonogram”.
  2. Określ szczegóły harmonogramu.
  3. Określ ścieżkę folderów źródłowych.
    Uwaga: Konwertowane pliki będą zapisywane w tej samej ścieżce co pliki źródłowe.
  4. Wybierz języki tekstu.
  5. Wybierz format wyjściowy i kierunek tekstu.
  6. Sprawdź ustawienia, a następnie kliknij „Zastosuj”.

Zadania OCR będą automatycznie tworzone w określonych godzinach.

ocr-converter_07.png


Inne ustawienia i operacje​


OCR Converter umożliwia również konfigurowanie innych ustawień i wykonywanie różnych czynności:

  • Można wybierać wiele plików, pobierać pliki i usuwać pliki ze strony głównej. Można również sortować zadania według czasu utworzenia, czasu zakończenia, nazwy lub statusu.

    ocr-converter_08.png
  • Można wybrać pobieranie tylko konwertowanych plików lub zarówno plików źródłowych, jak i konwertowanych.

    ocr-converter_09.png
  • Można usuwać ukończone zadania ze strony głównej. Usunięcie ukończonych zadań nie powoduje usunięcia rzeczywistych plików. Po zakończeniu zadań można nadal wyświetlać pliki i uzyskiwać do nich dostęp w File Station.
  • Aby zarządzać zaplanowanymi zadaniami, kliknij
    ocr-converter_10.png

    w prawym górnym rogu, a następnie wybierz „Harmonogram”.

    ocr-converter_11.png
  • Aby wyświetlić pliki w zadaniu konwersji, kliknij tytuł zadania.

    ocr-converter_12.png
  • Można wyświetlać status zadań OCR. Można również kliknąć plik, aby wyświetlić podgląd jego pliku źródłowego i konwertowanego.

    ocr-converter_13.png
  • Można wyświetlać podgląd konwertowanych dokumentów i porównywać je z obrazami źródłowymi. Aby edytować plik tekstowy, kliknij „Otwórz w Text Editor”.

    ocr-converter_14.png

Poprawa wyników konwersji​


OCR Converter jest oparty na silniku open-source Tesseract. Poziom rozpoznawania zależy od jakości obrazów i ustawień konwersji. Zalecamy wybieranie obrazów o rozdzielczości co najmniej 300 dpi i wyraźnym tle. Obrazy źródłowe powinny zawierać niewiele odręcznie napisanych słów lub nie zawierać ich wcale. Aby konwertować obrazy efektywnie, należy wybrać wszystkie języki występujące na obrazach źródłowych i uszeregować je według ich udziału.