Słownik
Aby ułatwić korzystanie z tej dokumentacji, utworzono słowniczek. Znajdziesz tu definicje kluczowych terminów, które możesz napotkać podczas korzystania z ONESTEP AI.
Adres IP
Numeryczny identyfikator przypisany do: interfejsu sieciowego, grupy interfejsów (broadcast, multicast) lub całej sieci komputerowej w protokole IP. Identyfikuje elementy sieci wewnątrz i na zewnątrz sieci lokalnej (tzw. adres publiczny).
Adnotacja
Adnotacja obrazu przechowuje informacje o oznaczeniach opisujących przedstawione obiekty oraz wszelkie dodatkowe informacje, w zależności od wybranego standardu.
AI’GORITHM
AI’GORITHM to aplikacja do tworzenia algorytmów, która umożliwia praktyczne wykorzystanie modeli ONESTEP wyszkolonych w zakresie sztucznej inteligencji w szerokim zakresie scenariuszy. Celem jest umożliwienie użytkownikom niezależnego opracowywania własnych aplikacji końcowych, które mogą następnie wdrażać na własnych lub wypożyczonych urządzeniach, tworząc unikalne środowisko AI.
AI’SPECTOR
AI’SPECTOR to system przeznaczony dla doświadczonych użytkowników, stanowiący alternatywę dla AI’VIEWER. Działa w sposób ciągły, uruchamiając algorytmy w nieskończoność, aż do ręcznego zatrzymania, zapewniając nieprzerwane przetwarzanie i monitorowanie. Dodatkowo może działać zgodnie z harmonogramem ustalonym przez użytkownika, który może skonfigurować różne przedziały czasowe dla każdego dnia tygodnia. System ten pozwala na wykonywanie algorytmów stworzonych w AI’GORITHM, umożliwiając użytkownikom parametryzację tych algorytmów poprzez wybór określonych danych wejściowych, takich jak podłączone kamery lub przesłane filmy.
AI’VIEWER
Aplikacja instalowana na urządzeniu brzegowym w celu uruchomienia wytrenowanego i odpowiednio zoptymalizowanego modelu sieci neuronowej. Model może być używany na obrazie z kamery podłączonej do urządzenia i przesyłającej strumieniowo wideo w czasie rzeczywistym lub na pliku foto/wideo.
DNN (głęboka sieć neuronowa)
Głęboka sieć neuronowa (DNN, Deep Neural Network) to sztuczna sieć neuronowa z wieloma warstwami pomiędzy warstwą wejściową a warstwą wyjściową. Istnieją różne rodzaje sieci neuronowych, ale zawsze składają się z tych samych elementów: neuronów, synaps, wag, wartości przesunięcia oraz funkcji. Te komponenty działają w sposób podobny do ludzkiego mózgu i mogą być trenowane jak każdy inny algorytm uczenia maszynowego.
Detekcja
Rozpoznanie, tj. informacja zwrócona przez model sieci neuronowej, że obiekt danej kategorii został wykryty w danym obszarze obrazu.
Zobacz także: Kategoria
Dokładność
Miara skuteczności rozpoznawania modelu sieci neuronowej. Zazwyczaj reprezentuje procent poprawnych rozpoznań w stosunku do wszystkich, obliczonych na danym zestawie danych innym niż zestaw treningowy.
Dokładność walidacji
Dokładność obliczona na podzbiorze walidacyjnym.
Epoka
Jedna iteracja uczenia modelu sieci neuronowej, wykonywana na całym zbiorze danych (tj. jednokrotne przejście przez wszystkie obrazy).
Zobacz także: Iteracja
Epoki rozgrzewkowe
Początkowe iteracje treningu; „rozgrzewka”, podczas której szybkość uczenia zmienia się dynamicznie.
Pierwsze n partii (iteracji) zwiększy szybkość uczenia się zgodnie ze wzorem: $current\_learning\_rate = learning\_rate ⋅ \left({\frac{iterations}{n}}\right)^{power}$, gdzie domyślnie power = 4. Ten parametr nie może być większy niż maksymalna ilość partii danych.
Etykieta
Etykieta oznaczająca obiekt i zawierająca informacje o jego lokalizacji i nazwie (kategorii/klasie).
Ekspozycja
W procesie rozszerzania danych:
Losowa zmiana ekspozycji (jasności) podczas treningu.
Zobacz także: Rozszerzanie danych
Format wyjściowy
Jednym z ustawień Manipulatora jest format wyjściowy zdjęć - JPG lub PNG. Jeśli wybierzesz JPG, pamiętaj, że nowo wygenerowane zdjęcia stracą warstwę alfa odpowiedzialną za przezroczystość.
Zobacz także: Manipulacja
Funkcja metryczna
Przejdź do: Metryka
Funkcja straty
Funkcja straty to funkcja, która oblicza odległość między bieżącym wynikiem algorytmu a oczekiwanym wynikiem. Jest to metoda oceny sposobu, w jaki algorytm modeluje dane. Można je podzielić na dwie grupy. Jedna dla klasyfikacji (wartości dyskretne, 0,1,2…), a druga dla regresji (wartości ciągłe) - Źródło
Framework
Zestaw gotowych narzędzi z gotowymi modelami i środowiskiem programistycznym, dostępny dla programistów w celu ułatwienia i standaryzacji ich pracy nad rozwiązaniami sztucznej inteligencji.
Iteracja
Czynność polegająca na powtarzaniu tej samej operacji w pętli określoną liczbę razy lub do momentu spełnienia określonego warunku.
W kontekście sieci neuronowych odnosi się to do powtarzalnej czynności uczenia się, a następnie weryfikowania efektów tego uczenia się w celu stopniowej poprawy dokładności i zmniejszenia strat.
Jasność
W Manipulatorze zbioru danych:
Parametryzacja jasności dla obrazów świeżo wygenerowanych przez operację Jasność i Kontrast.
Zobacz także: Manipulator
Jasność i kontrast
W Manipulatorze zbioru danych:
Operacja używana do zmiany jasności i/lub kontrastu obrazu. Na podstawie zestawu obrazów wejściowych (lub, jeśli nie jest to pierwsza operacja, już wygenerowanych danych), tworzy liczbę nowych obrazów określoną w parametrze. Stosowany tutaj wzór to:
$α⋅i(x,y)+β$
Gdzie:
$α$ - parametr odpowiedzialny za zmianę kontrastu w zakresie [0,1-3,0]
.
$i(x,y)$ - wartość wejściowego piksela obrazu o współrzędnych $x$ i $y$
$β$ - parametr odpowiedzialny za zmianę jasności w zakresie [0,255]
.
Każdy utworzony obraz będzie miał wartość jasności będącą sumą wartości oryginalnej i losowej wartości z zakresu [-β,β]. Parametr α, odpowiadający za kontrast, również zostanie wygenerowany losowo, z uwzględnieniem dolnej i górnej wartości określonej w parametrze (nie mogą one wykraczać poza zakres określony powyżej).
Zobacz także: Manipulator
Kategoria
Używane zamiennie z:
- kategorią klasyfikacyjną (tj. kategorią do trenowania modelu klasyfikacyjnego, w którym każdy obraz należy tylko do jednej kategorii)
lub
- kategorią adnotacji detekcyjnej (tj. kategorią do trenowania modelu detekcji, w którym obraz ma przypisane 0 lub więcej kategorii obiektów wraz z ich współrzędnymi położenia).
Możliwe jest łączenie kategorii. Powoduje to utworzenie nadkategorii, która zawiera parametry podkategorii wybranych przez użytkownika. Superkategoria w OSAI nazywana jest kubełkiem.
Zobacz także: Kubełek
Klasyfikacja
Przez klasyfikację rozumiemy nadanie całemu obrazowi jednej kategorii lub klasy, która definiuje obiekt przedstawiony na obrazie.
Klonowanie
Proces tworzenia dokładnych kopii istniejących zbiorów danych.
Zobacz także: Klonowanie zbioru danych
Kubełek
Kontener kategorii. Wszystkie dodane do niego kategorie zostaną połączone w jedną kategorię odpowiadającą nazwie kubełka, ale tylko w kontekście określonego szkolenia. Pierwotnie zdefiniowane kategorie pozostaną nienaruszone.
Zobacz także: Kategoria
Kąt
Kąt obrotu zdjęcia, ustawiony w sekcji Obrót Manipulatora zbioru danych. Zdjęcie jest obracane o kolejne wielokrotności ustawionego kąta, aż osiągnie 360 stopni lub do osiągnięcia limitu zdjęć wygenerowanych z jednego dla operacji obrotu.
Zobacz także: Obrót
Kontrast
Zakres zmiany kontrastu dla nowo wygenerowanych obrazów wyświetlany w skali od 0,1 do 3,0.
Konwersja
Proces przekształcania modelu z formatu początkowego do formatu docelowego. Niektóre informacje mogą zostać utracone w tym procesie, co powoduje niewielką utratę precyzji. Jednak konwersja zwykle poprawia ogólną wydajność modelu.
OSAI automatycznie wybiera odpowiedni format, zapewniając rozwiązanie zoptymalizowane pod kątem docelowego sprzętu.
Kontradyktoryjne uczenie maszynowe
Zmienia wszystkie wykryte obiekty tak, aby wyglądały inaczej z punktu widzenia sieci neuronowej. W ten sposób sieć neuronowa przeprowadza atak na samą siebie.
Macierz błędów
Macierz reprezentująca liczbę poprawnych i niepoprawnych rozpoznań modelu w danym testowym zbiorze danych. Porównuje ona kategorie, które powinny zostać rozpoznane (wiersze) z kategoriami rozpoznanymi przez model (komórki). Prawidłowe rozpoznania wypełniają komórki na przekątnej macierzy. Pozostałe komórki zawierają nieprawidłowe rozpoznania.
Manipulacja
Proces generowania nowych obrazów z obrazów wejściowych przy użyciu operacji wybranych przez użytkownika (obrót, zmiana rozmiaru, jasności i kontrastu).
Zobacz także: Manipulator
Manipulator
Usługa zintegrowana z portalem OSAI. Manipulator generuje nowe obrazy z obrazów wejściowych przy użyciu zrównoleglonych operacji na wysokowydajnym GPU.
Zobacz także: Rozszerzanie danych
Manipulator danych
Przejdź do: Manipulator
Magazyn S3
Serwer, który może przechowywać duże ilości danych i udostępniać je klientom na żądanie.
Metryka
Funkcja używana do oceny wydajności modelu. Funkcje metryczne są podobne do funkcji strat, z tym wyjątkiem, że wyniki oceny metrycznej nie są wykorzystywane podczas uczenia modelu - Źródło
Model
Oparta na plikach reprezentacja wytrenowanej głębokiej sieci neuronowej, w tym informacje o jej warstwach i wagach.
Mozaika
Przejdź do: Mozajka graniczna
Mozaika graniczna
Ogranicza rozmiar obiektów, gdy zaznaczona jest opcja mozaiki (nie pozwala, aby pola ograniczające opuszczały granice swoich obrazów, gdy używana jest funkcja Mosaic-data-augmentation) - Źródła.
Nasycenie
W procesie rozszerzania danych:
Operacja, która losowo zmienia nasycenie obrazów podczas treningu.
Zobacz także: Rozszerzanie danych; Darknet
Obrót
W Manipulatorze zbioru danych:
Operacja używana do zmiany kąta położenia obrazu. Na podstawie zestawu obrazów wejściowych (lub, jeśli nie jest to pierwsza operacja, już wygenerowanych danych), iteracyjnie tworzy serię nowych obrazów. W każdej iteracji obraz wejściowy jest obracany o wielokrotność kąta określonego w parametrze. Pętla kończy się, gdy obrót osiągnie 360 stopni.
Na przykład: dla kąta 30 stopni wygenerowanych zostanie 12 nowych obrazów obróconych o kąty 30°, 60°, 90°, 120°, 150°, 180°, 210°, 240°, 270°, 300°, 330° i 360°.
Zobacz także: Manipulator
Odcień
W procesie rozszerzania danych:
Losowa zmiana odcienia (koloru) podczas treningu - Źródło.
Zobacz także: Rozszerzanie danych
Panel główny
Główny widok interfejsu użytkownika. Wyświetla informacje o wszystkich ostatnich działaniach w aplikacji, takich jak ostatnio używane zbiory danych, ostatnio trenowane modele lub ostatnio otrzymane powiadomienia.
Pęd
Akumulacja ruchu; jak bardzo historia wpływa na dalszą zmianę wag (optymalizator) - Źródło
Podział
Proces dzielenia zbioru obrazów o rozmiarze określonym przez wielkość pojedynczej partii (64) na mniejsze podzbiory. Odbywa się to w celu optymalizacji wykorzystania zasobów systemowych bez wpływu na wyniki uzyskane podczas uczenia.
Zobacz także: Wielkość partii
Predykcja
Pojedynczy wynik sieci neuronowej, czyli pojedyncza kategoria klasyfikacji dla całego obrazu lub pojedynczego wykrytego obiektu. Jeden obraz może mieć jedną predykcję klasyfikacji i 0 lub więcej predykcji detekcji.
Precyzja
Określa dokładność modelu na podstawie tego, jak dobrze wykryty obiekt pasuje do kategorii lub położenia rzeczywistego obiektu.
Pretrenowany model
Sieć neuronowa przygotowana w ramach frameworka, z predefiniowaną architekturą warstw i wag. Można go dostosować poprzez parametryzację, modyfikację warstw, a następnie szkolenie na określonych zbiorach danych.
Proces roboczy
Proces roboczy to maszyna, która wykonuje zadania w tle, podczas gdy aplikacja działa i przetwarza inne żądania. Może wykonywać różne zadania, takie jak:
- przygotowywanie i manipulowanie zbiorem danych
- tworzenie, szkolenie i konwertowanie modelu AI,
- wynajmowanie i zwalnianie urządzeń,
- tworzenie predykcji.
Gdy zadania są dodawane do kolejki, proces roboczy pobiera je stamtąd i wykonuje w tle, umożliwiając jednoczesne przetwarzanie zadań AI bez zakłócania doświadczenia użytkownika. Na przykład, trenowanie modeli może być czasochłonne, a korzystanie z procesu roboczeko pozwala na wykonywanie innych zadań, podczas gdy model jest trenowany w tle.
W naszej aplikacji jest kilka procesów roboczych. Ich liczba w systemie jest skalowalna i może zmieniać się w czasie.
Przeuczenie (Overfitting)
Przeuczenie to częsty problem w uczeniu maszynowym, w którym model staje się zbyt wyspecjalizowany w rozpoznawaniu wzorców z danych treningowych, przez co słabo radzi sobie z nowymi, nieznanymi danymi. Może to wystąpić, gdy model zbyt mocno dostosowuje się do konkretnych przykładów z zestawu treningowego, co może prowadzić do obniżonej dokładności w rzeczywistych scenariuszach lub dla obiektów i układów, które nie były dobrze reprezentowane podczas treningu. Zapobieganie przeuczeniu jest kluczowe dla zapewnienia niezawodnego działania modelu w zróżnicowanych i dynamicznych warunkach.
Przerzucanie
W procesie rozszerzania danych:
Pionowe lub poziome odbicie obrazu.
Zobacz także: Rozszerzanie danych
Próg ucinania
Procentowy limit przycinania obiektów z adnotacjami (w obrazach wygenerowanych przez operację obrotu).
Operacja obrotu może spowodować, że część obiektu z adnotacją znajdzie się poza obrazem, tj. zostanie ucięta. Próg ucinania określa, jaka część obiektu musi być widoczna na wynikowym obrazie, aby adnotacja miała sens. Adnotacje obiektów o mniejszej widoczności niż wskazana wartość procentowa zostaną usunięte.
Zobacz także: Obrót
Publikacja
Proces udostępniania zbiorów danych do zakupu.
Zobacz także: Publikacja zbioru danych
Rozmycie Gaussowskie
W procesie rozszerzania danych:
Losowe dodawanie rozmycia Gaussowskiego do przetwarzanych obrazów.
Zobacz także: Rozszerzanie danych
Rozszerzanie danych
Operacje stosowane w celu rozszerzenia ilości danych poprzez dodanie nieznacznie zmodyfikowanych kopii już istniejących danych lub nowo utworzonych danych syntetycznych z istniejących danych. Działa jako regularyzator i pomaga zmniejszyć nadmierne dopasowanie podczas uczenia modelu uczenia maszynowego.
Rynek
Na rynku użytkownicy mogą sprzedawać własne zestawy danych lub kupować je od innych użytkowników.
Zobacz także: Publikacja i Publikacja zbioru danych
Spadek
Słabsza aktualizacja wag dla typowych cech. Eliminuje nierównowagę w zbiorze danych (optymalizator) - Źródło
Sprzęt
Kluczowe komponenty (np. GPU, CPU) urządzeń, na których działają modele sieci neuronowych.
Strata
Przejdź do: Funkcja straty
Strata modelu
Przejdź do: Strata
Szablon
Przejdź do: Szablon modelu
Szablon modelu
Szablon (ustawienie wstępne) przechowujący wartości parametrów uczenia sieci neuronowej. Użytkownik może użyć szablonu do skonfigurowania treningu.
Szum
W procesie rozszerzania danych:
Operacja losowego przycinania i zmiany rozmiaru obrazów, ze zmieniającym się współczynnikiem proporcji od $x(1 - 2 \cdot szum) \rightarrow x(1 + 2 \cdot szum)$ (parametr rozszerzania danych jest używany tylko od ostatniej warstwy) - Źródło
Tempo zmiany wag
Hiperparametr, który kontroluje, jak bardzo dostosowujemy wagi naszej sieci w odniesieniu do gradientu strat. Im niższa wartość, tym wolniej poruszamy się wzdłuż nachylenia w dół - Źródło
Trening
Proces trenowania sieci neuronowej, który w kolejnych iteracjach/epokach i przy użyciu określonych parametrów ma na celu stopniową poprawę dokładności/precyzji sieci i zmniejszenie wartości funkcji straty.
Wytrenowany model jest następnie zapisywany w magazynie S3.
Zobacz także: Model; Magazyn S3; Dokładność
Udostępnianie
Praktyka polegająca na udostępnianiu zbioru danych innym osobom w celu uzyskania dostępu, analizy i/lub wykorzystania.
Zobacz także: Udostępnianie zbioru danych
Urządzenie
Urządzenie brzegowe; urządzenie końcowe, na którym możemy uruchamiać wytrenowane i/lub przekonwertowane modele sieci neuronowych. Uruchomienie modelu na urządzeniu nazywane jest wdrożeniem.
Urządzenie brzegowe
Przejdź do: Urządzenie
Walidacja
Proces wbudowany w trening modelu, który oblicza dokładność modelu na podzbiorze walidacyjnym.
Wielkość partii
Liczba obrazów przetwarzanych jednocześnie przez CPU lub GPU w danym momencie procesu trenowania.
Wczesne zatrzymanie
Oznacza to, że model może zakończyć szkolenie wcześniej, jeśli wartość strat nie zmniejszy się w określonej liczbie epok.
Zbiór danych
Zbiór danych reprezentujących klasy obiektów, które mają być rozpoznawane przez wytrenowany model sieci neuronowej. Składa się z obrazów i (ewentualnie) dodanych do nich adnotacji.
Zobacz także: Adnotacja
Zmienność jasności
Zakres zmian jasności dla nowo generowanych obrazów, w skali od 0 do 255.
Zobacz także: Jasność; Jasność i kontrast
Zmiana rozmiaru
W Manipulatorze zbioru danych:
Operacja używana do zmiany wymiarów obrazu. Modyfikacja jest wykonywana na wszystkich obrazach wejściowych (lub, jeśli nie jest to pierwsza operacja, na wszystkich, które zostały już wygenerowane). Rozmiar obrazu wyjściowego może być generowany w rozdzielczościach od 8x8 do 4096x3112 px. Możliwa jest również zmiana proporcji obrazu.
Zobacz także: Manipulator