Detektor rasy psów

W tym samouczku zbudujesz model wykrywania zdolny do rozpoznawania ras psów w klatkach wideo.

Dowiesz się, jak

  • dodawać obrazy i adnotacje oddzielnie,
  • trenować model przy użyciu frameworka Darknet,
  • testować wykrywacz w czasie rzeczywistym.

Aby stworzyć model, użyj publicznie dostępnego zbioru danych Stanford Dogs, który zawiera 20 580 obrazów 120 ras psów. Zbiór danych składa się z obrazów i adnotacji zebranych w oddzielnych folderach.

Wynik detekcji

Rozpakowywanie zbioru danych

Zbiór danych Stanford Dogs został zapisany w dwóch oddzielnych archiwach, tj. images i annotation z rozszerzeniem .tar. Chociaż nasz portal obsługuje takie rozszerzenia, nie można ich przesłać w tym samym czasie, co oznacza, że zdjęcia w zbiorze danych nie będą miały adnotacji. Należy je rozpakować i przesłać jako katalog.

Dodawanie zbioru danych

W sekcji Posiadane kliknij Dodaj nowy zbiór danych i stwórz nową kolekcję o nazwie my_dogs.

Tworzenie zbioru danych

Kliknij Dodaj katalog, aby załadować katalog zawierający obrazy i adnotacje.

Widok przesyłania

Po zatwierdzeniu obrazy z adnotacjami zostaną wyświetlone w miniaturkach. Kliknij przycisk Prześlij.

Prześlij katalog

Można dodawać adnotacje obiektów do wykrywania w formacie Pascal VOC (pliki z rozszerzeniem .xml). Obraz i plik adnotacji muszą mieć tę samą nazwę - tylko wtedy można powiązać informacje o adnotacji na obrazie z samym obrazem.

Możesz samodzielnie połączyć dwa katalogi dla wybranej rasy psów w jeden katalog lub dodać obrazy i katalogi adnotacji w dwóch krokach podczas fazy przesyłania. Kolejność przesyłania nie ma znaczenia.

Tworzenie modelu

Aby utworzyć model, przejdź do sekcji Modele i kliknij Dodaj nowy model. Wybierz opcję Detekcja.

Dodaj nowy model

Wybierz zbiór danych my_dogs, aby użyć go do trenowania modelu.

Wybierz zbiory danych i kategorie

Następnym krokiem jest scalenie kategorii. Można zarządzać kategoriami obrazów w zbiorze danych. Opcja ta została opisana bardziej szczegółowo w artykule Tworzenie i trenowanie modeli. W tym samouczku nie jest konieczne zmienianie czegokolwiek w tym miejscu, więc kontynuuj klikając Dalej.

Scalanie kategorii

Teraz należy sparametryzować model. Wprowadź nazwę Dog Breed Detector i wybierz framework Darknet.

Ustaw parametry modelu

Zaakceptuj ustawienia domyślne lub zmień je według własnych upodobań w zakładce Tryb podstawowy i/lub Zaawansowany. Kliknij przycisk Rozpocznij trening.

Ustaw parametry modelu

Proces treningu można wyświetlić w widoku Panelu głównego, w zakładce Powiadomienia lub w sekcji Modele.

Widok Panelu głównego

Po zakończeniu szkolenia przekonwertuj model tak, aby był kompatybilny z NVIDIA Jetson Nano. Aby to zrobić, przejdź do sekcji Modele, najedź kursorem na ikonę koła zębatego i wybierz Szczegóły.

Wybierz Szczegóły

W sekcji Konwersja wybierz architekturę NVIDIA MAXWELL.

Wybier sprzęt

Testowanie Twojego pomysłu

Po zakończeniu konwersji przejdź do zakładki Live Testing i wybierz Jetson Nano.

Wybierz Jetson Nano

Spowoduje to otwarcie nowej karty przeglądarki z Artificial Intelligence Device Web Service (AIDWS), która zostanie uruchomiona na urządzeniu. Twój model będzie dostępny do pobrania na urządzenie.

Model w AIDWS

Kliknij kafelek modelu, aby pobrać i uruchomić model. Teraz możesz przesłać dane wejściowe, których użyjemy do przetestowania modelu. Aby to zrobić, kliknij przycisk Prześlij plik.

Prześlij plik

Wybierz pliki, które chcesz przesłać. Najpierw użyjemy pliku wideo.

Wybier plik

Po przesłaniu pliku wideo możesz zdecydować, czy chcesz zapisać wyniki i/lub przesłać obrazy z wideo do nowego lub istniejącego zestawu danych. Kliknij Dalej, aby kontynuować.

Po przetworzeniu wideo aplikacja internetowa otworzy wbudowany odtwarzacz wideo.

Przetwarzanie

Na filmie, który obejrzysz w odtwarzaczu, zobaczysz tagi ras przypisane do psów, które udało się znaleźć modelowi.

Wyniki

Tak wygląda klatka pracy modelu w odtwarzaczu multimedialnym aplikacji testowej:

Wyniki wideo

Wyniki na przesłanych zdjęciach są podobne:

Wyniki obrazu

Wyniki obrazu

Wyniki obrazu