Tworzenie modelu do detekcji 7 rodzajów batoników
Tworzenie modelu detekcji siedmiu rodzajów batoników to szczegółowy proces, który wymaga starannego planowania i wykonania. Ten artykuł nie tylko omawia tworzenie wysokiej jakości zbioru danych, ale także przedstawia kroki związane z budowaniem modelu zdolnego do dokładnej identyfikacji tych cukierków na taśmie produkcyjnej.
Przed rozpoczęciem gromadzenia danych konieczne jest jasne zdefiniowanie celów. Naszym celem było opracowanie modelu zdolnego do rozpoznawania batoników takich jak Bounty, Knoppers, Lion, Lion Coconut, Mars, Prince Polo i Snickers, który mógłby zostać wykorzystany do automatyzacji zarządzania zapasami w fabrykach.
Postanowiliśmy samodzielnie wykonać zdjęcia przy użyciu kamery Basler daA2448-70uc z modułów kamer dart, co zaowocowało około 6000 zdjęć batoników. Nasze podejście polegało na zrobieniu zdjęcia każdego rodzaju batonika zarówno z przodu, jak i z tyłu, wyśrodkowanego w kadrze. Ponadto użyliśmy manipulatora zbioru danych, aby wygenerować wiele obrazów w chmurze na podstawie wejściowego zbioru danych. Pozwoliło nam to uzyskać obrazy o różnych rozmiarach, kątach, jasności i kontraście. Proces ten obejmował również przechwytywanie batoników w różnych pozycjach, lokalizacjach w kadrze, na różnych tłach i w różnych warunkach oświetleniowych.
Po zebraniu danych dokładnie przejrzeliśmy i wyczyściliśmy zbiory danych, usuwając zduplikowane i rozmazane obrazy. Następnie przystąpiliśmy do oznaczania każdego batonika.
Problemem, który napotkaliśmy w tym procesie, było dokładne zdefiniowanie pól ograniczających, zwłaszcza gdy batoniki były umieszczone po przekątnej lub w bliskiej odległości od siebie na taśmie produkcyjnej. Dzięki próbom i błędom odkryliśmy, że oznaczanie całych batoników i zapewnianie minimalnego nakładania się na siebie pól ograniczających było skuteczną strategią unikania niedokładności.
Po oznaczeniu wszystkich obrazów wytrenowaliśmy kilka modeli, wybierając framework Darknet i wstępnie wytrenowany model yolov4-tiny.conv29 ze względu na ich elastyczność i dokładność w wykrywaniu małych obiektów.
Ostateczny model, opracowany na podstawie wielu zestawów danych, w tym indywidualnych zestawów danych dla każdego batonika i zestawu danych mieszanych batoników, wykazał doskonałą wydajność na poruszającym się taśmie produkcyjnej. Model ten ma znaczący potencjał dla rzeczywistych zastosowań, szczególnie w środowiskach produkcyjnych, gdzie może być wykorzystywany do automatyzacji procesów zarządzania zapasami, optymalizacji wydajności przepływu pracy i poprawy ogólnej produktywności. Dzięki dokładnej identyfikacji różnych batoników w czasie rzeczywistym, technologia ta może zrewolucjonizować zarządzanie zapasami w różnych branżach, od produkcji po handel detaliczny.