Adnotacje
Czym są adnotacje?
Adnotacje reprezentują szczegółowe informacje o konkretnym obrazie, które mogą być wykorzystane w procesie uczenia.
Adnotacje mogą określać kategorię przypisaną do całego obrazu (do treningu w zakresie klasyfikacji) lub pozycję 0 lub więcej obiektów wraz z ich kategoriami (do treningu w zakresie detekcji).
Formaty adnotacji
Adnotacje mogą być reprezentowane przez pliki kompatybilne z różnymi formatami. Nasz portal obsługuje obecnie dwa formaty adnotacji:
- Pascal VOC (.xml)
- Darknet TXT (.txt)
Pliki adnotacji można importować do portalu podczas przesyłania obrazów, o ile są one zapisane w jednym z obsługiwanych formatów i spełniają wymagania określone poniżej. Podobnie, podczas pobierania możemy określić format, w jakim chcemy wyeksportować nasze adnotacje.
Pascal VOC
W przypadku Pascal VOC plik adnotacji w formacie .xml musi mieć następującą strukturę:
<annotation>
<filename>image.jpg</filename>
<path>image.jpg</path>
<source/>
<size>
<width>716</width>
<height>716</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>FLASHLIGHT</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<occluded>0</occluded>
<bndbox>
<xmin>290</xmin>
<xmax>580</xmax>
<ymin>169</ymin>
<ymax>557</ymax>
</bndbox>
</object>
</annotation>
Darknet TXT
W przypadku Darknet TXT plik adnotacji z rozszerzeniem .txt musi mieć strukturę pokazaną poniżej:
2 0.6075418994413407 0.5069832402234636 0.40502793296089384 0.5418994413407822
USB_ADAPTER
SQUISHY_TOY
FLASHLIGHT
Plik, w którym wymienione są wszystkie nazwy kategorii, musi mieć nazwę labels.txt. W przeciwnym razie adnotacje nie zostaną poprawnie odczytane przez portal. Pierwsza liczba w wierszu w pliku adnotacji wskazuje indeks kategorii z pliku labels.txt, numerowany od zera w górę.
Aby uzyskać wizualny przewodnik na temat przesyłania zestawów danych z kompatybilnymi adnotacjami, zapoznaj się z samouczkiem na naszym kanale YouTube: