Segmentacja semantyczna, wykrywanie obiektów, przejezdne obszary oraz oznaczenia pasów – to wszystko na ponad 100 000 filmach w rozdzielczości HD. Nagrane o różnych porach dnia, różnych porach roku. Dane zawierają lokalizację, stempel czasu oraz informacje z akcelerometrów.
Dane pochodzą z 4 lokalizacji z czego 3 znajdują się praktycznie w jednej okolicy (SF, Berkeley i Bay Area), czwartą lokalizacją jest Nowy Jork.
Dane zostały pobrane o różnych porach dnia, przy różnej pogodzie i w różnego rodzaju scenach. Uwaga na wykresy – są przedstawione w skali logarytmicznej co na pierwszy rzut oka wyrównuje ilości wystąpień. W tym zbiorze danych występuje tylko 10 klas obiektów, są to:- bike
- bus
- car
- motor
- person
- rider
- traffic light
- traffic sign
- train
- truck
- banner
- billboard
- lane divider
- parking sign
- pole
- polegroup
- street light
- traffic cone
- traffic device
- traffic light
- traffic sign
- sign frame
- person
- rider
- bicycle
- bus
- car
- caravan
- motorcycle
- trailer
- train
- truck
- area/drivable – aktualny pas ruchu
- area/alternative – pozostałe pasy ruchu
- lane/crosswalk
- lane/double other
- lane/double white
- lane/double yellow
- lane/road curb
- lane/single other
- lane/single white
- lane/single yellow
Podsumowując otrzymaliśmy bardzo ciekawy zbiór danych, z dość małą liczbą kategorii wykrywanych obiektów. Obiekty oznaczone w zbiorze są mocno nastawione na to co możemy spotkać na drodze.
Zachęcam do wytrenowania sieci neuronowej do wykrywania obiektów!
Jeśli potrzebujesz pomocy – pisz do mnie!
Linki