loading...
Sponser
0 2

Neuralna mreža i prepoznavanje lokacija

GeoGuessr deluje kao naivna zabavna igra koja testira vašu sposobnost prepoznavanja lokacije — početna stranica vas veselo poziva da istražite svet, a kada skrolujete dole, možete odabrati i posebne, egzotične, predele sa propratnom pričom o njihovoj istoriji. Ako niste pametna mašina, prosečno ćete omanuti za 2320,75 km. Verovatno je da će vas mašina pobediti u 28 od 50 rundi, sa lokacijskom pogreškom od 1131,7 km. Tobijas Vejand, specijalista za computer vision u Guglu, i nekoliko kolega, istrenirali su konvolucionu neuralnu mrežu (CNN) da pogodi lokaciju bilo koje slike koristeći samo piksele od kojih je sačinjena i oslanjajući se na distribuciju verovatnoće na mapi sveta. CNN je tip mreže inspirisan životinjskim vidnim korteksom u mozgu i sam proces razvitka ove neuralne mreže od 60-ih godina direktno je pratio povećanje saznanja u biologiji. Input, slika, razdeljena je na delove — na tzv. “receptivna polja”, i tako biva procesuirana. Ako delove zamislimo kao pločice, u autputu će one biti preklopljene jedne preko drugih, kako bi se dobila što bolja predstava originalne slike. Ekipa je u stvaranje projekta, koji su nazvali PlaNet, krenula pretvarajući mapu sveta u mrežu sačinjenu od 26.000 “pločica” različite veličine, u skladu sa brojem slika koje su uslikane na tom određenom mestu (zato veliki i “fotogenični” gradovi, poput Pariza, imaju detaljnije izdeljenu mrežu). Model svakoj ćeliji slike dodeljuje određeni stepen pouzdanosti da je fotografisana na određenoj lokaciji, tako da je njegov konačni autput distribucija verovatnoće na mapi. Screen-Shot-2016-03-03-at-12.24.36-PM Ovo se razlikuje u odnosu na određivanje geografskih koordinata, gde se lokacija određuje fiksno i nema načina da se predikcija lokacije i preciznost menjaju. Pri narednom koraku formirana je baza podataka od 126 miliona slika, sa odgovarajućom Exif lokacijom i dodeljenim kvadratom na mapi. Kako bi istrenirali neuralnu mrežu koristili su 91 milion slika, a tačnost su testirali kroz 2.3 miliona geotagovanih slika sa Flickra (većina slika nije imala lokaciju), ispitujući sposobnost procene geografskih atributa poput nadmorske visine, populacije, pa čak i prihoda domaćinstava. Testovi su pokazali da PlaNet pravilno locira 3,6% slika na nivou ulice, a 10,1% na nivou grada. Za poređenje sa ljudima tim je koristio gorepomenutu igru GeoGuessr, u kojoj kompjuter pobeđuje u 28 od 50 rundi sa greškom manjom za čitavih 1000 kilometara. Čak ni ljudi koji žive putujući širom sveta ne mogu stati rame uz rame mašini — Vejandova neuralna mreža videla je više lokacija nego što će bilo koje ljudsko oko ikada videti, a pored toga ima i sposobnost da pamti suptilne detalje pejzaža. Novorazvijena neuralna mreža ima moć da provali lokaciju čak i unutrašnjosti, kao i određenih objekata koji nisu nužno vezani za lokaciju, poput kućnih ljubimaca i hrane. Ono što je takođe fascinantno kod ovog superljudskog modela je da staje na 335MB — praktično na memoriju pametnog telefona. Više detalja i brojeva možete pronaći u ovom radu. Izvor: Startit Autor članka: Marija Gavrilov]]>