TDK első helyezés és a szakdolgozat projekt

Megkaptuk az első helyezést a projektünkre a 2015 őszi Tudományos Diákköri Konferencián.

TDK első díj

Mint azt már korábban is írtam, a projekten ketten dolgozunk, Takács Dániel kolléga Úrral, melynek címe:

Gráf-alapú Egyidejű Lokalizáció és Térképezés.

Projektünk alapvető célja egy olyan szoftverrendszer elkészítése, amely képes egy Microsoft Kinect szenzor jeleit feldolgozni és ezek alapján feltérképezni a környezetét. A feltérképezett munkatér ezek után virtuálisan bejárható, illetve a munkatérben lehet útvonalat keresni, és ez alapján dönt a rendszer arról, hogyan navigálhat az ismert területen. A rendszer érzékeli, ha egy már korábban feltérképezett térrészt újra azonosít, és javítja a térképet a régi és az új adatok segítségével. Figyelembe véve a szenzor által szolgáltatott adatokban fellépő zajokat, a modellel szemben elvárás, hogy minél pontosabban közelítse a környezetet, amelyből alkotja azt.

A projekt jelenlegi állapotában a kamerát kézben visszük, ez főleg tesztelésnél gyorsabb is. Az alábbi videóban a TDK előadás során is felhasznált videóanyagot szerkesztettem egybe (magyarázat a videó után).

Feltérképezés

Első lépésben történik a feltérképezés, ilyenkor a kamerát (világoskék nyíl) végigvezetjük a feltérképezendő térben, a program pedig igyekszik a képekből meghatározni a térbeli elmozdulást. Hogy spóroljunk az erőforrásokkal, a program csúcspontokkal dolgozik (a sötétkék nyilak), ahol nem az egymás után következő képkockákat veti össze, hanem mindig az aktuális képet az utolsó csúcspont képével. Új csúcspontot akkor rak le, ha az előző óta az elfordulás vagy elmozdulás egy bizonyos értéket meghaladott.

Az egyes képkockák közti relatív elmozdulást könnyedén ki tudjuk számolni, mivel a Kinect szenzor biztosít az egyes pixelek mellé mélység adatot is, így miután kinyertük a közös jellemzőket a két képen, lesz két pontfelhőnk, amik ugyanazokat a pontokat írják le, csak más orientációban és elhelyezésben.

A térképezés során minden csúcspont lementésekor a hozzátartozó kép képpontjait leképezzük a voxel térbe. Itt nagy voxelekkel dolgozunk, és nem minden pixelt számítunk be, így egy gyors, vázlatos képet kapunk arról, hogy milyen lesz. A csúcspontok ismeretében a voxel teret bármikor és bármilyen felbontásban újragenerálhatjuk.

Útvonalkeresés

Az útvonalkeresésnél a legfontosabb, hogy a padlót külön tudjuk választani a többi objektumtól. Noha a padló sík, a különféle zajok és pontatlanság miatt soha nem lesz tökéletesen sík, így a padló kiválasztásánál ezt figyelembe kell venni, hogy hol van az, ahol egy voxel ugrás még zaj, és hol számít már akadálynak. Ennek a végeredménye egy 2D térkép lesz, amiben gyorsan és könnyedén tudunk Dijkstra-féle hullámtovábbterjesztéses algoritmussal útvonalat keresni. Mivel ez az algoritmus nem számol fizikai kiterjedéssel, így magát az utat kell lesoványítani úgy, hogy az akadályokat hízlaljuk fel a robot méretével. A videón ezt jelzik a színek: a piros szín mutatja azt a padlórészt, ahol nem férne el a robot, a zöld pedig a járható utat.

3D megjelenítés

A videó utolsó része egy ilyen nagyfelbontású voxel tér körbejárását mutatja be. Itt a kamera a csúcspontokat járja végig időrendi sorrendben.