måndag 16 september 2013

Vecka 37

I veckan har jag testat CAMSHIFT-metoden mer utförligt samt förberett den nya testdatabasen. Jag har dessutom utvecklat en ensemble-igenkännare som kombinerar resultat från flera underliggande igenkänningsalgoritmer.  Med den existerande testdatabasen fungerar CAMSHIFT-metoden och en underliggande Fisherface-igenkännare mycket bra. Detta är under förutsättning att ett stort antal samples kan tillhandahållas till Fisherface (t. ex. genom att läsa från en gallerivideoinspelning), att bildförhållande i galleriet är identiskt med testvideon och att testvideon innehåller en individ som finns med i galleriet. Metoden är däremot dålig på att avgöra att en individ inte finns med i galleriet. I första hand är det ett problem med den underliggande igenkännaren, den identifierar helt enkelt okända individer som någon person i galleriet. Jag hade en idé om hur man skulle kunna eliminera problemet i den CAMSHIFT-baserade metoden genom att, istället för att bero på att den underliggande igenkännaren kan identifiera en okänd individ, kräva att en given identitet figurerar i en "track" (en serie associerade regioner över ett antal frames i sekvens) med tillräckligt hög frekvens för att identiteten ska associeras med tracken. Detta skulle bara fungera om en okänd individs identitet associeras med ett flertal andra individer i galleriet med någorlunda jämn fördelning. Istället tenderar de underliggande igenkännarna att identifiera en okänd individ som en specifik individ i galleriet hellre än de andra, så det fungerar inte. I nuläget har jag inget uppslag för hur man ska lösa det problemet, så istället planerar jag att gå vidare och testa hur metoden fungerar om det finns flera personer i bilden samtidigt. Till det ändamålet har jag förberett en ny testdatabas som jag ska använda i veckan. Utöver det har jag byggt en ensemble-igenkännare, som integrerar flera underliggande igenkännare som röstar om vilken identitet som är den riktiga. Jag har dock inte haft tid att studera huruvida metoden presterar signifikant bättre eller sämre än de individuella igenkännarna.
Jag har lärt mig att det är mycket problematiskt att skilja på kända och okända individer med någon högre precision i allmänhet, och att det verkar inkompatibelt med min CAMSHIFT-metod. Jag har 2.5 månader kvar på projektet, och jag funderar på att börja skriva ihop rapporten snart. Jag upplever det som att det är svårare att få nya idéer och tiden skulle kanske kunna användas effektivare till det mer konkreta arbetet med att skriva. Jag kanske dessutom kan få nya uppslag medan jag skriver. Jag ska dock studera hur de existerande metoderna fungerar med den nya testdatabasen först. I veckan har jag inte kommunicerat med någon annan.

Inga kommentarer:

Skicka en kommentar