AI-undersøgelse afslører: Sådan ser maskinen det menneskelige billede!
Forskning fra JLU Giessen og Max Planck Instituttet analyserer AI-opfattelse af objekter. Resultater offentliggjort i Nature Machine Intelligence.

AI-undersøgelse afslører: Sådan ser maskinen det menneskelige billede!
Den 23. juni 2025 offentliggjorde et forskerhold fra Justus Liebig University Giessen og Max Planck Institute for Cognitive and Brain Sciences betydelige resultater om objektgenkendelse ved hjælp af kunstig intelligens (AI). Disse resultater blev offentliggjort i det anerkendte tidsskrift Nature Machine Intelligence offentliggjort. De første forfattere Florian Mahner og Lukas Muttenthaler og den sidste forfatter Prof. Dr. Martin Hebart præsenterede en ny tilgang til at identificere og sammenligne nøgledimensioner, som både mennesker og AI er opmærksomme på, når de ser objekter.
Undersøgelsen analyserede omkring 5 millioner ulige-én-ud-domme fra 1.854 objektbilleder for at finde ud af, hvilke visuelle og semantiske egenskaber mennesker og AI foretrækker. Det viser sig, at folk fokuserer på betydningsrelaterede dimensioner, såsom "dyrerelateret" eller "brandrelateret", mens AI-modeller primært fokuserer på visuelle egenskaber såsom "rund" eller "hvid". Dette fænomen kaldes "visuel præference" og kan i væsentlig grad påvirke tilliden til AI-systemer, hvis der er forskelle i objektgenkendelsesstrategier.
Metode og resultater af forskningen
Det videnskabelige arbejde bruger flere dybe neurale netværk (DNN'er) til at genkende billeder, der ligner mennesker, og bestemme billedernes nøgledimensioner. Sammenligningen af dimensioner mellem mennesker og DNN'er afslørede, at selvom AI opnår tilnærmelser til disse dimensioner, matcher den ikke fuldt ud den menneskelige opfattelse. Det, der var særligt bemærkelsesværdigt, var, at for dyrerelaterede dimensioner blev mange ikke-dyrebilleder ikke inkluderet i analysen, hvilket yderligere påvirkede resultaterne af AI-teknologien.
Forskerne håber, at fremtidige projekter vil muliggøre en direkte sammenligning mellem menneskelig og AI-perception, hvilket kan føre til en bedre forståelse af AI-perception og forbedring af selve teknologien. Kontakt med prof. dr. Martin Hebart nævnes her som en mulighed for interesserede i yderligere information om dette forskningsfelt.
Anvendelser af AI i billedgenkendelse
Resultaterne om forskellene i objektgenkendelse har bred anvendelse på forskellige områder. AI bruges ofte til at understøtte logistik, billedklassificering eller kundestrukturanalyse i e-handel. I denne sammenhæng tilbyder Lærbare maskiner et værktøj til hurtig og nem programmering af AI-systemer, som gør computere i stand til at genkende billeder, lyde eller positurer.
Eksempler på applikationer omfatter support med lagerbeholdning eller sortering af varer. Vigtigheden af træningsdataene kvalificerer sig som afgørende for AI-modellernes ydeevne. Et praktisk eksempel: Hvis en Alexa er synlig i baggrunden af en træningsscene, snydes AI til at klassificere billedet udelukkende baseret på denne tilstedeværelse, uanset billedets primære fokus.
Fremtidige udfordringer og udvikling
AI-teknologi, især inden for billedgenkendelse, viser et enormt potentiale, men har også udfordringer at overvinde. Bekymringer om databeskyttelse, skævhed i uddannelsesdata og behovet for klare juridiske rammer er nøglespørgsmål, der skal behandles. Derudover skal AI-modeller være robuste over for forskellige forhold såsom lys og støj for at fungere effektivt i praksis.
Mens udviklingen inden for maskinlæring og neurale netværk fortsætter, er fremtiden for AI-drevet billedgenkendelse fortsat lys. Virksomheder kan drage fordel af procesoptimering og målrettede marketingstrategier, mens omfattende forskning i at forbedre AI-kapaciteter fortsætter.