AI-studie avslöjar: Så här ser maskinen på människans bild!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Forskning från JLU Giessen och Max Planck Institute analyserar AI-uppfattning av objekt. Resultat publicerade i Nature Machine Intelligence.

Forschung der JLU Gießen und Max-Planck-Institut analysiert KI-Wahrnehmung von Objekten. Ergebnisse in Nature Machine Intelligence veröffentlicht.
Forskning från JLU Giessen och Max Planck Institute analyserar AI-uppfattning av objekt. Resultat publicerade i Nature Machine Intelligence.

AI-studie avslöjar: Så här ser maskinen på människans bild!

Den 23 juni 2025 publicerade ett forskarlag från Justus Liebig University Giessen och Max Planck Institute for Cognitive and Brain Sciences betydande resultat om objektigenkänning med hjälp av artificiell intelligens (AI). Dessa fynd publicerades i den berömda tidskriften Nature Machine Intelligence publiceras. De första författarna Florian Mahner och Lukas Muttenthaler och den sista författaren Prof. Dr. Martin Hebart presenterade ett nytt tillvägagångssätt för att identifiera och jämföra nyckeldimensioner som både människor och AI uppmärksammar när de ser föremål.

Studien analyserade cirka 5 miljoner udda-en-ut-bedömningar från 1 854 objektbilder för att ta reda på vilka visuella och semantiska egenskaper människor och AI föredrar. Det visar sig att människor fokuserar på meningsrelaterade dimensioner, som "djurrelaterade" eller "brandrelaterade", medan AI-modeller i första hand fokuserar på visuella egenskaper som "rund" eller "vit". Detta fenomen kallas "visuella preferenser" och kan avsevärt påverka förtroendet för AI-system om det finns skillnader i objektigenkänningsstrategier.

Metodik och forskningsresultat

Det vetenskapliga arbetet använder flera djupa neurala nätverk (DNN) för att känna igen bilder som liknar människor och bestämma bildernas nyckeldimensioner. Jämförelsen av dimensioner mellan människor och DNN avslöjade att även om AI uppnår approximationer till dessa dimensioner, matchar den inte helt människans uppfattning. Det som var särskilt anmärkningsvärt var att för djurrelaterade dimensioner inkluderades inte många icke-djurbilder i analysen, vilket ytterligare påverkade resultaten av AI-tekniken.

Forskarna hoppas att framtida projekt kommer att möjliggöra en direkt jämförelse mellan människans och AI-uppfattningen, vilket kan leda till en bättre förståelse för AI-uppfattningen och förbättring av själva tekniken. Kontakt med Prof. Dr. Martin Hebart nämns här som en möjlighet för den som är intresserad av ytterligare information om detta forskningsområde.

Tillämpningar av AI i bildigenkänning

Fynden om skillnaderna i objektigenkänning har bred tillämpning inom olika områden. AI används ofta för att stödja logistik, bildklassificering eller kundstrukturanalys inom e-handel. I detta sammanhang erbjuder Lärbara maskiner ett verktyg för snabb och enkel programmering av AI-system, vilket gör att datorer kan känna igen bilder, ljud eller poser.

Exempel på tillämpningar är stöd med inventering eller sortering av varor. Vikten av träningsdatan kvalificerar sig som avgörande för AI-modellernas prestanda. Ett praktiskt exempel: Om en Alexa är synlig i bakgrunden av en träningsscen, luras AI:n att klassificera bilden enbart baserat på den närvaron, oavsett bildens primära fokus.

Framtida utmaningar och utveckling

AI-teknik, särskilt inom bildigenkänning, visar en enorm potential, men har också utmaningar att övervinna. Oro för dataskydd, partiskhet i utbildningsdata och behovet av tydliga rättsliga ramar är nyckelfrågor som måste åtgärdas. Dessutom måste AI-modeller vara robusta för olika förhållanden som belysning och buller för att fungera effektivt i praktiken.

Eftersom utvecklingen inom maskininlärning och neurala nätverk fortsätter, är framtiden för AI-driven bildigenkänning fortfarande lovande. Företag kan dra nytta av processoptimering och riktade marknadsföringsstrategier, medan omfattande forskning om att förbättra AI-kapaciteten fortsätter.