Badanie AI ujawnia: tak maszyna widzi ludzki obraz!
Badania JLU Giessen i Instytutu Maxa Plancka analizują postrzeganie obiektów przez sztuczną inteligencję. Wyniki opublikowane w Nature Machine Intelligence.

Badanie AI ujawnia: tak maszyna widzi ludzki obraz!
23 czerwca 2025 r. zespół badawczy z Uniwersytetu Justusa Liebiga w Giessen i Instytutu Nauk o Kognitywistyce i Mózgu im. Maxa Plancka opublikował znaczące wyniki dotyczące rozpoznawania obiektów za pomocą sztucznej inteligencji (AI). Wyniki tych badań opublikowano w renomowanym czasopiśmie Inteligencja maszyny natury opublikowany. Pierwsi autorzy Florian Mahner i Lukas Muttenthaler oraz ostatni autor, prof. dr Martin Hebart, zaprezentowali nowe podejście do identyfikowania i porównywania kluczowych wymiarów, na które zwracają uwagę zarówno ludzie, jak i sztuczna inteligencja podczas widzenia obiektów.
W badaniu przeanalizowano około 5 milionów nieparzystych ocen na podstawie 1854 obrazów obiektów, aby dowiedzieć się, jakie właściwości wizualne i semantyczne preferują ludzie i sztuczna inteligencja. Okazuje się, że ludzie skupiają się na wymiarach związanych ze znaczeniem, takich jak „zwierzęcy” czy „związany z ogniem”, podczas gdy modele AI skupiają się przede wszystkim na cechach wizualnych, takich jak „okrągły” czy „biały”. Zjawisko to nazywa się „preferencjami wizualnymi” i może znacząco wpłynąć na zaufanie do systemów AI, jeśli istnieją różnice w strategiach rozpoznawania obiektów.
Metodologia i wyniki badań
W pracy naukowej wykorzystano wiele głębokich sieci neuronowych (DNN) do rozpoznawania obrazów podobnych do ludzi i określania kluczowych wymiarów obrazów. Porównanie wymiarów ludzi i DNN ujawniło, że chociaż sztuczna inteligencja osiąga przybliżenia tych wymiarów, nie w pełni odpowiada ludzkiemu postrzeganiu. Szczególnie zauważalne było to, że w przypadku wymiarów związanych ze zwierzętami w analizie nie uwzględniono wielu obrazów innych niż zwierzęta, co dodatkowo wpłynęło na wyniki technologii AI.
Naukowcy mają nadzieję, że przyszłe projekty umożliwią bezpośrednie porównanie percepcji człowieka i sztucznej inteligencji, co może doprowadzić do lepszego zrozumienia percepcji sztucznej inteligencji i udoskonalenia samej technologii. Kontakt z prof. dr Martinem Hebartem jest tutaj wspomniany jako możliwość dla osób zainteresowanych dalszymi informacjami na temat tej dziedziny badań.
Zastosowania AI w rozpoznawaniu obrazów
Ustalenia dotyczące różnic w rozpoznawaniu obiektów mają szerokie zastosowanie w różnych obszarach. Sztuczna inteligencja jest często wykorzystywana do wsparcia logistyki, klasyfikacji obrazów czy analizy struktury klientów w e-commerce. W tym kontekście oferty Maszyny, które można uczyć narzędzie do szybkiego i łatwego programowania systemów AI, które umożliwia komputerom rozpoznawanie obrazów, dźwięków czy póz.
Przykładowe zastosowania obejmują wsparcie przy inwentaryzacji lub sortowaniu towarów. Znaczenie danych szkoleniowych jest kluczowe dla wydajności modeli AI. Praktyczny przykład: jeśli w tle sceny treningowej widoczna jest Alexa, sztuczna inteligencja zostaje oszukana i klasyfikuje obraz wyłącznie na podstawie tej obecności, niezależnie od głównego skupienia obrazu.
Przyszłe wyzwania i rozwój
Technologia sztucznej inteligencji, zwłaszcza w zakresie rozpoznawania obrazów, wykazuje ogromny potencjał, ale wiąże się również z wyzwaniami, które należy pokonać. Obawy dotyczące ochrony danych, stronniczość w danych szkoleniowych i potrzeba jasnych ram prawnych to kluczowe kwestie, którymi należy się zająć. Ponadto modele sztucznej inteligencji muszą być odporne na różne warunki, takie jak oświetlenie i hałas, aby skutecznie działać w praktyce.
W miarę ciągłego rozwoju uczenia maszynowego i sieci neuronowych przyszłość rozpoznawania obrazów w oparciu o sztuczną inteligencję pozostaje obiecująca. Firmy mogą odnieść korzyści dzięki optymalizacji procesów i ukierunkowanym strategiom marketingowym, podczas gdy trwają szeroko zakrojone badania nad ulepszeniem możliwości sztucznej inteligencji.