Štúdia AI odhaľuje: Takto stroj vidí ľudský obraz!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Výskum JLU Giessen a Inštitútu Maxa Plancka analyzuje vnímanie objektov umelou inteligenciou. Výsledky publikované v Nature Machine Intelligence.

Forschung der JLU Gießen und Max-Planck-Institut analysiert KI-Wahrnehmung von Objekten. Ergebnisse in Nature Machine Intelligence veröffentlicht.
Výskum JLU Giessen a Inštitútu Maxa Plancka analyzuje vnímanie objektov umelou inteligenciou. Výsledky publikované v Nature Machine Intelligence.

Štúdia AI odhaľuje: Takto stroj vidí ľudský obraz!

Výskumný tím z Justus Liebig University Giessen a Inštitút Maxa Plancka pre kognitívne a mozgové vedy zverejnili 23. júna 2025 významné výsledky o rozpoznávaní objektov pomocou umelej inteligencie (AI). Tieto zistenia boli publikované v renomovanom časopise Inteligencia prírodných strojov zverejnené. Prví autori Florian Mahner a Lukas Muttenthaler a posledný autor prof. Dr. Martin Hebart predstavili nový prístup k identifikácii a porovnávaniu kľúčových dimenzií, ktorým ľudia aj AI venujú pozornosť pri videní predmetov.

Štúdia analyzovala približne 5 miliónov úsudkov z 1 854 obrázkov objektov, aby zistila, ktoré vizuálne a sémantické vlastnosti ľudia a AI preferujú. Ukazuje sa, že ľudia sa zameriavajú na dimenzie súvisiace s významom, ako napríklad „súvisiace so zvieratami“ alebo „súvisiace s ohňom“, zatiaľ čo modely AI sa primárne zameriavajú na vizuálne vlastnosti, ako sú „okrúhle“ alebo „biele“. Tento jav sa nazýva „vizuálne preferencie“ a mohol by výrazne ovplyvniť dôveru v systémy AI, ak existujú rozdiely v stratégiách rozpoznávania objektov.

Metodika a výsledky výskumu

Vedecká práca využíva viaceré hlboké neurónové siete (DNN) na rozpoznanie obrázkov podobných ľuďom a určenie kľúčových rozmerov obrázkov. Porovnanie dimenzií medzi ľuďmi a DNN odhalilo, že hoci AI dosahuje aproximácie k týmto dimenziám, úplne nezodpovedá ľudskému vnímaniu. Pozoruhodné bolo najmä to, že v prípade rozmerov súvisiacich so zvieratami nebolo do analýzy zahrnutých veľa obrázkov, ktoré nie sú zvieracími, čo ďalej ovplyvnilo výsledky technológie AI.

Vedci dúfajú, že budúce projekty umožnia priame porovnanie medzi vnímaním človeka a AI, čo by mohlo viesť k lepšiemu pochopeniu vnímania AI a zlepšeniu samotnej technológie. Kontakt s prof. Dr. Martinom Hebartom je tu uvedený ako možnosť pre záujemcov o ďalšie informácie o tejto oblasti výskumu.

Aplikácie AI pri rozpoznávaní obrazu

Zistenia o rozdieloch v rozpoznávaní objektov majú široké uplatnenie v rôznych oblastiach. Umelá inteligencia sa často používa na podporu logistiky, klasifikácie obrázkov alebo analýzy štruktúry zákazníkov v elektronickom obchode. V tejto súvislosti ponúka Učiteľné stroje nástroj na rýchle a jednoduché programovanie systémov AI, ktorý počítačom umožňuje rozpoznávať obrázky, zvuky alebo pózy.

Príklady aplikácií zahŕňajú podporu pri inventarizácii alebo triedení tovaru. Dôležitosť tréningových údajov sa kvalifikuje ako rozhodujúca pre výkon modelov AI. Praktický príklad: Ak je Alexa viditeľná na pozadí tréningovej scény, AI ​​je oklamaná, aby klasifikovala obrázok výlučne na základe tejto prítomnosti, bez ohľadu na primárne zameranie obrázka.

Budúce výzvy a vývoj

Technológia AI, najmä v oblasti rozpoznávania obrázkov, ukazuje obrovský potenciál, ale má aj výzvy, ktoré treba prekonať. Kľúčovými problémami, ktoré je potrebné riešiť, sú obavy z ochrany údajov, zaujatosť údajov o odbornej príprave a potreba jasných právnych rámcov. Okrem toho modely AI musia byť odolné voči rôznym podmienkam, ako je osvetlenie a hluk, aby v praxi fungovali efektívne.

Keďže vývoj v oblasti strojového učenia a neurónových sietí pokračuje, budúcnosť rozpoznávania obrázkov pomocou AI zostáva sľubná. Spoločnosti môžu profitovať z optimalizácie procesov a cielených marketingových stratégií, pričom pokračuje rozsiahly výskum zlepšovania schopností AI.