Studie AI odhaluje: Takto stroj vidí lidský obraz!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Výzkum JLU Giessen a Institutu Maxe Plancka analyzuje vnímání objektů pomocí umělé inteligence. Výsledky publikované v Nature Machine Intelligence.

Forschung der JLU Gießen und Max-Planck-Institut analysiert KI-Wahrnehmung von Objekten. Ergebnisse in Nature Machine Intelligence veröffentlicht.
Výzkum JLU Giessen a Institutu Maxe Plancka analyzuje vnímání objektů pomocí umělé inteligence. Výsledky publikované v Nature Machine Intelligence.

Studie AI odhaluje: Takto stroj vidí lidský obraz!

Dne 23. června 2025 zveřejnil výzkumný tým z Justus Liebig University Giessen a Institutu Maxe Plancka pro kognitivní a mozkové vědy významné výsledky o rozpoznávání objektů pomocí umělé inteligence (AI). Tyto poznatky byly publikovány v renomovaném časopise Inteligence přírodních strojů zveřejněno. První autoři Florian Mahner a Lukas Muttenthaler a poslední autor prof. Dr. Martin Hebart představili nový přístup k identifikaci a porovnávání klíčových dimenzí, kterým lidé i AI věnují pozornost při vidění objektů.

Studie analyzovala přibližně 5 milionů lichých-jedna-out úsudků z 1854 obrázků objektů, aby zjistila, které vizuální a sémantické vlastnosti lidé a AI preferují. Ukazuje se, že lidé se zaměřují na dimenze související s významem, jako je „související se zvířaty“ nebo „související s ohněm“, zatímco modely AI se primárně zaměřují na vizuální vlastnosti, jako je „kulatý“ nebo „bílý“. Tento jev se nazývá „vizuální preference“ a mohl by významně ovlivnit důvěru v systémy AI, pokud existují rozdíly ve strategiích rozpoznávání objektů.

Metodika a výsledky výzkumu

Vědecká práce využívá několik hlubokých neuronových sítí (DNN) k rozpoznání obrázků podobných lidem a určení klíčových rozměrů obrázků. Srovnání dimenzí mezi lidmi a DNN odhalilo, že i když AI dosahuje aproximace těchto dimenzí, plně neodpovídá lidskému vnímání. Pozoruhodné bylo zejména to, že u rozměrů souvisejících se zvířaty nebylo do analýzy zahrnuto mnoho snímků, které nejsou zvířecími, což dále ovlivnilo výsledky technologie AI.

Vědci doufají, že budoucí projekty umožní přímé srovnání mezi lidským a AI vnímáním, což by mohlo vést k lepšímu pochopení vnímání AI a zlepšení samotné technologie. Kontakt s prof. Dr. Martinem Hebartem je zde uveden jako možnost pro zájemce o další informace o této oblasti výzkumu.

Aplikace AI v rozpoznávání obrazu

Poznatky o rozdílech v rozpoznávání objektů mají široké uplatnění v různých oblastech. Umělá inteligence se často používá k podpoře logistiky, klasifikace obrázků nebo analýzy struktury zákazníků v e-commerce. V této souvislosti nabízí Naučitelné stroje nástroj pro rychlé a snadné programování systémů AI, který umožňuje počítačům rozpoznávat obrázky, zvuky nebo pózy.

Příklady aplikací zahrnují podporu při inventarizaci nebo třídění zboží. Důležitost trénovacích dat se kvalifikuje jako klíčová pro výkon modelů AI. Praktický příklad: Pokud je Alexa viditelná na pozadí tréninkové scény, umělá inteligence je oklamána, aby klasifikovala obrázek pouze na základě této přítomnosti, bez ohledu na primární zaměření obrázku.

Budoucí výzvy a vývoj

Technologie umělé inteligence, zejména v oblasti rozpoznávání obrazu, ukazuje obrovský potenciál, ale také musí překonat výzvy. Klíčovými otázkami, které je třeba řešit, jsou obavy z ochrany údajů, zkreslení údajů o školení a potřeba jasných právních rámců. Aby modely AI v praxi efektivně fungovaly, musí být navíc odolné vůči různým podmínkám, jako je osvětlení a hluk.

Vzhledem k tomu, že vývoj v oblasti strojového učení a neuronových sítí pokračuje, budoucnost rozpoznávání obrázků pomocí umělé inteligence zůstává jasná. Společnosti mohou těžit z optimalizace procesů a cílených marketingových strategií, zatímco rozsáhlý výzkum zlepšování schopností umělé inteligence pokračuje.