AI tyrimas atskleidžia: štai kaip mašina mato žmogaus vaizdą!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

JLU Giessen ir Max Planck instituto tyrimai analizuoja AI objektų suvokimą. Rezultatai paskelbti Nature Machine Intelligence.

Forschung der JLU Gießen und Max-Planck-Institut analysiert KI-Wahrnehmung von Objekten. Ergebnisse in Nature Machine Intelligence veröffentlicht.
JLU Giessen ir Max Planck instituto tyrimai analizuoja AI objektų suvokimą. Rezultatai paskelbti Nature Machine Intelligence.

AI tyrimas atskleidžia: štai kaip mašina mato žmogaus vaizdą!

2025 m. birželio 23 d. Giesseno Justo Liebigo universiteto ir Maxo Plancko pažinimo ir smegenų mokslų instituto tyrimų grupė paskelbė reikšmingų objektų atpažinimo naudojant dirbtinį intelektą (AI) rezultatus. Šios išvados buvo paskelbtos žinomame žurnale Gamtos mašinos intelektas paskelbta. Pirmieji autoriai Florianas Mahneris ir Lukas Muttenthaleris bei paskutinis autorius prof. dr. Martinas Hebartas pristatė naują požiūrį, kaip nustatyti ir lyginti pagrindinius matmenis, į kuriuos tiek žmonės, tiek dirbtinis intelektas atkreipia dėmesį matydami objektus.

Tyrimo metu buvo išanalizuota apie 5 milijonai keistų sprendimų iš 1854 objektų vaizdų, siekiant išsiaiškinti, kurioms vaizdinėms ir semantinėms savybėms žmonėms ir dirbtiniu intelektu labiau patinka. Paaiškėjo, kad žmonės sutelkia dėmesį į su prasme susijusius aspektus, pvz., „susijusius su gyvūnais“ arba „su ugnimi“, o AI modeliai daugiausia dėmesio skiria vizualinėms savybėms, tokioms kaip „apvalus“ arba „baltas“. Šis reiškinys vadinamas „vaizdine pirmenybe“ ir gali reikšmingai paveikti pasitikėjimą dirbtinio intelekto sistemomis, jei objektų atpažinimo strategijos skiriasi.

Tyrimo metodika ir rezultatai

Moksliniame darbe naudojami keli gilieji neuroniniai tinklai (DNN), kad atpažintų į žmones panašius vaizdus ir nustatytų pagrindinius vaizdų matmenis. Žmonių ir DNN matmenų palyginimas atskleidė, kad nors AI pasiekia šių matmenų apytikslius duomenis, jis nevisiškai atitinka žmogaus suvokimą. Ypač pastebėta buvo tai, kad su gyvūnais susijusių matmenų atveju į analizę nebuvo įtraukta daug vaizdų, nesusijusių su gyvūnais, o tai dar labiau paveikė AI technologijos rezultatus.

Tyrėjai tikisi, kad būsimi projektai leis tiesiogiai palyginti žmogaus ir AI suvokimą, o tai padės geriau suprasti AI suvokimą ir patobulinti pačią technologiją. Susisiekimas su prof. dr. Martinu Hebartu čia minimas kaip galimybė tiems, kurie domisi daugiau informacijos apie šią tyrimų sritį.

AI taikymas vaizdų atpažinimui

Išvados apie objektų atpažinimo skirtumus plačiai taikomos įvairiose srityse. Dirbtinis intelektas dažnai naudojamas palaikyti logistiką, vaizdų klasifikavimą ar klientų struktūros analizę elektroninėje prekyboje. Šiame kontekste siūlo Mokomosios mašinos greito ir paprasto AI sistemų programavimo įrankis, leidžiantis kompiuteriams atpažinti vaizdus, ​​garsus ar pozas.

Programų pavyzdžiai apima atsargų ar prekių rūšiavimo palaikymą. Mokymo duomenų svarba yra labai svarbi AI modelių veikimui. Praktinis pavyzdys: jei „Alexa“ matoma treniruočių scenos fone, dirbtinis intelektas yra apgaudinėjamas klasifikuojant vaizdą pagal tik tą buvimą, neatsižvelgiant į pagrindinį vaizdo fokusą.

Ateities iššūkiai ir pokyčiai

AI technologija, ypač vaizdų atpažinimo srityje, rodo didžiulį potencialą, bet taip pat turi įveikti iššūkius. Susirūpinimas dėl duomenų apsaugos, mokymo duomenų šališkumas ir aiškios teisinės sistemos poreikis yra pagrindiniai klausimai, kuriuos reikia spręsti. Be to, dirbtinio intelekto modeliai turi būti atsparūs įvairioms sąlygoms, tokioms kaip apšvietimas ir triukšmas, kad praktiškai veiktų efektyviai.

Tobulėjant mašinų mokymuisi ir neuroniniams tinklams, dirbtinio intelekto vaizdų atpažinimo ateitis išlieka šviesi. Įmonės gali gauti naudos optimizuodamos procesus ir taikydamos tikslines rinkodaros strategijas, o toliau tęsiami išsamūs AI galimybių tobulinimo tyrimai.