AI pētījums atklāj: šādi mašīna redz cilvēka attēlu!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

JLU Gīsenes un Maksa Planka institūta pētījumi analizē objektu AI uztveri. Rezultāti publicēti Nature Machine Intelligence.

Forschung der JLU Gießen und Max-Planck-Institut analysiert KI-Wahrnehmung von Objekten. Ergebnisse in Nature Machine Intelligence veröffentlicht.
JLU Gīsenes un Maksa Planka institūta pētījumi analizē objektu AI uztveri. Rezultāti publicēti Nature Machine Intelligence.

AI pētījums atklāj: šādi mašīna redz cilvēka attēlu!

2025. gada 23. jūnijā pētnieku grupa no Justusa Lībiga universitātes Gīsenes un Maksa Planka Kognitīvo un smadzeņu zinātņu institūta publicēja nozīmīgus rezultātus par objektu atpazīšanu, izmantojot mākslīgo intelektu (AI). Šie atklājumi tika publicēti slavenajā žurnālā Dabas mašīnu inteliģence publicēts. Pirmie autori Florians Māners un Lukass Mutentālers, kā arī pēdējais autors prof. Dr. Martins Hebarts iepazīstināja ar jaunu pieeju galveno dimensiju noteikšanai un salīdzināšanai, kurām gan cilvēki, gan mākslīgais intelekts pievērš uzmanību, redzot objektus.

Pētījumā tika analizēti aptuveni 5 miljoni nepāra vienreizēju spriedumu no 1854 objektu attēliem, lai noskaidrotu, kurām vizuālajām un semantiskajām īpašībām cilvēki un AI dod priekšroku. Izrādās, ka cilvēki koncentrējas uz dimensijām, kas saistītas ar nozīmi, piemēram, "saistīts ar dzīvniekiem" vai "saistīts ar uguni", savukārt AI modeļi galvenokārt koncentrējas uz vizuālajām īpašībām, piemēram, "apaļš" vai "balts". Šo parādību sauc par "vizuālo izvēli", un tā var būtiski ietekmēt uzticēšanos AI sistēmām, ja objektu atpazīšanas stratēģijās ir atšķirības.

Pētījuma metodoloģija un rezultāti

Zinātniskajā darbā tiek izmantoti vairāki dziļi neironu tīkli (DNN), lai atpazītu attēlus, kas līdzīgi cilvēkiem, un noteiktu attēlu galvenos izmērus. Cilvēku un DNN izmēru salīdzinājums atklāja, ka, lai gan AI sasniedz tuvinājumus šīm dimensijām, tas pilnībā neatbilst cilvēka uztverei. Īpaši pamanāms bija tas, ka ar dzīvniekiem saistītiem izmēriem analīzē netika iekļauti daudzi attēli, kas nav saistīti ar dzīvniekiem, kas vēl vairāk ietekmēja AI tehnoloģijas rezultātus.

Pētnieki cer, ka turpmākie projekti ļaus tieši salīdzināt cilvēka un AI uztveri, kas varētu radīt labāku izpratni par AI uztveri un pašas tehnoloģijas uzlabošanu. Šeit ir minēta saziņa ar prof. Dr. Martinu Hebartu kā iespēja tiem, kurus interesē papildu informācija par šo pētījumu jomu.

AI pielietojumi attēlu atpazīšanā

Atzinumi par objektu atpazīšanas atšķirībām ir plaši pielietojami dažādās jomās. AI bieži izmanto, lai atbalstītu loģistiku, attēlu klasifikāciju vai klientu struktūras analīzi e-komercijā. Šajā kontekstā piedāvā Mācāmās mašīnas rīks ātrai un vienkāršai AI sistēmu programmēšanai, kas ļauj datoriem atpazīt attēlus, skaņas vai pozas.

Lietojumprogrammu piemēri ietver atbalstu ar inventāru vai preču šķirošanu. Apmācības datu nozīme ir izšķiroša AI modeļu veiktspējai. Praktisks piemērs: ja treniņa ainas fonā ir redzama Alexa, mākslīgais intelekts tiek pievilts klasificēt attēlu, pamatojoties tikai uz šo klātbūtni, neatkarīgi no attēla galvenā fokusa.

Nākotnes izaicinājumi un attīstība

AI tehnoloģijai, jo īpaši attēlu atpazīšanai, ir milzīgs potenciāls, taču tai ir arī jāpārvar izaicinājumi. Galvenās problēmas, kas jārisina, ir bažas par datu aizsardzību, neobjektivitāte apmācību datos un skaidra tiesiskā regulējuma nepieciešamība. Turklāt AI modeļiem ir jābūt izturīgiem pret dažādiem apstākļiem, piemēram, apgaismojumu un troksni, lai praksē darbotos efektīvi.

Turpinoties mašīnmācības un neironu tīklu attīstībai, ar AI darbināmās attēlu atpazīšanas nākotne joprojām ir gaiša. Uzņēmumi var gūt labumu no procesu optimizācijas un mērķtiecīgām mārketinga stratēģijām, kamēr turpinās plaši pētījumi par AI iespēju uzlabošanu.