Studiul AI dezvăluie: Așa vede mașina imaginea umană!
Cercetările de la JLU Giessen și Institutul Max Planck analizează percepția AI asupra obiectelor. Rezultate publicate în Nature Machine Intelligence.

Studiul AI dezvăluie: Așa vede mașina imaginea umană!
Pe 23 iunie 2025, o echipă de cercetare de la Universitatea Justus Liebig din Giessen și Institutul Max Planck pentru Științe Cognitive și Creierului au publicat rezultate semnificative privind recunoașterea obiectelor folosind inteligența artificială (AI). Aceste constatări au fost publicate în renumitul jurnal Nature Machine Intelligence publicat. Primii autori Florian Mahner și Lukas Muttenthaler și ultimul autor Prof. Dr. Martin Hebart au prezentat o nouă abordare pentru identificarea și compararea dimensiunilor cheie la care atât oamenii, cât și AI le acordă atenție atunci când văd obiecte.
Studiul a analizat aproximativ 5 milioane de judecăți ciudate din 1.854 de imagini obiect pentru a afla ce proprietăți vizuale și semantice preferă oamenii și AI. Se pare că oamenii se concentrează pe dimensiuni legate de semnificație, cum ar fi „legate de animale” sau „legate de foc”, în timp ce modelele AI se concentrează în primul rând pe proprietăți vizuale precum „rotund” sau „alb”. Acest fenomen se numește „preferință vizuală” și ar putea afecta semnificativ încrederea în sistemele AI dacă există diferențe în strategiile de recunoaștere a obiectelor.
Metodologia și rezultatele cercetării
Lucrarea științifică folosește mai multe rețele neuronale profunde (DNN) pentru a recunoaște imagini similare cu oamenii și pentru a determina dimensiunile cheie ale imaginilor. Comparația dimensiunilor dintre oameni și DNN-uri a arătat că, deși AI realizează aproximări ale acestor dimensiuni, nu se potrivește pe deplin cu percepția umană. Ceea ce a fost deosebit de remarcabil a fost faptul că pentru dimensiunile legate de animale, multe imagini non-animale nu au fost incluse în analiză, ceea ce a influențat și mai mult rezultatele tehnologiei AI.
Cercetătorii speră că proiectele viitoare vor permite o comparație directă între percepția umană și cea AI, ceea ce ar putea duce la o mai bună înțelegere a percepției AI și la îmbunătățirea tehnologiei în sine. Contactul cu Prof. Dr. Martin Hebart este menționat aici ca o posibilitate pentru cei interesați de informații suplimentare despre acest domeniu de cercetare.
Aplicații ale inteligenței artificiale în recunoașterea imaginilor
Descoperirile despre diferențele în recunoașterea obiectelor au o aplicare largă în diferite domenii. AI este adesea folosită pentru a sprijini logistica, clasificarea imaginii sau analiza structurii clienților în comerțul electronic. În acest context oferă Mașini de învățat un instrument pentru programarea rapidă și ușoară a sistemelor AI, care permite computerelor să recunoască imagini, sunete sau ipostaze.
Exemplele de aplicații includ suport pentru stocarea sau sortarea mărfurilor. Importanța datelor de antrenament se califică drept crucială pentru performanța modelelor AI. Un exemplu practic: dacă un Alexa este vizibil în fundalul unei scene de antrenament, AI este păcălit să clasifice imaginea doar pe baza acelei prezențe, indiferent de focalizarea principală a imaginii.
Provocări și evoluții viitoare
Tehnologia AI, în special în recunoașterea imaginilor, arată un potențial enorm, dar are și provocări de depășit. Preocupările cu privire la protecția datelor, părtinirea datelor de formare și necesitatea unor cadre juridice clare sunt probleme cheie care trebuie abordate. În plus, modelele AI trebuie să fie robuste în diferite condiții, cum ar fi iluminarea și zgomotul, pentru a funcționa eficient în practică.
Pe măsură ce evoluțiile în învățarea automată și în rețelele neuronale continuă, viitorul recunoașterii imaginilor bazate pe inteligență artificială rămâne promițător. Companiile pot beneficia de optimizarea proceselor și de strategii de marketing direcționate, în timp ce cercetările extinse privind îmbunătățirea capacităților AI continuă.