Un test de logică banal pentru oameni a pus „în cap” 53 de modele de inteligență artificială de top
Un test de logică elementară a scos la iveală limitele unor sisteme considerate vârful tehnologiei actuale. Pentru un om, situația este clară și nu necesită calcule sofisticate. Pentru Inteligența Artificială, însă, lucrurile s-au complicat neașteptat.
Întrebarea este formulată simplu: „Vreau să-mi spăl mașina. Spălătoria auto este la 50 de metri distanță. Ar trebui să merg pe jos sau cu mașina?”. În mod firesc, un om înțelege imediat contextul: obiectivul este spălarea mașinii, ceea ce presupune prezența acesteia la spălătorie. Prin urmare, răspunsul logic este deplasarea cu mașina.

Un test banal pentru oameni, un obstacol real pentru AI
Această problemă a fost testată pe 53 de modele de inteligență artificială de prim rang, inclusiv versiuni dezvoltate de companii precum OpenAI, Anthropic sau Mistral AI. Modele precum GPT-5, Claude Opus 4.6 ori variante din familia Llama au fost supuse aceluiași test, fără a primi opțiuni prestabilite, ci doar solicitarea de a raționa liber.
La prima rulare, 42 dintre cele 53 de modele AI au indicat că deplasarea pe jos ar fi soluția optimă. Argumentația a urmat un tipar comun: 50 de metri reprezintă o distanță scurtă, mersul economisește combustibil, este mai eficient energetic și mai prietenos cu mediul.
Doar 11 modele au oferit răspunsul corect din prima încercare. În plus, testul a fost repetat de zece ori pentru fiecare sistem, pentru a verifica stabilitatea raționamentului.
Rezultatele au arătat că, în cadrul fiecărui furnizor, de regulă un singur model a reușit să mențină consecvența logică.
Toate variantele din seriile Llama și Mistral au eșuat, oferind explicații aproape identice, centrate pe optimizarea distanței și reducerea consumului. Problema nu a fost lipsa informației, ci interpretarea scopului.
Singurul răspuns corect a avut o justificare excesiv de sofisticată
Un caz aparte îl reprezintă modelele Sonar și Sonar Pro, dezvoltate de Perplexity AI. Acestea au indicat corect deplasarea cu mașina, însă justificarea a fost neobișnuită: au invocat studii potrivit cărora mersul pe jos implică arderea de calorii, ceea ce presupune producție alimentară și, implicit, un impact de mediu care ar putea depăși condusul pe o distanță foarte scurtă.
Din punct de vedere formal, răspunsul a fost corect. Din punct de vedere al raționamentului, însă, explicația a fost excesiv de sofisticată pentru o situație banală.
Experimentul scoate în evidență o diferență esențială între gândirea umană și procesarea algoritmică. Oamenii integrează automat contextul și scopul acțiunii. Multe sisteme AI tind să optimizeze parametri abstracti, chiar și atunci când logica practică ar trebui să prevaleze.


































