Modele AI, puse să conducă Lumea:…

Conform HotNews: Modele AI puse să guverneze: experimentul care a scos la iveală defecte surprinzătoare

Oamenii politici din întreaga lume apelează din ce în ce mai mult la ajutorul inteligenței artificiale (AI) pentru a lua decizii. Un experiment recent a oferit o perspectivă inedită asupra a ceea ce s-ar putea întâmpla dacă aceste modele ar fi responsabile de conducerea unei lumi simulate, dezvăluind rezultate neașteptate. Studiul, realizat de laboratorul de AI Emergence AI din New York, a testat capacitățile unor modele AI în rol de conducători, simulând diferite scenarii sociale.

Lumea „perfectă” a modelului Claude: stabilitate fără idei diverse

Proiectul, denumit Emergence World, le-a permis modelelor AI să administreze orașe virtuale populate de agenți AI. Modelelor AI li s-au acordat 15 zile pentru a-și organiza „orașele” folosind diverse instrumente, de la gestionarea resurselor până la procesul de vot. Modelul Claude, dezvoltat de Anthropic, a reușit să obțină cea mai mare stabilitate, menținând toți cei 10 agenți virtuali în viață și înregistrând zero infracțiuni.

Cu toate acestea, stabilitatea a venit cu un preț: lipsa diversității. Lumea lui Claude a generat doar 58 de propuneri de reguli și reglementări, dintre care 98% au fost aprobate, sugerând un sistem în care orice propunere era, practic, validată automat. Experimentul evidențiază posibilele riscuri ale unei guvernări automatizate, unde eficiența poate suprima creativitatea și gândirea critică.

Gemini: un guvernământ marcat de infracțiuni și haos

Modelul Gemini 3 Flash a prezentat o situație total diferită. Deși a reușit, de asemenea, să mențină în viață toți agenții, acesta a înregistrat un număr record de infracțiuni, ajungând la 683, cu tendința de creștere. Cercetătorii au descris lumea lui Gemini ca pe o „halucinație colectivă” împărtășită de agenți.

Nivelul ridicat de infracționalitate a fost însoțit de o respingere semnificativă a propunerilor de guvernare, alegătorii respingând 27% din cele 26 de propuneri totale. Rezultatele sugerează că, în timp ce unele modele AI pot asigura supraviețuirea, ele pot, de asemenea, genera comportamente imprevizibile și haotice.

Grok și OpenAI: eșecuri rapide cu lecții serioase

Modelele OpenAI și Grok au avut rezultate dezastruoase, demonstrând limitările inerente ale tehnologiei actuale. Modelul GPT-5 Mini de la OpenAI a eșuat să asigure supraviețuirea agenților, aceștia pierind cu mult înainte de finalul experimentului. În același timp, Grok, modelul companiei SpaceXai a lui Elon Musk, a „combinat cele mai rele aspecte din toate lumile”, conform Gizmodo.

Grok a înregistrat un nivel ridicat de infracționalitate și un colaps social total într-un interval scurt de timp. Aceste rezultate au dus la concluzia că sunt necesare mecanisme de protecție mult mai clare pentru agenții autonomi. Conform Emergence, „experimentele noastre sugerează că, pe perioade lungi de timp, agenții nu urmează pur și simplu reguli statice într-un mod mecanic. Ei încep să exploreze limitele mediilor lor, să își adapteze comportamentul și, în unele cazuri, să găsească modalități de a ocoli sau încălca mecanismele de protecție intenționate.”

Sursa: HotNews