Google, acuzată: IA livrează milioane de răspunsuri false, zilnic

Inteligența artificială a gigantului Google, verificată: 1 din 10 răspunsuri sunt eronate

Un studiu recent a scos la iveală deficiențe importante în funcționarea funcției AI Overviews a motorului de căutare Google, care folosește inteligența artificială (IA) pentru a genera răspunsuri automate. Experimentul, realizat de publicația americană The New York Times în colaborare cu startup-ul de IA Oumi, arată că, deși IA oferă răspunsuri corecte în aproximativ 90% din cazuri, cel puțin 1 din 10 răspunsuri este eronat.

Având în vedere volumul impresionant de căutări efectuate zilnic, se poate vorbi de milioane de răspunsuri false generate de această funcție în fiecare oră. Experimentul a presupus testarea capacităților AI Overviews cu ajutorul SimpleQA, un set standard de teste pentru modelele de inteligență artificială, dezvoltat de OpenAI. Testele inițiale au fost efectuate anul trecut, când funcția folosea modelul Gemini 2.5, iar acuratețea era de 85%.

Google răspunde criticilor, dar recunoaște erorile

După actualizarea la modelul Gemini 3, precizia s-a îmbunătățit ușor, ajungând la 91%. Cu toate acestea, extrapolând rata de eroare la numărul total de căutări, rezultă cifre alarmante. Reprezentanții Google au criticat metodologiile studiului, argumentând că testul SimpleQA ar putea conține inexactități. Compania folosește propriul sistem de testare, SimpleQA Verified, care se bazează pe un eșantion mai mic, dar verificat mai atent.

Purtătorul de cuvânt al Google, Ned Adrians, a declarat că studiul are „lacune serioase” și nu reflectă cu exactitate modul în care utilizatorii interacționează cu motorul de căutare. Cu toate acestea, Google recunoaște limitările IA și, deși contestă rezultatele experimentului, include o avertizare la finalul fiecărui răspuns generat de AI Overviews: „IA poate greși, așa că verificați încă o dată”.

Impactul asupra utilizatorilor și provocările IA

Evaluarea acurateții inteligenței artificiale rămâne o provocare complexă, fiecare companie având propriile metode de validare a performanțelor. Un aspect important este că modelele de IA pot genera răspunsuri diferite la aceeași întrebare, îngreunând procesul de verificare. AI Overviews nu este singurul model utilizat de Google, sistemul alegând „cel mai relevant” răspuns pentru fiecare interogare.

Modelele Gemini 3.1 Pro ar putea oferi răspunsuri mai precise, dar sunt considerate mai lente și mai costisitoare, motiv pentru care se folosesc mai des modelele Gemini Flash. În ciuda acestor aspecte, acuratețea de 90% a IA este considerată un rezultat bun în industrie. Problema majoră rămâne încrederea utilizatorilor în informațiile furnizate de inteligența artificială, aceștia neglijând adesea să verifice datele la sursele originale.

În contextul actual, utilizatorii trebuie să fie conștienți de posibilitatea ca informațiile primite de la AI să fie inexacte și să verifice întotdeauna sursele.

Oana Badea

Autor

Lasa un comentariu

Ultima verificare: azi, ora 17:13