Google lansează o nouă versiune a modelului său de inteligență artificială, Gemini 3.1 Flash Live, cu accent pe îmbunătățirea experienței utilizatorilor în interacțiunile vocale

Google lansează o nouă versiune a modelului său de inteligență artificială, Gemini 3.1 Flash Live, cu accent pe îmbunătățirea experienței utilizatorilor în interacțiunile vocale. Noua tehnologie promite răspunsuri mai rapide, conversații mai lungi și o mai bună înțelegere a nuanțelor vorbirii. Funcția de căutare vocală, Search Live, este extinsă în peste 200 de țări, marcând un pas important în integrarea inteligenței artificiale în viața de zi cu zi.

Gemini 3.1 Flash Live: o experiență îmbunătățită

Noul model de inteligență artificială, descris de Google ca fiind „cel mai performant model de voce și audio de până acum”, optimizează două produse principale: Gemini Live, asistentul vocal disponibil pe dispozitivele mobile, și Search Live, funcția de căutare vocală. Gemini 3.1 Flash Live promite o latență mai mică, reducând timpul de așteptare pentru răspunsuri și eliminând pauzele stânjenitoare în conversații. De asemenea, modelul este capabil să mențină contextul conversației pe o perioadă mai lungă, permițând sesiuni extinse de brainstorming.

O altă îmbunătățire notabilă este capacitatea de a recunoaște mai bine nuanțele acustice, cum ar fi tonul, ritmul vorbirii și expresiile de frustrare sau confuzie. Modelul se adaptează dinamic la aceste aspecte, ajustând lungimea și tonul răspunsurilor pentru o interacțiune mai naturală. De asemenea, Gemini 3.1 Flash Live filtrează eficient zgomotul de fond, cum ar fi traficul sau sunetul televizorului, pentru o claritate sporită a conversațiilor.

Extinderea search live și compatibilitatea cu aplicații terțe

Una dintre cele mai vizibile schimbări pentru utilizatori este extinderea funcției Search Live, care permite căutarea prin voce, cu posibilitatea de a utiliza și Google Lens pentru a identifica obiecte prin intermediul camerei telefonului. Această funcție este acum disponibilă în peste 200 de țări și teritorii, în toate limbile și locațiile în care este disponibilă funcția de căutare AI de la Google.

Modelul atinge un scor de 90,8% la testul ComplexFuncBench Audio, ceea ce indică o capacitate sporită de a utiliza instrumente externe, cum ar fi aplicații și funcții, în timpul conversațiilor. Toate conținuturile audio generate de model vor fi marcate cu SynthID, o tehnologie Google care integrează un filigran digital imperceptibil în semnalul audio, pentru a preveni dezinformarea.

Implicarea în mediul de afaceri și actualizarea live translate

Pe lângă îmbunătățirile aduse utilizatorilor obișnuiți, Gemini 3.1 Flash Live este deja folosit de companii precum Verizon și Home Depot pentru centrele de contact cu clienții. Aceste companii folosesc modelul pentru a oferi asistență clienților, demonstrând potențialul său în diferite domenii.

Totodată, Google a extins funcția Live Translate, care traduce conversațiile în timp real prin intermediul căștilor, pe platforma iOS. Funcția suportă peste 70 de limbi și este acum disponibilă în Franța, Germania, Italia, Japonia, Spania, Thailanda și Regatul Unit, fiind compatibilă cu orice căști standard.

Oana Badea

Autor

Lasa un comentariu

Ultima verificare: azi, ora 07:58