Google a anunțat Gemini 3.5 Live Translate, un model audio de inteligență artificială care traduce aproape în timp real în peste 70 de limbi și care va ajunge în Google Translate și Google Meet. Schimbarea contează fiindcă face traducerea vocală mai rapidă, mai naturală și mai ușor de folosit pe telefon ori în întâlniri online.
![]() |
| Google aduce traduceri vocale aproape în timp real în Translate și Meet (imagine generată digital) |
Google spune că noul model detectează automat peste 70 de limbi și generează o voce tradusă care păstrează intonația și ritmul vorbitorului. Diferența importantă față de sistemele clasice este că nu mai așteaptă ca vorbitorul să termine fraza pentru a răspunde, ci produce traducerea continuu. Modelul este prezentat ca un sistem audio la audio, optimizat pentru traduceri vocale cu latență mică și cu ieșire vocală naturală. Ar fi interesant de testat pe canale tv în altă limbă, să vedem cum traducemm.
În Google Meet, actualizarea mută traducerea vocală de la cele 5 limbi suportate anterior la peste 70 de limbi și la mai mult de 2.000 de combinații lingvistice într-o singură întâlnire. Google spune și că va simplifica interfața, astfel încât funcția de traducere să fie mai ușor de accesat direct din platforma de videoconferințe. Lansarea începe în această lună pentru clienți selectați Workspace, printr-un private preview, iar extinderea mai largă este programată pentru mai târziu în acest an.
Pe partea de Google Translate, modelul va fi disponibil pe Android și iOS, iar Google îl leagă de funcția Live translate din aplicație. În prezent, pagina de ajutor Google Translate arată că Live translate poate fi folosit cu sau fără căști pe telefon sau tabletă și listează multe limbi suportate, inclusiv româna. Noutatea adusă pentru Android este un listening mode prin difuzorul de apeluri, astfel încât utilizatorul poate asculta traducerea direct prin receptor, ca la un apel obișnuit, fără să aibă neapărat căștile la îndemână.
Pentru dezvoltatori, Google a deschis Gemini 3.5 Live Translate în preview prin Gemini Live API și Google AI Studio, iar model card-ul oficial îl descrie ca un model bazat pe Gemini 3 Pro, cu intrare audio și ieșire audio plus text. Documentația tehnică menționează un context audio de până la 128K tokeni, un output de până la 64K tokeni și faptul că modelul este evaluat după calitatea traducerii, latență și naturalețea vocii. Tot acolo apar și limitele obișnuite pentru astfel de sisteme: pot exista variații de voce, pot apărea dificultăți la accente, la limbi asemănătoare sau la treceri rapide între mai multe limbi.
Google insistă și pe partea de verificare a conținutului generat: tot sunetul produs de modelele companiei este marcat cu SynthID, un marcaj imperceptibil introdus direct în fișierul audio. Pagina oficială despre SynthID arată că acest tip de watermark rămâne detectabil chiar dacă materialul este distribuit sau trecut prin diverse transformări, iar Google a extins tehnologia dincolo de imagine, către text, audio și video. În practică, asta ar trebui să ajute la identificarea mai clară a conținutului generat de AI, exact zona în care traducerile vocale automate pot ridica întrebări dacă nu sunt etichetate corect.
Surse: Google lansează Gemini 3.5 Live Translate, model audio pentru traduceri vocale fluide, Google Workspace: traducerea vocală din Meet primește Gemini 3.5 Live Translate, Google Translate: traducerea live cu sau fără căști pe Android,
Care e părerea ta? Începe discuția despre subiectul „Google aduce Gemini 3.5 Live Translate în Translate și Meet”.
Trimiteți un comentariu
☑ Comentariile conforme cu regulile comunității vor fi aprobate în maxim 10 ore. Dacă ai întrebări ce nu au legătură cu acest subiect, te invităm să le adresezi în Grupul Oficial HD Satelit.