miercuri, 24 iunie 2026
OpenAI pregătește Bidi 1, noul mod vocal bidirecțional pentru ChatGPT ▶ Ascultă articolul

OpenAI pregătește Bidi 1, noul mod vocal bidirecțional pentru ChatGPT

✏️ Click pentru a comenta
Publicat: iunie 24, 2026

OpenAI pregătește pentru ChatGPT o schimbare importantă pe partea de voce, utilă pentru oricine folosește asistentul ca să vorbească, să traducă sau să dicteze idei din mers: conversația ar putea deveni mult mai firească. Numele intern al funcției este Bidi 1, abreviere pentru un mod bidirecțional care îi permite asistentului să vorbească, să audă și să asculte în același timp. Semnele au apărut deja în interfața web ChatGPT, iar un grup mic de utilizatori din aplicație a început să vadă funcția înaintea unei posibile lansări. OpenAI nu a anunțat-o oficial încă, dar paginile sale de suport arată clar că vocea a devenit deja o parte tot mai integrată din experiența ChatGPT.

Captură din sistemul vocal actual
În testele descrise de surse internaționale, Bidi 1 apare în selectorul de modele din setări, lângă opțiunile standard și avansate, iar după alegere bula vocală se colorează în galben. Diferența față de modul vocal de azi este tocmai felul în care ține ritmul discuției: răspunde cu aprobări scurte atunci când utilizatorul face o pauză, fără să intre peste el, și poate schimba sarcina pe loc. Dacă îi ceri să numere până la zece și îl oprești la jumătate ca să inverseze numărătoarea, se adaptează imediat. Relatarea mai spune că noul model păstrează firul conversației mai bine decât modul vocal actual, care are ca punct slab tocmai pierderea contextului din dialogurile mai lungi.

Bidi 1 ar păstra și partea mai jucăușă a modului vocal avansat, inclusiv cântatul și beatbox-ul, dar ar avea reguli mai stricte la copyright. Materialul inițial arată că refuză piesele populare, în timp ce încearcă să creeze o variantă originală atunci când i se cere ceva în stilul unui artist ales. Asta spune ceva important despre direcția în care merge OpenAI: nu vrea doar o voce mai naturală, ci și una mai atent controlată, tocmai pentru că într-o conversație reală tentația de a copia tonul sau forma unei melodii apare foarte ușor.

Pe partea oficială, OpenAI a schimbat deja destul de mult vocea din ChatGPT. În notițele de lansare din Help Center, compania spune că vocea a devenit o parte integrată a interfeței, astfel încât poți vorbi, vedea textul și folosi elemente vizuale în aceeași fereastră, fără să intri într-un mod separat. Tot acolo apare și faptul că Advanced Voice a primit îmbunătățiri de intonație, naturalețe și expresivitate, iar pe web a fost adusă pe chatgpt.com pentru abonații plătitori, cu extindere pe mobil și pe Windows. Într-un update ulterior, OpenAI a descris și mai clar direcția: conversația vocală trebuie să fie o parte normală din ChatGPT, nu o funcție izolată pe care o pornești doar ocazional.

Diferența dintre ce există acum și ce ar aduce Bidi 1 se vede și în modelul actual de folosire. În Voice Mode FAQ, OpenAI explică faptul că sesiunile vocale pornesc cu GPT-4o pentru abonați, iar după consumarea minutelor disponibile trec la GPT-4o mini. Utilizatorii Free folosesc GPT-4o mini și au o limită zilnică, iar vocea poate apărea în pagina principală de chat, ca o bulă plutitoare sau într-un mod vocal separat, pe ecran complet. Dacă Bidi 1 chiar ajunge în forma descrisă de TestingCatalog, schimbarea nu ține doar de o voce mai plăcută, ci de faptul că asistentul ar putea să nu mai rupă conversația când utilizatorul vorbește peste el, să nu mai piardă bucăți din discuție și să treacă mai repede de la o sarcină la alta.

Partea de traducere în timp real este importantă și dincolo de ChatGPT. Relatarea inițială spune că această capabilitate ar putea ajunge și în API, iar OpenAI a pregătit deja terenul exact în direcția asta. În mai 2026, compania a lansat GPT-Realtime-2, GPT-Realtime-Translate și GPT-Realtime-Whisper, adică un model vocal care poate duce conversația mai departe în mod natural, un model de traducere live care trece vorbirea din peste 70 de limbi de intrare în 13 limbi de ieșire și un model de transcriere care scrie pe măsură ce cineva vorbește. Ghidul oficial Realtime API merge mai departe și arată scenariile concrete: agenți vocali care ascultă, raționează, vorbesc și folosesc instrumente, sesiuni de traducere live și transcriere în timp real. Pentru dezvoltatori, asta este baza pentru aplicații care pot răspunde mai repede și mai natural decât vechile combinații dintre recunoaștere vocală și sinteză vocală.

Ritmul lansării rămâne însă partea mai puțin clară. Presa internațională vorbește despre o distribuire treptată, pe bază de activare, în web și mobil, și spune că Spațiul Economic European ar putea primi acces mai târziu, dar acest lucru nu este confirmat. În paralel, OpenAI a separat tot mai clar și zona Codex: notele oficiale de produs spun că actualizările Codex vor fi anunțate pe site-ul dedicat dezvoltatorilor, iar pagina oficială Codex îl descrie ca pe un agent de programare care lucrează pe mai multe suprafețe, conectate la contul ChatGPT. Dacă funcția vocală va ajunge și acolo, este de așteptat să fie urmărită ca un upgrade distinct, nu ca o simplă extensie ascunsă printre alte noutăți.

Share știre pe rețele de socializare

Care e părerea ta? Începe discuția despre subiectul „OpenAI pregătește Bidi 1, noul mod vocal bidirecțional pentru ChatGPT”.

Trimiteți un comentariu

☑ Comentariile conforme cu regulile comunității vor fi aprobate în maxim 10 ore. Dacă ai întrebări ce nu au legătură cu acest subiect, te invităm să le adresezi în Grupul Oficial HD Satelit.

Cele mai citite în ultimele 7 zile