NVIDIA a folosit scena GTC Taipei, la Computex, în Taipei, pentru a arăta cum vede următoarea etapă a inteligenței artificiale: nu doar modele care răspund la întrebări, ci agenți AI care pot lucra efectiv, pot folosi programe, pot gestiona date și pot rula pe centre de date, PC-uri, mașini autonome și roboți. Jensen Huang, fondatorul și CEO-ul companiei, a legat aproape toate anunțurile de aceeași idee: AI-ul util a ajuns într-un punct în care nu mai este doar o demonstrație spectaculoasă, ci începe să schimbe felul în care se construiesc computerele, fabricile digitale și chiar dispozitivele personale.
| Jensen Huang, fondatorul și CEO-ul companiei - Sursa: YouTube |
Huang a vorbit despre Taiwan ca despre locul de unde pornește o mare parte din lanțul de producție NVIDIA, de la cipuri și servere până la centre de date și produse folosite de clienți finali. A amintit că evenimentul era urmărit live și în alte 70 de locuri din Taiwan, semn al ecosistemului mare construit în jurul companiei. Pentru NVIDIA, Taiwan nu mai este doar un punct de asamblare sau fabricație, ci una dintre piesele centrale ale industriei AI globale.
Ideea principală a fost că AI-ul a intrat în etapa agenților. Dacă primele valuri au fost despre generarea de text, imagini sau cod, noua etapă este despre sisteme care primesc o cerință, înțeleg ce trebuie făcut, își fac un plan, folosesc instrumente și duc sarcina până la capăt. Huang a dat ca exemplu programarea, unul dintre domeniile unde agenții AI au prins deja viteză. Pe GitHub, numărul de commit-uri a crescut de la aproximativ 300 de milioane în 2023 la 400 de milioane în 2024 și 500 de milioane în 2025, iar în primele luni din 2026 ar fi fost aproape triplu față de ritmul anterior.
Din acest exemplu, NVIDIA trage o concluzie economică simplă: dacă aceiași programatori pot produce mai mult cu ajutorul AI, cererea pentru astfel de profesioniști nu scade neapărat. Huang a spus că în lume există aproximativ 30-40 de milioane de programatori profesioniști, iar munca lor ar reprezenta cam 3 trilioane de dolari în salarii pe an. Dacă productivitatea lor crește de trei ori, compania vede aici nu doar o economie de costuri, ci o creștere a valorii produse. Altfel spus, AI-ul nu este prezentat ca un înlocuitor simplu pentru oameni, ci ca un multiplicator al muncii lor. Evident, aceasta este perspectiva NVIDIA, dar ea explică de ce compania investește atât de mult în infrastructura pentru agenți.
Un agent AI, în descrierea prezentată pe scenă, nu este doar un model lingvistic mare. Modelul este partea care raționează, dar agentul complet are nevoie de un strat care îl coordonează, de memorie pe termen scurt și lung, de acces la instrumente și de un mediu de rulare. Poate deschide un browser, poate folosi o foaie de calcul, poate accesa o bază de date, poate rula cod sau poate apela biblioteci specializate. În loc să deschizi manual aplicații, să apeși butoane și să tastezi comenzi pas cu pas, explici ce vrei, iar agentul încearcă să transforme intenția într-un rezultat.
Demonstrațiile au fost alese ca să fie ușor de înțeles. Un prompt a generat cod și apoi un rezultat vizual. Altul a cerut un GIF cu puncte verzi pe fundal negru, care formează clădirea Taipei 101, afișează NVLink GTC Taipei 2026 și apoi se transformă în sigla NVIDIA. Un alt exemplu a pornit de la o piesă lipsă pentru capacul bateriei unei telecomenzi: agentul a primit o descriere și a creat un fișier CAD pregătit pentru imprimare 3D. Nu este vorba doar de chat, ci de folosirea unor programe reale pentru a produce ceva concret.
Aici intră în joc bibliotecile CUDA-X, pe care Huang le-a numit una dintre comorile NVIDIA. CUDA a fost lansată acum aproximativ 20 de ani ca arhitectură pentru calcul accelerat, iar de atunci compania a construit o colecție mare de biblioteci pentru știință, inginerie, optimizare, genomics, telecomunicații și simulări fizice. În noua logică, aceste biblioteci devin instrumente pe care agenții le pot folosi. Un agent ar putea apela cuLitho pentru litografie computațională, cuOpt pentru optimizare, PhysicsNeMo pentru fizică diferențiabilă, AI-Q pentru cercetare în documente structurate și nestructurate sau Parabricks pentru genomics. Practic, software-ul specializat nu dispare, ci devine mai important, fiindcă agenții au nevoie de instrumente bune.
Pentru centrele de date, acest nou model schimbă tot. Un agent nu rulează ca o aplicație veche, într-un singur program, pe un singur tip de procesor. Unele părți rulează pe GPU-uri, altele pe CPU-uri, unele cer acces rapid la memorie, altele au nevoie de rețea, stocare și securitate. Când agentul procesează informații, raționează sau creează un plan, poate activa rack-uri întregi de GPU-uri. Când folosește un instrument, intră în scenă CPU-ul. Când gestionează date sensibile sau separă clienți diferiți într-un centru de date, intră în scenă procesoarele de securitate și rețea, precum BlueField.
Memoria devine una dintre cele mai grele probleme. Agenții trebuie să știe ce păstrează temporar, ce recuperează din trecut, cum comprimă informația și cum caută atât în date structurate, cât și în documente libere. Asta înseamnă că și stocarea trebuie reconcepută pentru AI, nu doar viteza brută a GPU-urilor. Din acest motiv, NVIDIA insistă că Vera Rubin nu este un singur cip, ci o platformă completă.
Vera Rubin a fost prezentată ca sistemul construit pentru AI agentic. Platforma include rack-uri Vera Rubin NVL72, rack-uri cu CPU-uri Vera, acceleratoare Groq LPX, stocare Vera BlueField-4 STX și rețea Spectrum-X Ethernet Photonics. NVIDIA spune că toate aceste elemente lucrează împreună ca un supercomputer uriaș pentru agenți AI, nu ca piese separate puse una lângă alta. Compania a anunțat că Vera Rubin intră în producție la scară mare, cu ajutorul partenerilor din Taiwan și din lanțul global de aprovizionare.
Detaliile tehnice au fost numeroase, dar ideea de bază e simplă: NVIDIA nu mai vrea să fie văzută doar ca firmă de GPU-uri, nici măcar doar ca firmă de sisteme, ci ca firmă de infrastructură AI. Vera Rubin este construită pentru fabrici AI, adică centre de date în care calculul devine produsul principal. Dacă fiecare token generat poate fi monetizat, atunci performanța per watt, timpul până la primul token și fiabilitatea nu sunt detalii tehnice de laborator, ci elemente care influențează direct veniturile.
Huang a explicat că o fabrică AI de un gigawatt poate ajunge la investiții de zeci de miliarde de dolari, iar în viitor ar putea urca spre 80-100 de miliarde de dolari pe gigawatt. La asemenea sume, infrastructura trebuie să pornească repede, să funcționeze stabil și să rămână utilă mult timp. O arhitectură mai ieftină la achiziție nu ajută prea mult dacă produce mai puțini tokeni pe watt sau dacă îmbătrânește mai repede din cauza schimbărilor software. Aici NVIDIA mizează pe ecosistemul CUDA și pe integrarea completă a hardware-ului cu software-ul.
Pentru aceste fabrici AI, compania a prezentat DSX, un fel de set de reguli, simulări și software pentru proiectarea, construirea și operarea infrastructurii. DSX Sim permite testarea fabricii într-un geamăn digital înainte ca rack-urile să fie comandate. DSX OS se ocupă de provizionare, monitorizare, automatizare și operare multi-client. DSX MaxLPS urmărește folosirea mai eficientă a energiei, cu răcire lichidă la 45 de grade Celsius și optimizări care pot permite, potrivit NVIDIA, rularea cu până la 40% mai multe GPU-uri în același buget de putere. DSX Flex conectează fabricile AI la semnale venite din rețeaua electrică, astfel încât acestea să poată reduce sau adapta consumul când rețeaua are nevoie de flexibilitate.
Un alt mesaj important a fost că Taiwanul este adânc integrat în producția Vera Rubin. Prezentarea a vorbit despre TSMC, proces de 3 nanometri, ambalare avansată CoWoS, memorie HBM4 de la Micron, SK Hynix și Samsung, plus peste 150 de parteneri din Taiwan. Un rack Vera Rubin NVL72 include 18 tăvi de calcul, nouă tăvi NVLink interschimbabile la cald și bare de alimentare cu răcire lichidă care duc peste 5.000 de amperi. Un ansamblu MGX de generația a treia ajunge la aproximativ 1,3 milioane de componente. În loc de cabluri și furtunuri complicate, NVIDIA pune accent pe un design modular, cu mai puține intervenții manuale și asamblare mult mai rapidă.
În prezentare, Huang a spus că ceea ce dura două ore la asamblarea unui rack Grace Blackwell poate dura acum cinci minute în cazul Vera Rubin. Asta contează enorm când cererea pentru infrastructură AI este atât de mare, iar producția trebuie scalată rapid. Microsoft, Dell și CoreWeave au fost menționate printre companiile care au deja rack-uri inginerești Vera Rubin NVL72.
Vera CPU este o altă piesă centrală. NVIDIA spune că procesoarele tradiționale au fost create pentru oameni, care lucrează într-un ritm măsurat în secunde. Agenții AI, în schimb, au nevoie de răspunsuri în nanosecunde, fiindcă orice întârziere în folosirea unui instrument, accesarea unei baze de date sau rularea unui cod ține GPU-ul în așteptare. Iar într-o fabrică AI, GPU-ul este partea cea mai scumpă și mai valoroasă.
Vera CPU este prezentat ca procesor pentru agenți, cu accent pe latență mică, performanță pe un singur fir, lățime mare de bandă și eficiență energetică. Huang a vorbit despre 10 instrucțiuni procesate pe ciclu, despre o interconectare internă de 3,6 terabytes pe secundă, PCIe Gen 6 și memorie LPDDR5X cu 1,2 terabytes pe secundă. În materialele NVIDIA, Vera are 88 de nuclee Olympus, comunicare mai rapidă între nuclee și performanță de 1,8 ori mai mare în sarcini de tip agentic sandbox față de procesoare x86 comparabile. Pe scenă au fost menționate și două exemple ușor de reținut: SQL ar rula de trei ori mai rapid, iar procesarea de fluxuri în timp real pentru New York Stock Exchange ar fi de șase ori mai rapidă.
Pe partea de software pentru companii, NVIDIA a prezentat Agent Toolkit pentru Enterprise AI. Pachetul se sprijină pe patru elemente: modele, strat de coordonare, instrumente cu abilități și un mediu de rulare sigur. Modelele pot fi Nemotron sau alte modele deschise. Stratul de coordonare poate veni din sisteme precum OpenClaw, Hermes, Claude Code sau Codex. Instrumentele sunt biblioteci ca CUDA-X. Mediul de rulare este OpenShell, conceput pentru a ține agenții într-un spațiu controlat, cu reguli de securitate, identitate, permisiuni și protecție a datelor.
NVIDIA susține că OpenShell este adoptat de companii precum Microsoft, Canonical și Red Hat, iar integrarea cu Windows va permite agenților să ruleze local, pe PC-uri, cu politici clare despre ce pot și ce nu pot face. Ideea este importantă, pentru că un agent care poate citi fișiere, scrie cod, folosi aplicații și ține minte informații are nevoie de limite serioase. Fără acest strat de control, autonomia devine repede greu de acceptat în firme.
Un exemplu concret a venit din colaborarea NVIDIA cu Cadence. Cele două companii lucrează la agenți pentru proiectarea și verificarea cipurilor, un domeniu unde o eroare poate întârzia proiecte întregi. Agentul prezentat poate porni de la specificații, diagrame, RTL și probleme de verificare, apoi poate rula simulări, crea testbench-uri, folosi Cadence Xcelium și JasperGold și identifica probleme în cod. NVIDIA spune că unele cicluri de verificare pot trece de la săptămâni la ore, cu accelerări de peste 40 de ori. Pentru o companie care proiectează cipuri din ce în ce mai mari, chiar și o reducere mică a timpului de verificare poate conta mult. O reducere de ordinul acesta schimbă cu totul ritmul.
Nemotron 3 Ultra a fost prezentat ca noul model deschis al NVIDIA pentru agenți care rulează mult timp. Compania spune că modelul are 550 de miliarde de parametri, folosește o arhitectură de tip Mixture of Experts și este creat pentru sarcini de codare, cercetare și fluxuri de lucru de companie. NVIDIA îl descrie ca fiind de până la cinci ori mai rapid și cu până la 30% mai ieftin de rulat față de modele deschise similare. Un detaliu important este că NVIDIA promite să ofere nu doar modelul, ci și datele și pașii de antrenare, astfel încât companiile să îl poată adapta pentru propriile domenii.
Parteneriatele menționate arată unde ar putea ajunge acești agenți. CrowdStrike folosește modele Nemotron pentru agenți specializați în securitate informatică, Palantir le integrează în platforme pentru ingineri AI dedicați, iar ServiceNow și SAP apar în zona de agenți pentru fluxuri de lucru de companie. NVIDIA vede această etapă nu ca pe un pericol pentru software-ul de companie, ci ca pe o șansă de a-l face mai folosit. Dacă agenții au nevoie de instrumente, atunci aplicațiile bine structurate devin și mai valoroase.
O parte mare a keynote-ului a fost despre PC. Huang a făcut o paralelă cu istoria Windows și cu momentul în care PC-ul a devenit un dispozitiv de masă. În noua etapă, calculatorul nu mai este doar o mașină pe care deschizi aplicații și tastezi. Devine un sistem în care rulează agenți personali, capabili să vadă, să audă, să caute, să organizeze fișiere, să ajute la proiecte și să folosească aplicații în locul tău, dar sub controlul tău.
RTX Spark este piesa principală a acestei direcții. NVIDIA îl prezintă ca un supercip pentru PC-uri Windows construite pentru agenți personali. Include un GPU Blackwell RTX cu 6.144 de nuclee CUDA și Tensor Cores de generația a cincea, un CPU Grace cu 20 de nuclee realizat împreună cu MediaTek, conexiune NVLink-C2C, până la 128 GB memorie unificată și până la 1 petaflop de performanță AI. Sistemele vor rula Windows și întregul ecosistem CUDA, RTX și NVIDIA AI, iar compania spune că vor putea lucra local cu modele mari, randări 3D grele, editare video 12K, generare video AI 4K și jocuri la 1440p cu peste 100 de cadre pe secundă.
Microsoft și NVIDIA vor să aducă agenții direct în Windows. Microsoft lucrează la identitate, izolare, politici și administrare la nivel de sistem de operare, iar NVIDIA aduce OpenShell peste aceste mecanisme. Asta ar putea permite unui agent local să caute prin fișiere, să lucreze între aplicații, să genereze imagini sau cod și să folosească modele locale când datele sunt sensibile. Nu e doar o chestiune de performanță, ci și de încredere. Un agent personal trebuie să fie util fără să devină prea liber.
Demonstrația cu proiectarea unei case a arătat cum ar putea arăta un astfel de flux. Utilizatorul alege terenul, oferă schițe și preferințe de stil, apoi agentul rulează local pe RTX Spark, într-un sandbox OpenShell, cu un harness Hermes și acces la Claude Sonnet în cloud. Agentul deschide Rhino, modelează terenul, propune forme de clădire, creează compartimentări, pune uși, ferestre și elemente structurale, apoi exportă în Blender. După ajustarea materialelor, randările pot fi îmbunătățite cu generare AI folosind Flux 2. În loc să înlocuiască arhitectul, demonstrația arată un asistent care poate reduce pașii repetitivi și poate accelera explorarea variantelor.
Adobe apare ca partener important. NVIDIA spune că Photoshop și Premiere sunt refăcute pentru RTX Spark, cu performanță AI și grafică de până la două ori mai mare. În plus, aplicațiile vor fi pregătite pentru interacțiunea cu agenți, inclusiv printr-un server MCP. Pentru creatori, asta ar putea însemna că un agent nu doar dă sugestii, ci poate lucra direct cu fișiere, timeline-uri, efecte și materiale.
Linia nouă de PC-uri include laptopuri RTX Spark, desktopuri compacte și DGX Station pentru Windows. Laptopurile ar urma să fie disponibile în toamnă de la ASUS, Dell, HP, Lenovo, Microsoft Surface și MSI, iar Acer și GIGABYTE vor veni ulterior. Desktopul prezentat de MSI a fost descris ca un fel de calculator pentru agent personal care poate rula permanent acasă, conectat la laptop, display, camere și alte dispozitive. DGX Station pentru Windows urcă mult mai sus, spre zona de dezvoltare profesională, cu posibilitatea de a rula local modele de până la 1 trilion de parametri. În prezentare, Huang a vorbit despre 768 GB memorie, 20 petaflops și 8 terabytes pe secundă lățime de bandă a memoriei.
Comparația folosită de Huang a fost telefonul. Acum 15-20 de ani, telefonul era în primul rând pentru apeluri. Azi, apelurile sunt doar o funcție printre multe altele. NVIDIA crede că același lucru se poate întâmpla cu PC-ul. Peste un deceniu, calculatorul ar putea fi perceput mai puțin ca o cutie cu aplicații și mai mult ca un loc unde rulează asistenți personali, un fel de supercomputer casnic pentru agenți. Huang a folosit chiar repere din cultura pop, precum R2-D2 și C-3PO, pentru a explica ideea unui computer care pare mai degrabă companion tehnologic decât unealtă statică.
Aceeași arhitectură cu agenți apare apoi în roboți, mașini autonome, sateliți, echipamente agricole, fabrici, stații de bază și sisteme industriale. Un agent digital poate fi văzut ca un robot software: observă, raționează, planifică și acționează. Un robot fizic are nevoie de același lucru, doar că trebuie să înțeleagă și lumea reală, cu mișcare, obiecte, obstacole, sunete și reguli fizice.
Pentru AI fizic, problema grea este data. Modelele lingvistice au fost antrenate pe texte create de oameni, din perspectiva oamenilor. Roboții au nevoie de date din perspectiva lor, adică date care arată lumea așa cum o percepe un corp care se mișcă, apucă, ridică, merge sau conduce. De aceea NVIDIA vorbește despre teleoperare, simulare în Omniverse, conversia datelor video din perspectivă terță în perspectivă proprie și modele de lume care pot genera situații sintetice.
Cosmos 3 este modelul anunțat pentru această direcție. NVIDIA îl prezintă ca un model deschis de fundație pentru AI fizic, bazat pe o arhitectură Mixture of Transformers. Poate înțelege și genera text, imagini, video, sunet ambiental și acțiuni, fiind folosit pentru simulări, date sintetice, evaluarea politicilor de robot și scenarii în care sistemele trebuie să anticipeze ce urmează. Pe scurt, Cosmos 3 nu este un chatbot, ci un model care încearcă să ajute roboții și vehiculele autonome să înțeleagă lumea fizică înainte să acționeze.
Pentru mașini autonome, NVIDIA a anunțat Alpamayo 2 Super, un model deschis de 32 de miliarde de parametri, de tip vision-language-action, destinat dezvoltării de robotaxiuri de nivel 4. Modelul poate raționa, planifica și acționa pe întregul flux de condus autonom, de la percepție la decizii de nivel înalt. NVIDIA a prezentat și AlpaGym, un cadru de antrenare prin învățare în buclă închisă, precum și OmniDreams, un model generativ pentru scenarii de condus fotorealiste. Ideea este ca producătorii să poată testa situații rare și complicate în simulare înainte de a pune vehiculele pe drum.
DRIVE Hyperion rămâne platforma hardware și software prin care aceste modele ar urma să ajungă în vehicule. NVIDIA susține că branduri reprezentând aproximativ 80% din producția auto globală au semnat pentru sisteme DRIVE Hyperion, iar serviciile de mobilitate conectate la ecosistem ar acoperi aproximativ 97% din piața globală a acestor servicii. În prezentarea video, un vehicul de tip Mercedes a explicat pas cu pas ce vede și de ce ia anumite decizii, de la cedarea trecerii pietonilor până la păstrarea distanței față de alte vehicule. Huang a glumit că, dacă mașina ar vorbi tot timpul, ar deveni obositoare, dar pentru dezvoltatori faptul că își poate explica raționamentul este util.
La roboți umanoizi, NVIDIA a prezentat Isaac GR00T ca platformă completă: modele, generare de date, simulare, antrenare și rulare pe robot. Noutatea este un robot umanoid de referință pentru cercetare academică, bazat pe Jetson Thor și pe software-ul Isaac GR00T. Designul combină un corp Unitree H2 Plus, mâini tactile Sharpa cu cinci degete, procesare locală Jetson Thor și software deschis NVIDIA. Robotul are aproape 6 picioare înălțime, cântărește aproximativ 150 de livre și este destinat laboratoarelor care altfel ar pierde luni doar ca să aducă hardware-ul, simularea și datele într-un flux coerent.
Mesajul de final al prezentării a fost că același model de calcul se va repeta peste tot. În cloud, agentul are nevoie de modele, memorie, instrumente, securitate și infrastructură uriașă. Pe PC, are nevoie de hardware local, Windows, OpenShell și aplicații compatibile. Într-o mașină, are nevoie de senzori, simulări, modele de lume și reguli de siguranță. Într-un robot, are nevoie de corp, date, control și capacitatea de a învăța din mișcare. NVIDIA încearcă să furnizeze toate straturile, de la cipuri la modele și de la biblioteci la fabrici AI.
NVIDIA pariază că AI-ul nu va rămâne o fereastră de chat, ci se va muta în infrastructură, aplicații, PC-uri și obiecte fizice. Iar dacă pariul se confirmă, felul în care folosim calculatoarele ar putea deveni mai puțin despre clicuri și meniuri și mai mult despre a cere unui sistem să ducă la capăt o sarcină. Sună mare, dar exact așa păreau și smartphone-urile înainte să devină banale.
Credeți că un PC cu agenți locali ar fi mai util în viața de zi cu zi sau mai greu de controlat? Și unde vi se pare mai realistă schimbarea: în birouri, în fabrici, în mașini autonome sau acasă?
Care e părerea ta? Începe discuția despre subiectul „NVIDIA și Microsoft vor să reinventeze PC-ul”.
Trimiteți un comentariu
☑ Comentariile conforme cu regulile comunității vor fi aprobate în maxim 10 ore. Dacă ai întrebări ce nu au legătură cu acest subiect, te invităm să le adresezi în Grupul Oficial HD Satelit.