NVIDIA Vera Rubin: Šesťčipová platforma zníži cenu AI tokenov desaťnásobne
Autor
Jakub Novák
NVIDIA na CES 2026 predstavila Vera Rubin – šesťčipovú AI platformu, ktorá sľubuje 10× lacnejšie tokeny a revolúciu v agentickej umelej inteligencii.
Koniec éry samostatných GPU, prichádza éra systémov
Na CES 2026 v Las Vegas odhalila NVIDIA novú architektúru Vera Rubin. Pravidlá hry sa menia definitívne. Spoločnosť sa už nepovažuje len za dodávateľa grafických čipov, ale za architekta kompletných AI superpočítačov.
Nástupca architektúry Blackwell prichádza s konceptom „šiestich čipov v jednej platforme", ktoré fungujú ako koherentný celok. Základom je Vera CPU s 88 jadrami Olympus ARM a Rubin GPU s pamäťami HBM4.
Dopĺňa ich sieťová infraštruktúra: NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU a ethernetový switch Spectrum-6. Tento integrovaný prístup reaguje na obrovský dopyt po výpočtovom výkone pri trénovaní ďalších generácií LLM (veľkých jazykových modelov).
Podľa oficiálnej správy NVIDIA nejde len o surový výkon, ale o efektivitu. Vera Rubin sľubuje 5-násobne vyšší výkon pri agentických úlohách a 8-násobne lepší pomer výkonu na watt oproti predchádzajúcej generácii.
Ekonomika v hlavnej úlohe: Tokeny za desatinu ceny
Najzásadnejšie číslo celej prezentácie: 10-násobné zníženie ceny za generovanie AI tokenov. Pre firmy prevádzkujúce masívne chatboty alebo analytické systémy to znamená dramatický pokles prevádzkových nákladov.
Ak doteraz stála inferencia komplexného modelu tisíce eur mesačne, s platformou Rubin sa náklady prepadnú na stovky. To otvára dvere širšiemu nasadeniu AI aj v slovenských malých a stredných podnikoch, ktoré narážali na finančné limity cloudových služieb.
Podľa analýzy portálu ServeTheHome optimalizácia pre modely typu Mixture-of-Experts (MoE) znižuje potrebu počtu GPU pri tréningu až štvornásobne. NVIDIA týmto krokom útočí na efektivitu kľúčovú pre globálnych cloudových hráčov ako AWS, Google Cloud či Microsoft Azure, ktorí plánujú masové nasadenie platformy v druhej polovici 2026.
Agentická AI a hardvérové šifrovanie dát
NVIDIA Vera Rubin nie je len o rýchlosti, ale aj o bezpečnosti a type úloh. Architektúra je od základov navrhnutá pre agentickú AI – inteligentných agentov, ktorí nielen generujú text, ale dokážu plánovať, logicky uvažovať a vykonávať komplexné operácie v reálnom čase.
To je kľúčové pre segmenty ako autonómna doprava či robotika.
Pre európsky trh prináša Rubin vylepšené funkcie Confidential Computing. Hardvérové šifrovanie dát priamo v procese výpočtu na úrovni celého racku (NVL72) umožňuje slovenským bankám či štátnym inštitúciám využívať AI pri zachovaní najprísnejších štandardov ochrany dát.
Dáta zákazníkov ostávajú chránené aj v momente, keď s nimi model pracuje – čo bolo doteraz technologicky náročné na výkon.
Praktický dopad pre slovenský trh
Pre slovenské dátové centrá a technologické firmy predstavuje Vera Rubin nielen technologický skok, ale aj ekonomickú príležitosť. Lokálni poskytovatelia GPU cloudov môžu klientom ponúknúť výrazne konkurencieschopnejšie ceny pri spracovaní veľkých jazykových modelov.
To bolo doteraz doménou zahraničných hyperscalerov. Fintech spoločnosti a e-commerce projekty získavajú možnosť implementovať sofistikované AI asistenty bez potreby presúvať citlivé dáta mimo územia Európskej únie.
Posun Nvidie k uzavretým, vysoko integrovaným systémom však vytvára aj výzvy. Pre firmy bude čoraz ťažšie kombinovať komponenty od rôznych výrobcov, keďže Vera Rubin funguje najlepšie ako jeden celistvý ekosystém.
Pre slovenských poskytovateľov dátových centier to znamená potrebu investícií do novej infraštruktúry chladenia a napájania, aby dokázali ubytovať tieto vysoko výkonné celky.
AI Transparency Report
Tento obsah bol vytvorený v spolupráci s umelou inteligenciou pod dohľadom ľudského editora. Využívame modely Gemini 1.5 Pro a Claude 3.5 Sonnet pre overovanie faktov a štylistiku.
Jakub Novák
+System Engineer z praxe. Paradoxne bez titulu, no s prednáškami na akademickej pôde. Na tomto portáli zabezpečujem technickú orchestráciu AI agentov.
Connect on LinkedIn