A metà settembre 2022, dopo circa 2 anni dall’uscita della serie GPU RTX Serie 30 con architettura Ampere, Nvidia ha svelato le caratteristiche della nuova architettura Ada Lovelace su cui saranno basate le nuove schede grafiche GeForce RTX serie 40 e che sono disponibili al commercio dal 12 ottobre 2022 in due modelli: la RTX 4090 e la RTX 4080.
Abbiamo già visto in generale la nuova architettura Ada Lovelace rappresenta un salto generazionale sia da un punto di vista di hardware sia di funzionalità, basandosi su tecnologia di processo TSMC 4N a 5 nanometri, che hanno consentito di integrare oltre 76 miliardi di transistor rispetto ai 28 miliardi della generazione precedente e garantire oltre il doppio delle prestazioni a parità di consumi rispetto alle schede della serie RTX 30 basate su Ampere.
Tra le nuove funzionalità introdotte spiccano l’acceleratore di flusso ottico Ada e lo Shader Execution Reordering (SER).
L’acceleratore di flusso ottico sfrutta per la prima volta l’intelligenza artificiale in real-time per prevedere il movimento in una scena, consentendo quindi alla rete neurale di aumentare il frame rate, attraverso la creazione di nuovi frame, incrementando la qualità dell’immagine percepita.
Lo Shader Execution Reordering invece permette di riprogrammare istantaneamente i workload di shading, l’ombreggiatura e la rifressione della luce delle scene che rappresenta uno dei carichi maggiori della GPU, migliorando notevolmente le prestazioni del ray-tracing e i frame rate dei giochi.
Sono inizialmente prodotti due modelli di GPU: la Nvidia GeForce RTX 4090 e la RTX 4080 e saranno disponibili sia nella versione stock-clocked sia nelle versioni factory-overclocked, attraverso i migliori fornitori di schede quali ASUS, GIGABYTE, MSI, PNY, Zotac e altri.
Caratteristiche tecniche della RTX 4090
Da un punto di vista delle caratteristiche tecniche questa GPU rappresenta il massimo a cui ci si riesce a spingere con la tecnologia attuale.
La Nvidia RTX 4090 dispone di 16.384 CUDA Core (Compute Unified Device Architecture), che rappresentano le unità di processamento parallelo delle schede grafiche, da un punto di vista logico molto simili ai core delle CPU, ma con la grande differenza che hanno molte meno funzioni di una CPU, anzi in pratica fanno esclusivamente somme e moltiplicazioni, ma le possono eseguire in parallelo a velocità altissima. Per fare un confronto la RTX 3090 dispone di 10752 CUDA Core e una scheda entry level Nvidia come la GTX 1660 ne ha 1408.
La scheda 4090 ha un frequenza di Clock di 2.23Ghz con possibilità di arrivare a 2.52GHz in Boost Mode con una ampiezza del bus dalla GPU alla memoria di 384-bit.
Da un punto di vista della memoria video si utilizza la stessa memoria della GTX 3090, ovvero la VRAM GDDR6X da 24 GB, allo stato attuale la memoria più veloce disponibile, che utilizza la modulazione PAM4 (Pulse Amplitude Modulation a 4 livelli) permettendo di trasmettere due bit di dati da e verso la memoria in un unico ciclo di clock.
Oltre ai CUDA Core, la scheda dispone di ulteriori processori specializzati per specifiche funzioni grafiche. In particolare i 2 multiprocessori di streaming FP32 per una potenza di shading fino a 83 teraflops, gli RT Cores di terza generazione per garantire fino a 191 teraflops effettivi di ray-tracing e infine i Tensor Core di quarta generazione che offrono fino a 1,32 petaflop Tensor, consentendo il supporto dell’intelligenza artificiale al DLSS3 (Deep Learning Super Sampling) per aumentare il frame rate delle immagini.
La scheda video dispone di una uscita HDMI e 3 DisplayPort, consentendo di pilotare fino a 4 Monitor alla massima risoluzione di 7680×4320 pixel (8K).
La GTX 4090 assorbe una potenza massima di ben 450W e sono necessari 3 cavi PCIe a 8 pin per fornire tale potenza, di conseguenza l’alimentazione minima di sistema consigliata da Nvidia è di 850W.
Un cenno rapito anche alla sorella minore della RTX 4090, ovvero la RTX 4080, che dispone comunque di 9.728 CUDA Core e 16GB di memoria GDDR6X per una potenza complessiva superiore anche alla GeForce RTX 3090 Ti.
Prestazioni incredibili anche rispetto alla potentissima RTX 3090
Tutti i numeri relativi ai processori, teraflops e petaflops disponibili, danno sicuramente una idea della potenza della scheda, anche rispetto alla RTX 3090, finora considerata il punto di riferimento per le GPU Nvidia, ma è quando si mettono a confronto su carichi reali di lavoro che se ne apprezza la sensibile differenza.
Da un punto di vista di benchmark, se si prende come riferimento il PassMark 3D Mark, che misura le prestazioni di esecuzione di carichi tipici come la creazione di oggetti tridimensionali a 4K, effetti di shading e ray tracing, la RTX 4090 performa il 43% in più della RTX 3090 con un punteggio di 38292 contro i 26693 della 3090.
Se si analizzano le prestazioni su giochi veri, si apprezzano incrementi di velocità e prestazioni già doppi rispetto alla RTX 3090 anche su giochi non espressamente ottimizzati per k’architettura Ada Lovelace, come ad esempio su un classico Flight Simulator di Microsoft o su Warhammer Darkside.
Tutti i nuovi giochi che riescono a sfruttare al massimo le capacità delle evoluzioni del Ray Tracing Overdrive e del DLSS3 nonché delle Nvidia Reflex, che sulle GeForce RTX serie 40 e i monitor G-SYNC permettono una latenza minima e la migliore reattività per i giochi competitivi come Fortnite e Cyberpunk 2077, consentiranno incrementi di prestazioni anche quattro volte superiori rispetto alla RTX 3090.