Pour un petit nombre de GPU, les voies NVLink d'un seul appareil suffisent à assurer une connectivité maillée complète. Afin de prendre en charge un plus grand nombre de GPU, NVLink utilise depuis 2018 une architecture à commutation de paquets, où un commutateur central peut gérer jusqu'à 32 ports à deux voies. Le NVSwitch pour NVLink 4.0 peut effectuer des calculs simples (par exemple, somme, diffusion) afin de réduire les besoins en communication grâce à l'accélérateur « SHARP ».
Nvidia pour les transferts de données et de code de contrôle au sein des systèmes de traitement, entre les CPU et les GPU, et entre GPU. NVLink spécifie une connexion point à point avec des débits de données de 20, 25 et 50 Gbit/s (respectivement v1.0/v2.0/v3.0+) par paire différentielle. Pour NVLink 1.0 et 2.0, huit paires différentielles forment une « sous-liaison », et deux « sous-liaisons », une dans chaque sens, forment une « liaison ». À partir de NVLink 3.0, seules quatre paires différentielles forment une « sous-liaison ». Pour NVLink 2.0 et versions ultérieures, le débit total d'une sous-liaison est de 25 Go/s, et celui d'une liaison est de 50 Go/s. Chaque GPU V100 prend en charge jusqu'à six liaisons. Ainsi, chaque GPU est capable de supporter une bande passante bidirectionnelle totale allant jusqu'à 300 Go/s. Les produits NVLink commercialisés à ce jour sont principalement destinés aux applications hautes performances. Annoncé le 14 mai 2020, NVLink 3.0 augmente le débit de données par paire différentielle de 25 Gbit/s à 50 Gbit/s tout en réduisant le nombre de paires par NVLink de 8 à 4. Avec 12 liaisons pour un GPU A100 basé sur l'architecture Ampere , la bande passante totale atteint 600 Go/s. La microarchitecture GPU Hopper , annoncée en mars 2022, dispose de 18 liaisons NVLink 4.0, permettant une bande passante totale de 900 Go/s. Ainsi, NVLink 2.0, 3.0 et 4.0 offrent tous un débit de données de 50 Go/s par liaison bidirectionnelle et possèdent respectivement 6, 12 et 18 liaisons.Performance
Le tableau suivant présente une comparaison des indicateurs de base basée sur des spécifications standard :
| Interconnexion | Taux de transfert | Code de ligne | Modulation | Débit de charge utile effectif par voie ou NVLink (unidir.) | Longueur totale maximale de la voie | Liens totaux (NVLink) | Bande passante totale (PCIe x16 ou NVLink) | Réalisé en design |
|---|---|---|---|---|---|---|---|---|
| PCIe 3.x | 8 GT/s | 128b/130b | NRZ | 0,99 Go/s | Pascal , Volta , Turing | |||
| PCIe 4.0 | 16 GT/s | 128b/130b | NRZ | 1,97 Go/s | Xavier , Ampère , POWER9 | |||
| PCIe 5.0 | 32 GT/s | 128b/130b | NRZ | 3,94 Go/s | 126,03 Go/s | Trémie | ||
| PCIe 6.0 | 64 GT/s | 236B/256B FLIT | PAM4 FEC | 7,56 Go/s | 242 Go/s | Blackwell | ||
| NVLink 1.0 | 20 GT/s | NRZ | 20 Go/s | 4 | 160 Go/s | Pascal , POWER8+ | ||
| NVLink 2.0 | 25 GT/s | NRZ | 25 Go/s | 6 | 300 Go/s | Volta , POWER9 | ||
| NVLink 3.0 | 50 GT/s | NRZ | 25 Go/s | 12 | 600 Go/s | Ampère | ||
| NVLink 4.0 | 50 GT/s | paire différentielle PAM4 | 25 Go/s | 18 | 900 Go/s | Hopper , Nvidia Grace | ||
| NVLink 5.0 | 100 GT/s | paire différentielle PAM4 | 50 Go/s | 18 | 1800 Go/s | Blackwell , Nvidia Grace |
Le tableau suivant présente une comparaison des paramètres de bus pertinents pour les semi-conducteurs du monde réel proposant NVLink comme option :
| Semi-conducteur | variante de livraison par bus/par bateau | Interconnexion | Taux de technologie de transmission (par voie) | Voies par sous-lien (sortie + entrée) | Débit de données de sous-liaison (par direction de données) | Nombre de sous-liens ou d'unités | Débit de données total (sortie + entrée) | Nombre total de voies (sortie + entrée) | Débit de données total (sortie + entrée) | |||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Nvidia GP100 | P100 SXM, P100 PCI-E | PCIe 3.0 | 16 + 16 | 128 Gbit/s = 16 Go/s | 1 | 16 + 16 Go/s | 32 | 16 + 16 | 128 Gbit/s = 16 Go/s | 1 | PCIe 3.0 | 16 + 16 | 128 Gbit/s = 16 Go/s | 1 | 16 + 16 | 128 Gbit/s = 16 Go/s | 1 | NVLink 2.0 | 25 GT/s |