Article de reference

NVLink

NVLink est une liaison de communication série filaire, multivoies et à courte portée développée par Nvidia . Contrairement à PCI Express , un périphérique peut comporter plusieu...

de communication série filaire, multivoies et à courte portée développée par Nvidia . Contrairement à PCI Express , un périphérique peut comporter plusieurs interfaces NVLink, et les périphériques peuvent communiquer via un réseau maillé plutôt que par un concentrateur ou un commutateur central. Ce protocole a été annoncé pour la première fois en mars 2014 et utilise une interconnexion de signalisation haut débit propriétaire (NVHS).

Pour un petit nombre de GPU, les voies NVLink d'un seul appareil suffisent à assurer une connectivité maillée complète. Afin de prendre en charge un plus grand nombre de GPU, NVLink utilise depuis 2018 une architecture à commutation de paquets, où un commutateur central peut gérer jusqu'à 32 ports à deux voies. Le NVSwitch pour NVLink 4.0 peut effectuer des calculs simples (par exemple, somme, diffusion) afin de réduire les besoins en communication grâce à l'accélérateur « SHARP ».

Nvidia pour les transferts de données et de code de contrôle au sein des systèmes de traitement, entre les CPU et les GPU, et entre GPU. NVLink spécifie une connexion point à point avec des débits de données de 20, 25 et 50 Gbit/s (respectivement v1.0/v2.0/v3.0+) par paire différentielle. Pour NVLink 1.0 et 2.0, huit paires différentielles forment une « sous-liaison », et deux « sous-liaisons », une dans chaque sens, forment une « liaison ». À partir de NVLink 3.0, seules quatre paires différentielles forment une « sous-liaison ». Pour NVLink 2.0 et versions ultérieures, le débit total d'une sous-liaison est de 25 Go/s, et celui d'une liaison est de 50 Go/s. Chaque GPU V100 prend en charge jusqu'à six liaisons. Ainsi, chaque GPU est capable de supporter une bande passante bidirectionnelle totale allant jusqu'à 300 Go/s. Les produits NVLink commercialisés à ce jour sont principalement destinés aux applications hautes performances. Annoncé le 14 mai 2020, NVLink 3.0 augmente le débit de données par paire différentielle de 25 Gbit/s à 50 Gbit/s tout en réduisant le nombre de paires par NVLink de 8 à 4. Avec 12 liaisons pour un GPU A100 basé sur l'architecture Ampere , la bande passante totale atteint 600 Go/s. La microarchitecture GPU Hopper , annoncée en mars 2022, dispose de 18 liaisons NVLink 4.0, permettant une bande passante totale de 900 Go/s. Ainsi, NVLink 2.0, 3.0 et 4.0 offrent tous un débit de données de 50 Go/s par liaison bidirectionnelle et possèdent respectivement 6, 12 et 18 liaisons.

Performance

Le tableau suivant présente une comparaison des indicateurs de base basée sur des spécifications standard :

Interconnexion​Taux de transfertCode de ligneModulationDébit de charge utile effectif par voie ou NVLink (unidir.)Longueur totale maximale de la voie Liens totaux (NVLink)Bande passante totale (PCIe x16 ou NVLink)Réalisé en design
PCIe 3.x8 GT/s128b/130bNRZ0,99 Go/sPascal , Volta , Turing
PCIe 4.016 GT/s128b/130bNRZ1,97 Go/sXavier , Ampère , POWER9
PCIe 5.032 GT/s 128b/130bNRZ3,94 Go/s126,03 Go/sTrémie
PCIe 6.064 GT/s236B/256B FLIT PAM4 FEC7,56 Go/s242 Go/sBlackwell
NVLink 1.020 GT/sNRZ20 Go/s4160 Go/sPascal , POWER8+
NVLink 2.025 GT/sNRZ25 Go/s6300 Go/sVolta , POWER9
NVLink 3.050 GT/sNRZ25 Go/s12600 Go/sAmpère
NVLink 4.050 GT/s paire différentielle PAM425 Go/s18900 Go/sHopper , Nvidia Grace
NVLink 5.0 100 GT/spaire différentielle PAM450 Go/s181800 Go/sBlackwell , Nvidia Grace

Le tableau suivant présente une comparaison des paramètres de bus pertinents pour les semi-conducteurs du monde réel proposant NVLink comme option :

Semi-conducteurvariante de livraison par bus/par bateauInterconnexionTaux de technologie de transmission (par voie)Voies par sous-lien (sortie + entrée)Débit de données de sous-liaison (par direction de données) Nombre de sous-liens ou d'unitésDébit de données total (sortie + entrée) Nombre total de voies (sortie + entrée)Débit de données total (sortie + entrée)
Nvidia GP100P100 SXM, P100 PCI-E PCIe 3.016 + 16 128 Gbit/s = 16 Go/s116 + 16 Go/s 32 16 + 16 128 Gbit/s = 16 Go/s1PCIe 3.016 + 16 128 Gbit/s = 16 Go/s116 + 16 128 Gbit/s = 16 Go/s1NVLink 2.025 GT/s