NVLink

de communication série filaire, multivoies et à courte portée développée par Nvidia . Contrairement à PCI Express , un périphérique peut comporter plusieurs interfaces NVLink, et les périphériques peuvent communiquer via un réseau maillé plutôt que par un concentrateur ou un commutateur central. Ce protocole a été annoncé pour la première fois en mars 2014 et utilise une interconnexion de signalisation haut débit propriétaire (NVHS).

Pour un petit nombre de GPU, les voies NVLink d'un seul appareil suffisent à assurer une connectivité maillée complète. Afin de prendre en charge un plus grand nombre de GPU, NVLink utilise depuis 2018 une architecture à commutation de paquets, où un commutateur central peut gérer jusqu'à 32 ports à deux voies. Le NVSwitch pour NVLink 4.0 peut effectuer des calculs simples (par exemple, somme, diffusion) afin de réduire les besoins en communication grâce à l'accélérateur « SHARP ».

Nvidia pour les transferts de données et de code de contrôle au sein des systèmes de traitement, entre les CPU et les GPU, et entre GPU. NVLink spécifie une connexion point à point avec des débits de données de 20, 25 et 50 Gbit/s (respectivement v1.0/v2.0/v3.0+) par paire différentielle. Pour NVLink 1.0 et 2.0, huit paires différentielles forment une « sous-liaison », et deux « sous-liaisons », une dans chaque sens, forment une « liaison ». À partir de NVLink 3.0, seules quatre paires différentielles forment une « sous-liaison ». Pour NVLink 2.0 et versions ultérieures, le débit total d'une sous-liaison est de 25 Go/s, et celui d'une liaison est de 50 Go/s. Chaque GPU V100 prend en charge jusqu'à six liaisons. Ainsi, chaque GPU est capable de supporter une bande passante bidirectionnelle totale allant jusqu'à 300 Go/s. Les produits NVLink commercialisés à ce jour sont principalement destinés aux applications hautes performances. Annoncé le 14 mai 2020, NVLink 3.0 augmente le débit de données par paire différentielle de 25 Gbit/s à 50 Gbit/s tout en réduisant le nombre de paires par NVLink de 8 à 4. Avec 12 liaisons pour un GPU A100 basé sur l'architecture Ampere , la bande passante totale atteint 600 Go/s. La microarchitecture GPU Hopper , annoncée en mars 2022, dispose de 18 liaisons NVLink 4.0, permettant une bande passante totale de 900 Go/s. Ainsi, NVLink 2.0, 3.0 et 4.0 offrent tous un débit de données de 50 Go/s par liaison bidirectionnelle et possèdent respectivement 6, 12 et 18 liaisons.

Performance

Le tableau suivant présente une comparaison des indicateurs de base basée sur des spécifications standard :

Interconnexion	Taux de transfert	Code de ligne	Modulation	Débit de charge utile effectif par voie ou NVLink (unidir.)	Longueur totale maximale de la voie	Liens totaux (NVLink)	Bande passante totale (PCIe x16 ou NVLink)	Réalisé en design
PCIe 3.x	8 GT/s	128b/130b	NRZ	0,99 Go/s	Pascal , Volta , Turing
PCIe 4.0	16 GT/s	128b/130b	NRZ	1,97 Go/s	Xavier , Ampère , POWER9
PCIe 5.0	32 GT/s	128b/130b	NRZ	3,94 Go/s			126,03 Go/s	Trémie
PCIe 6.0	64 GT/s	236B/256B FLIT	PAM4 FEC	7,56 Go/s			242 Go/s	Blackwell
NVLink 1.0	20 GT/s		NRZ	20 Go/s		4	160 Go/s	Pascal , POWER8+
NVLink 2.0	25 GT/s		NRZ	25 Go/s		6	300 Go/s	Volta , POWER9
NVLink 3.0	50 GT/s		NRZ	25 Go/s		12	600 Go/s	Ampère
NVLink 4.0	50 GT/s		paire différentielle PAM4	25 Go/s		18	900 Go/s	Hopper , Nvidia Grace
NVLink 5.0	100 GT/s		paire différentielle PAM4	50 Go/s		18	1800 Go/s	Blackwell , Nvidia Grace

Le tableau suivant présente une comparaison des paramètres de bus pertinents pour les semi-conducteurs du monde réel proposant NVLink comme option :

Semi-conducteur	variante de livraison par bus/par bateau	Interconnexion	Taux de technologie de transmission (par voie)	Voies par sous-lien (sortie + entrée)	Débit de données de sous-liaison (par direction de données)	Nombre de sous-liens ou d'unités	Débit de données total (sortie + entrée)	Nombre total de voies (sortie + entrée)	Débit de données total (sortie + entrée)
Nvidia GP100	P100 SXM, P100 PCI-E	PCIe 3.0		16 + 16	128 Gbit/s = 16 Go/s	1	16 + 16 Go/s	32		16 + 16	128 Gbit/s = 16 Go/s	1		PCIe 3.0		16 + 16	128 Gbit/s = 16 Go/s	1		16 + 16	128 Gbit/s = 16 Go/s	1		NVLink 2.0	25 GT/s	Code de ligne 128b/130b (voir, par exemple, la transmission de données PCI Express pour les versions 3.0 et supérieures) caractères de contrôle de lien En-tête de transaction Capacités de mise en mémoire tampon Utilisation du DMA côté ordinateur Ces limitations physiques réduisent généralement le débit de données à 90-95 % du débit de transfert. Les tests de performance NVLink montrent un débit de transfert atteignable d'environ 35,3 Gbit/s (hôte vers périphérique) pour une connexion NVLink de 40 Gbit/s (2 sous-voies de liaison montante) vers un GPU P100 dans un système piloté par un ensemble de processeurs IBM POWER8. Scalable Link Interface (SLI) depuis 2004 en raison de sa conception structurelle et de son apparence, même si la conception moderne basée sur NVLink est de nature technique assez différente avec des fonctionnalités différentes dans ses niveaux de base par rapport à la conception précédente. Les dispositifs réels signalés sont : Quadro GP100 (une paire de cartes utilisera jusqu'à 2 ponts ; la configuration réalise 2 ou 4 connexions NVLink avec jusqu'à 160 Go/s - cela pourrait ressembler à NVLink 1.0 avec 20 GT/s) Quadro GV100 (une paire de cartes nécessitera jusqu'à 2 ponts et réalisera jusqu'à 200 Go/s - cela pourrait ressembler à NVLink 2.0 avec 25 GT/s et 4 liens) GeForce RTX 2080 basée sur TU104 (avec un seul pont « GeForce RTX NVLink-Bridge » ) GeForce RTX 2080 Ti basée sur TU102 (avec un seul pont « GeForce RTX NVLink-Bridge » ) GeForce RTX 3090 basée sur GA102 (avec « GeForce RTX NVLink-Bridge (pour les produits de la série 30) ») Quadro RTX 5000 basé sur TU104 (avec un seul pont « NVLink » jusqu'à 50 Go/s - cela pourrait ressembler à NVLink 2.0 avec 25 GT/s et 1 lien) Quadro RTX 6000 basé sur TU102 (avec un seul pont « NVLink HB » jusqu'à 100 Go/s - cela pourrait ressembler à NVLink 2.0 avec 25 GT/s et 2 liens) Quadro RTX 8000 basé sur TU102 (avec un seul pont « NVLink HB » jusqu'à 100 Go/s - cela pourrait ressembler à NVLink 2.0 avec 25 GT/s et 2 liens) Logiciels et programmation de service Pour les gammes de produits Tesla, Quadro et Grid, l'API NVML (Nvidia Management Library API) offre un ensemble de fonctions permettant de contrôler par programmation certains aspects des interconnexions NVLink sous Windows et Linux, tels que l'évaluation et la gestion des versions des composants, ainsi que la consultation de l'état et des erreurs et la surveillance des performances. De plus, grâce à la bibliothèque NCCL (Nvidia Collective Communications Library), les développeurs peuvent réaliser des implémentations performantes pour l'intelligence artificielle et d'autres applications gourmandes en calcul sur NVLink. La page « Paramètres 3D » » « Configurer SLI, Surround, PhysX » du panneau de configuration Nvidia et l' exemple d'application CUDA « simpleP2P » utilisent ces API pour leurs services liés aux fonctionnalités NVLink. Sous Linux, l'application en ligne de commande avec la sous-commande « nvidia-smi nvlink » offre des informations et un contrôle avancés similaires. Histoire Le 5 avril 2016, Nvidia a annoncé l'intégration de NVLink dans le GPU GP100 basé sur la microarchitecture Pascal , utilisé notamment dans les produits Nvidia Tesla P100. Avec l'introduction du système de calcul haute performance DGX-1, il est possible d'intégrer jusqu'à huit modules P100 dans un seul rack, connectés à deux processeurs hôtes au maximum. La carte porteuse (...) permet de dédier le routage des connexions NVLink : chaque P100 nécessite 800 broches, dont 400 pour le PCIe et l'alimentation, et 400 supplémentaires pour les NVLink, soit près de 1 600 pistes pour les seuls NVLink (...). Chaque processeur est connecté directement à quatre modules P100 via PCIe, et chaque P100 dispose d'une liaison NVLink vers chacun des trois autres modules P100 du même groupe de processeurs, ainsi que d'une liaison NVLink supplémentaire vers un module P100 du groupe de processeurs opposé. Chaque NVLink (interface de liaison) offre un débit bidirectionnel de 20 Go/s en upload et 20 Go/s en download, avec 4 liaisons par GPU GP100, pour une bande passante totale de 80 Go/s en upload et 80 Go/s en download. NVLink prend en charge le routage, de sorte que dans l'architecture DGX-1, pour chaque P100, 4 des 7 autres P100 sont directement accessibles et les 3 restantes sont accessibles en un seul saut. D'après les publications de blog de Nvidia, NVLink permet depuis 2014 de regrouper des liaisons individuelles pour améliorer les performances point à point. Ainsi, par exemple, une architecture avec deux P100 et toutes les liaisons établies entre les deux unités permettrait d'exploiter pleinement la bande passante NVLink de 80 Go/s entre elles. Lors de la GTC2017, Nvidia a présenté sa génération de GPU Volta et a indiqué l'intégration d'une version 2.0 révisée de NVLink qui permettrait des débits de données d'E/S totaux de 300 Go/s pour une seule puce pour cette conception. Nvidia a également annoncé la possibilité de précommander, avec une promesse de livraison pour le troisième trimestre 2017, les ordinateurs hautes performances DGX-1 et DGX-Station, qui seront équipés de modules GPU de type V100 et de NVLink 2.0, soit en réseau (deux groupes de quatre modules V100 avec connectivité inter-groupes), soit de manière entièrement interconnectée (un seul groupe de quatre modules V100). En 2017-2018, IBM et Nvidia ont livré les supercalculateurs Summit et Sierra au Département de l'Énergie des États-Unis qui combinent la famille de processeurs POWER9 d'IBM et l'architecture Volta de Nvidia , utilisant NVLink 2.0 pour les interconnexions CPU-GPU et GPU-GPU et InfiniBand EDR pour les interconnexions du système. En 2020, Nvidia a annoncé qu'elle n'ajouterait plus de nouveaux profils de pilotes SLI sur les séries RTX 2000 et antérieures à partir du 1er janvier 2021. En 2022, le connecteur NVLink a été supprimé de l'architecture Ada Lovelace. Le PDG de Nvidia, Jensen Huang, a précisé que les E/S ainsi libérées seraient utilisées pour le traitement de l'IA et que l'entreprise prévoyait une transition vers la norme PCIe Gen 5.0. Certains utilisateurs ont signalé la présence de traces de connecteurs NVLink supprimés sur certaines cartes mères. La technologie NVLink reste disponible pour les centres de données et les entreprises. Soutien d'autres fabricants En 2025, NVLink Fusion a été annoncé afin de permettre aux concepteurs de puces d'acquérir une licence et d'intégrer NVLink à leurs produits. Par la suite, NVLink Fusion a été acquis sous licence par ARM et SiFive pour leurs produits de centres de données, et par Amazon Web Services pour son futur accélérateur Trainium4 . Plus d articles de Worldlex Wiki Revenez a l index pour explorer davantage de pages sur l histoire, la science, la culture, la geographie et la societe en francais. Explorer l index Worldlex Wiki Encyclopedie et articles de reference en francais A propos Conditions Confidentialite Contact