Les composants d'un GPU. Un processeur graphique ( GPU ) est un circuit électronique spécialisé conçu pour le traitement d'images numériques et l'accélération du rendu graphique...
Bien qu'il n'existe pas de définition unique du terme, et qu'il puisse désigner tout système d'affichage vidéo, un GPU moderne inclut la capacité d'effectuer en interne les calculs nécessaires à diverses tâches graphiques, comme la rotation et la mise à l'échelle d'images 3D, et souvent la capacité supplémentaire d'exécuter des programmes personnalisés appelés shaders . Ceci contraste avec les anciens contrôleurs graphiques, appelés contrôleurs d'affichage vidéo, qui ne disposaient d'aucune capacité de calcul interne, ou avec les blitters , qui effectuaient uniquement des opérations de déplacement de mémoire basiques. Le GPU moderne a émergé dans les années 1990, ajoutant la capacité d'effectuer des opérations telles que le tracé de lignes et de texte sans l'aide du CPU , et plus tard, des fonctionnalités 3D.
Intel , Nvidia et AMD / ATI dominaient le marché, avec respectivement 49,4 %, 27,8 % et 20,6 % de parts de marché. Par ailleurs, Matrox qui produisait initialement des solutions sur mesure, personnalise désormais des GPU Intel et AMD pour les stations de travail. Des entreprises chinoises comme Jingjia Micro ont également fabriqué des GPU pour le marché intérieur, mais leurs ventes mondiales restent inférieures à celles des leaders du marché.
Fonctions de calcul
Le GPU ATI HD5470 (ci-dessus, avec caloduc en cuivre ) est doté de la technologie UVD 2.1 qui lui permet de décoder les formats vidéo AVC et VC-1.
Plusieurs facteurs liés à la conception du GPU influent sur ses performances en rendu temps réel, notamment la taille des pistes de connexion lors de la fabrication du semi-conducteur , la fréquence du signal d'horloge et le nombre et la taille des différents caches mémoire intégrés . Les performances dépendent également du nombre de multiprocesseurs de flux (SM) pour les GPU Nvidia, d'unités de calcul (CU) pour les GPU AMD ou de cœurs Xe pour les GPU Intel basés sur l'architecture Xe. Ces unités correspondent au nombre de cœurs de processeur intégrés au GPU qui effectuent les calculs principaux, généralement en parallèle avec d'autres SM/CU. Les performances d'un GPU sont généralement mesurées en opérations en virgule flottante par seconde ( FLOPS ) ; les GPU modernes offrent généralement des performances mesurées en téraflops (TFLOPS). Il s'agit d'une estimation et non d'une valeur absolue, car d'autres facteurs peuvent affecter les performances réelles.
Dans les ordinateurs personnels, il existe deux principaux types de GPU : les graphiques dédiés (également appelés graphiques discrets) et les graphiques intégrés (également appelés solutions graphiques partagées, processeurs graphiques intégrés (IGP) ou architecture de mémoire unifiée (UMA)).
Unité de traitement graphique dédiée
une mémoire vive embarquée spécifique , dédiée au GPU, plutôt que la mémoire système principale de l'ordinateur. Cette mémoire vive est généralement sélectionnée en fonction de la charge de travail séquentielle attendue de la carte graphique, comme la GDDR SDRAM . Cela offre des gains de performance considérables, mais présente l'inconvénient d'une saturation de la mémoire dédiée, entraînant une baisse des performances.
Des technologies telles que SLI ( Scalable Link Interface ), NVLink et CrossFire permettent à plusieurs GPU de générer simultanément des images sur un seul écran, augmentant ainsi la puissance de traitement graphique disponible. Cependant, ces technologies sont de moins en moins répandues ; la plupart des jeux n'exploitent pas pleinement plusieurs GPU, car la plupart des utilisateurs n'ont pas les moyens de se les procurer. On retrouve encore plusieurs GPU sur les supercalculateurs (comme Summit ) ; sur les stations de travail pour accélérer le traitement vidéo (traitement simultané de plusieurs flux vidéo) et le rendu 3D ; pour les effets visuels (VFX) ; pour les charges de travail des unités de traitement graphique à usage général (GPGPU) et pour les simulations ; et en intelligence artificielle pour accélérer l'apprentissage, comme c'est le cas avec la gamme de stations de travail et de serveurs DGX de Nvidia.Position d'un GPU intégré dans une architecture système pont nord / pont sud .Une carte mère ASRock avec carte graphique intégrée, dotée de ports HDMI, VGA et DVI.
Les unités de traitement graphique intégrées (IGPU), également appelées solutions graphiques partagées , processeurs graphiques intégrés (IGP) ou architectures de mémoire unifiées (UMA), utilisent une partie de la mémoire vive (RAM) du système plutôt que de la mémoire graphique dédiée. Les IGP peuvent être intégrés à la carte mère, soit au sein de son chipset Northbridge [ soit sur la même puce (circuit intégré) que le processeur, comme l'unité de traitement accéléré (APU) d'AMD ou la carte graphique Intel HD Graphics . Les IGPU et les APU sont moins coûteux à mettre en œuvre que les processeurs graphiques dédiés, mais leurs performances sont généralement moindres. Le traitement graphique intégré était considéré comme inadapté aux jeux 3D et aux programmes gourmands en ressources graphiques, mais pouvait exécuter des programmes moins exigeants tels qu'Adobe Flash. On peut citer comme exemples d'IGP les solutions proposées par SiS et VIA vers 2004 Cependant, les processeurs graphiques intégrés modernes, tels que les unités de traitement accéléré d'AMD et la technologie graphique Intel, peuvent même faire tourner des jeux AAA avec des paramètres graphiques réduits. entre sa mémoire vidéo (VRAM) et son cœur GPU. Cette bande passante du bus mémoire peut limiter les performances de l'iGPU, bien que la mémoire multicanal puisse atténuer ce défaut
Sur les systèmes dotés d'une « architecture de mémoire unifiée » (UMA), y compris les processeurs AMD modernes avec graphiques intégrés, les processeurs Intel modernes avec graphiques intégrés, les processeurs Apple et les consoles modernes, les cœurs du processeur et le bloc GPU partagent le même pool de RAM et d'espace d'adressage mémoire.processeur vectoriel , exécutant des noyaux de calcul . Ceci transforme la puissance de calcul massive du pipeline de shaders d'un accélérateur graphique moderne en une puissance de calcul à usage général. Dans certaines applications nécessitant des opérations vectorielles massives, les performances peuvent ainsi être plusieurs ordres de grandeur supérieures à celles d'un processeur classique. Les deux principaux concepteurs de GPU discrets, AMD et Nvidia , explorent cette approche avec un large éventail d'applications. Nvidia et AMD ont collaboré avec l'Université de Stanford pour créer un client GPU pour le projet de calcul distribué Folding@home , dédié aux calculs de repliement des protéines. Dans certains cas, le GPU calcule quarante fois plus vite que les processeurs traditionnellement utilisés par ces applications.
Les ordinateurs à hautes performances basés sur le GPU jouent un rôle important dans la modélisation à grande échelle. Trois des dix supercalculateurs les plus puissants au monde tirent parti de l'accélération GPU.
Depuis 2005, l'utilisation des performances des GPU pour le calcul évolutionnaire en général, et pour l'accélération de l' évaluation de la fitness en programmation génétique en particulier, suscite un intérêt croissant . La plupart des approches compilent les programmes linéaires ou arborescents sur l'ordinateur hôte et transfèrent l'exécutable vers le GPU pour exécution. Généralement, un gain de performance n'est obtenu qu'en exécutant simultanément le programme actif sur de nombreux problèmes d'exemple en parallèle, grâce à l' architecture SIMD ( Single Instruction, Multiple Data ) du GPU . Une accélération substantielle peut également être obtenue en ne compilant pas les programmes et en les transférant plutôt sur le GPU pour y être interprétés.
GPU externe (eGPU)
Il est possible de connecter un GPU à un bus externe d'un ordinateur portable. Seul le bus PCI Express est utilisé à cet effet. Le port peut être, par exemple, un port ExpressCard ou mPCIe (PCIe ×1, jusqu'à 5 ou 2,5 gigabits par seconde respectivement), un port Thunderbolt 1, 2 ou 3 (PCIe ×4, jusqu'à 10, 20 ou 40 gigabits par seconde respectivement), un port USB 4 compatible Thunderbolt ou un port OCuLink . Ces ports ne sont disponibles que sur certains ordinateurs portables. Les boîtiers eGPU intègrent leur propre alimentation, car les GPU puissants peuvent consommer plusieurs centaines de watts.
Histoire
Brochure du terminal Adage Graphics de 1968
Les premiers terminaux graphiques 3D dédiés remontent à l' Adage AGT-30 de 1967, équipé de processeurs matriciels analogiques . En 1969, Evans & Sutherland (E&S) lance le Line Drawing System-1 (LDS-1), premier système entièrement numérique permettant la multiplication matricielle. Toujours en 1969, le terminal graphique économique IMLAC PDS-1 est commercialisé. Il sera par la suite utilisé comme console de jeux 3D, notamment pour le jeu Maze War.
années 1970
Dans les années 1970, le terme « GPU » signifiait à l'origine « unité de traitement graphique » et décrivait une unité de traitement programmable fonctionnant indépendamment du CPU et responsable de la manipulation et de l'affichage des graphiques.
En 1972, le système PLATO IV entre en service à l' Université de l'Illinois à Urbana-Champaign , dans le domaine du matériel professionnel . Entre 1973 et 1978 environ, plusieurs jeux 3D filaires multijoueurs en réseau sont développés et popularisés par les utilisateurs du système. Toujours en 1972, le système E&S Continuous Tone 1 (CT1), surnommé « boîte Watkins » (composé d'un E&S LDS-2 et d' un système d'affichage ombré ), est livré à l'Université Case Western Reserve . Il offrait le premier rendu de Gouraud en temps réel . En 1975, une collaboration entre Evans & Sutherland Computer Corporation et le département d'infographie de l'Université de l'Utah aboutit au tout premier tampon d'images vidéo MOSFET , capable d'afficher des couleurs et des dégradés fluides. Le système E&S Continuous Tone 3 (CT3) est livré en 1977 à Lufthansa pour la formation des pilotes par simulation informatique. Il s'agissait du premier système graphique capable de réaliser un mappage de textures en temps réel. Ikonas a fabriqué des systèmes graphiques avec des graphismes 8 et 24 bits et une accélération 3D à la fin des années 70. Les cartes mères des systèmes d'arcade utilisent des circuits graphiques 2D spécialisés depuis les années 1970. Dans les premiers matériels de jeux vidéo, la RAM pour les tampons d'images était coûteuse, les puces vidéo composaient donc les données au fur et à mesure que l'affichage était balayé sur le moniteur.
Dans les années 1980, des progrès significatifs ont été réalisés dans le domaine du matériel graphique 3D professionnel. Le plus marquant fut sans doute le développement, en 1981, du Geometry Engine , un processeur vectoriel ASIC VLSI conçu par Jim Clark et Marc Hannah à l'université de Stanford . Ce processeur est le précurseur des cœurs tenseurs modernes et d'autres processeurs similaires commercialisés pour le graphisme et l'IA. Le Geometry Engine a ensuite été utilisé pendant de nombreuses années dans les stations de travail Silicon Graphics . Le premier produit de Silicon Graphics, commercialisé en novembre 1983, était l'IRIS 1000, un terminal doté d'un traitement graphique 3D matériel basé sur le Geometry Engine. Le Geometry Engine était capable d'effectuer environ 6 millions d'opérations par seconde.
Le NEC μPD7220 de 1981 fut la première puce de processeur graphique pour ordinateur personnel à intégrer à grande échelle (LSI) . Ceci permit la conception de cartes graphiques vidéo performantes et économiques, comme celles de Number Nine Visual Technology . Il devint le GPU le plus connu jusqu'au milieu des années 1980. Premier processeur graphique VLSI (très grande échelle) à semi-conducteur métal-oxyde (NMOS) entièrement intégré pour PC , il prenait en charge une résolution jusqu'à 1024 × 1024 pixels et a jeté les bases du marché des graphismes pour PC. Il fut utilisé dans de nombreuses cartes graphiques et sa licence fut utilisée pour des clones tels que l'Intel 82720, le premier processeur graphique d'Intel . Les jeux d'arcade de Williams Electronics Robotron: 2084 , Joust , Sinistar et Bubbles , tous sortis en 1982, contiennent des puces blitter personnalisées pour fonctionner sur des bitmaps 16 couleurs.
En 1984, Hitachi a commercialisé l'ARTC HD63484, le premier processeur graphique CMOS majeur pour ordinateurs personnels. L'ARTC pouvait afficher une résolution jusqu'à 4K en mode monochrome . Il a été utilisé dans plusieurs cartes graphiques et terminaux à la fin des années 1980.
MOS 8367R0 – Agnus
En 1985, l' Amiga est sorti avec une puce graphique personnalisée appelée Agnus , intégrant un blitter pour la manipulation d'images bitmap, le tracé de lignes et le remplissage de zones. Il comprenait également un coprocesseur doté de son propre jeu d'instructions simplifié, capable de manipuler les registres matériels graphiques en synchronisation avec le faisceau vidéo (par exemple pour les changements de palette par ligne de balayage, le multiplexage de sprites et le fenêtrage matériel), ou de piloter le blitter.Professional Graphics Controller , conçu par Curtis Priem , futur cofondateur de Nvidia. Cette carte graphique 3D rudimentaire, dotée d'une résolution Matrox ), et son signal RGB analogique mena directement à la norme vidéo VGA. Plus tard dans les années 80, Priem travailla sur la carte graphique 2D accélérée Sun Microsystems GX (également connue sous le nom de cgsix), qui connut un grand succès.
Adaptateur Micro Channel IBM 8514 , avec module de mémoire supplémentaire
En 1987, le système graphique IBM 8514 fut commercialisé. Il s'agissait de l'une des premières cartes vidéo pour PC compatibles IBM à implémenter des primitives 2D à fonction fixe en matériel électronique . Le X68000 de Sharp , sorti en 1987, utilisait un chipset graphique personnalisé avec une palette de 65 536 couleurs et une prise en charge matérielle des sprites, du défilement et de plusieurs zones de jeu . Il servit de machine de développement pour la carte d'arcade CP System de Capcom . L'ordinateur FM Towns de Fujitsu , sorti en 1989, prenait en charge une palette de 16 777 216 couleurs
En 1988, SGI a vendu la station de travail graphique IRIS avec 10 à 12 moteurs géométriques et a introduit la carte d'extension IrisVision pour le bus IBM MicroChannel ( RS/6000 ) également basée sur le moteur géométrique.
Les années 1990 ont de nouveau été marquées par des progrès considérables dans le domaine des cartes graphiques 3D professionnelles pour stations de travail, notamment grâce à Sun Microsystems et SGI. L'introduction d' OpenGL par SGI en 1992 a ouvert la voie à des interfaces de programmation 3D standard et indépendantes du matériel. Cependant, vers la fin des années 1990, le matériel professionnel a progressivement été supplanté par des produits grand public offrant des performances similaires, voire supérieures, en particulier en matière de texturage, à moindre coût et sur des plateformes familières aux utilisateurs finaux.
En 1991, S3 Graphics lança la S3 86C911 , baptisée ainsi en référence à la Porsche 911, afin de souligner le gain de performances promis. La 86C911 inspira de nombreux imitateurs : dès 1995, tous les principaux fabricants de puces graphiques pour PC avaient intégré la prise en charge de l’accélération 2D à leurs puces. Les accélérateurs Windows à fonction fixe surpassèrent les coprocesseurs graphiques généralistes onéreux en termes de performances sous Windows, et ces derniers disparurent du marché des PC.
Au début et au milieu des années 1990, les graphismes 3D en temps réel se sont généralisés dans les jeux d'arcade, sur ordinateur et sur consoles, entraînant une demande croissante du public pour des graphismes 3D accélérés par le matériel. Les premiers exemples de matériel graphique 3D grand public se trouvent dans les systèmes d'arcade tels que la Sega Model 1 , la Namco System 22 et la Sega Model 2 , ainsi que dans les consoles de jeux vidéo de cinquième génération comme la Saturn , la PlayStation et la Nintendo 64. Les systèmes d'arcade comme la Sega Model 2 et le simulateur Namco Magic Edge Hornet, basé sur la SGI Onyx, étaient capables d'effectuer des opérations matérielles de transformation, d'écrêtage et d'éclairage (T&L ) en 1993, des années avant leur apparition dans les cartes graphiques grand public. En 1994, Sony a utilisé le terme GPU (pour « unité de traitement graphique ») en référence au GPU Sony conçu par Toshiba pour la console PlayStation.
En octobre 2002, avec l'introduction de l' ATI Radeon 9700 (également connue sous le nom de R300), le premier accélérateur Direct3D 9.0 au monde, les shaders de pixels et de vertex pouvaient désormais implémenter des boucles et des calculs complexes en virgule flottante . Ils devenaient rapidement aussi flexibles que les processeurs, tout en étant considérablement plus rapides pour les opérations sur les tableaux d'images. Le pixel shading est souvent utilisé pour le bump mapping , qui ajoute de la texture pour donner à un objet un aspect brillant, mat, rugueux, voire rond ou extrudé.
Avec l'introduction de la série Nvidia GeForce 8 et de nouvelles unités de traitement de flux génériques, les GPU sont devenus des dispositifs de calcul plus polyvalents. Les GPU parallèles gagnent du terrain face aux CPU en matière de puissance de calcul, et un sous-domaine de recherche, appelé calcul GPU ou GPGPU ( pour calcul à usage général sur GPU) , a trouvé des applications dans des domaines aussi divers que l'apprentissage automatique , l'exploration pétrolière , le traitement d'images scientifiques , l'algèbre linéaire , les statistiques , la reconstruction 3D et la tarification des options boursières . Les GPGPU ont été les précurseurs de ce que l'on appelle aujourd'hui un shader de calcul (par exemple CUDA , OpenCL , DirectCompute ) et exploitaient en quelque sorte le matériel en traitant les données transmises aux algorithmes comme des textures et en exécutant les algorithmes en dessinant un triangle ou un quadrilatère avec un shader de pixels approprié. convertisseur de balayage sont sollicitées alors qu'elles ne sont pas nécessaires (et les manipulations de triangles ne sont généralement pas un problème, sauf pour invoquer le shader de pixels).Khronos Group qui permet le développement de code pour GPU et CPU, en mettant l'accent sur la portabilité . Les solutions OpenCL sont prises en charge par Intel, AMD, Nvidia et ARM, et selon un rapport d' Evans Data de 2011 , OpenCL était devenu le deuxième outil HPC le plus populaire
années 2010
En 2010, Nvidia s'est associé à Audi pour équiper les tableaux de bord de ses véhicules, utilisant le GPU Tegra afin d'améliorer les fonctionnalités des systèmes de navigation et de divertissement. Les progrès réalisés dans le domaine des GPU automobiles ont contribué à l'essor de la conduite autonome . Les cartes graphiques AMD Radeon HD série 6000 ont été lancées en 2010, et en 2011, AMD a commercialisé ses GPU discrets série 6000M pour appareils mobiles. La gamme de cartes graphiques Kepler de Nvidia a été lancée en 2012 et utilisée dans les séries 600 et 700. Cette microarchitecture GPU intégrait notamment la technologie GPU Boost, qui ajuste la fréquence d'horloge de la carte graphique en fonction de sa consommation électrique. Kepler a également introduit la technologie d'accélération de l'encodage vidéo NVENC .
La PS4 et la Xbox One sont sorties en 2013 ; elles utilisaient toutes deux des GPU basés sur les Radeon HD 7850 et 7790 d'AMD . La gamme de GPU Kepler de Nvidia a été suivie par la gamme Maxwell , fabriquée selon le même procédé. Les puces 28 nm de Nvidia étaient fabriquées par TSMC à Taïwan selon le procédé 28 nm. Comparé à la technologie 40 nm précédente, ce procédé de fabrication permettait un gain de performance de 20 % tout en consommant moins d'énergie. Les casques de réalité virtuelle ont des exigences système élevées ; les fabricants recommandaient la GTX 970 et la R9 290X, ou une carte graphique supérieure, lors de leur sortie. Les cartes basées sur la microarchitecture Pascal sont sorties en 2016. La série GeForce 10 appartient à cette génération de cartes graphiques. Elles sont fabriquées selon le procédé 16 nm, qui représente une amélioration par rapport aux microarchitectures précédentes.
En 2018, Nvidia a lancé la série de GPU RTX 20, intégrant des cœurs dédiés au ray tracing et permettant ainsi un rendu performant du ray tracing en temps réel sur du matériel grand public. Les GPU Polaris 11 et Polaris 10 d'AMD sont gravés en 14 nm. Leur lancement a permis d'améliorer considérablement le rendement énergétique des cartes graphiques AMD. AMD a également lancé la série de GPU Vega pour le marché haut de gamme, afin de concurrencer les cartes Pascal haut de gamme de Nvidia. Cette série Vega intègre également de la mémoire HBM2 , à l'instar de la Titan V.Graphics Core Next ). Baptisée RDNA , cette architecture a été intégrée à la série de cartes graphiques Radeon RX 5000. L'entreprise a annoncé que la suite de la microarchitecture RDNA serait une mise à jour progressive. AMD a ainsi dévoilé la série Radeon RX 6000 , ses cartes graphiques RDNA 2 compatibles avec le ray tracing matériel. Lancée fin 2020, cette série comprenait les RX 6800, RX 6800 XT et RX 6900 XT. La RX 6700 XT, basée sur Navi 22, a été lancée début 2021.
La PlayStation 5 et les Xbox Series X et Series S sont sorties en 2020 ; elles utilisent toutes deux des GPU basés sur la microarchitecture RDNA 2 avec des améliorations progressives et des configurations GPU différentes selon le système.
années 2020
massivement parallèles , comme l'entraînement de réseaux neuronaux sur d'énormes ensembles de données nécessaires aux grands modèles de langage pour l'intelligence artificielle . Les cœurs de traitement spécialisés de la plupart des GPU modernes, dédiés à l'apprentissage profond, offrent des gains de performance significatifs en FLOPS , grâce à la multiplication et à la division de matrices 4×4. Les premières implémentations, telles que la microarchitecture Volta de Nvidia , sortie en 2017 ont atteint des performances allant jusqu'à 128 TFLOPS dans certaines applications
Depuis, les cœurs d'accélération IA sont devenus une fonctionnalité largement répandue dans les microarchitectures grand public et professionnelles, à commencer par la microarchitecture Turing de Nvidia en 2018 , appelée cœurs Tensor. Initialement utilisés pour le Deep Learning Super Sampling (DLSS) afin d'améliorer les performances de jeu et la qualité d'image, ils sont désormais intégrés au logiciel Broadcast de Nvidia pour fournir de nombreux effets basés sur l'IA, tels que le filtrage vocal et la réduction du bruit vidéo, ainsi qu'à d'autres logiciels comme Blender pour le DLSS dans la fenêtre d'affichage.
AMD a initialement implémenté ses cœurs « Matrix » équivalents pour le grand public dans son architecture RDNA 3. Cependant, les cœurs Matrix de RDNA 4 ont été les premiers à introduire l'accélération FP8, indispensable pour exploiter pleinement les fonctionnalités FSR Redstone, telles que la mise à l'échelle par apprentissage automatique et la génération d'images. Néanmoins, des modifications apportées par la communauté, sous Linux et Windows, ont permis aux GPU RDNA 2, 3 et concurrents d'exécuter une version moins performante de FSR 4, appelée FSR 4 INT8. La PlayStation 5 Pro , sortie en 2024, dispose de cœurs d'apprentissage automatique personnalisés, dédiés exclusivement à l'accélération INT8, basés sur ceux de RDNA 4 pour la Super Résolution Spectrale PlayStation, afin d'améliorer la fréquence d'images et la qualité d'image.
Intel a intégré ses cœurs « XMX » équivalents dans tous ses GPU Arc , à commencer par la microarchitecture Alchemist . Ces cœurs sont utilisés pour XeSS (Xe Super Sampling), XeFG (Xe Frame Generation), et bien plus encore.
Le ray tracing a également connu une popularité fulgurante dans les années 2020, certains jeux, comme DOOM: The Dark Ages , exigeant une carte graphique compatible avec le ray tracing matériel pour fonctionner . Bien que cela entraîne une baisse des performances et une accessibilité réduite, id Software a affirmé avoir économisé plusieurs heures de travail et réduit la taille du jeu de plus de 100 gigaoctets, celui-ci étant entièrement conçu autour du ray tracing .
Plus d articles de Worldlex Wiki
Revenez a l index pour explorer davantage de pages sur l histoire, la science, la culture, la geographie et la societe en francais.