Quest-ce que NUMA ?

Si l'argent n'est pas un problème, vous pouvez acheter toutes les pièces de PC grand public les plus chères et construire un PC puissant pour consulter vos e-mails et faire défiler les réseaux sociaux. Bien sûr, ce n'est pas ainsi que la plupart des gens achètent des choses ; ce n'est même pas la façon dont les gens riches achètent des choses, car ce n'est pas un excellent moyen de rester riche. Au lieu de cela, la plupart des gens regardent ce qu'ils veulent faire avec un ordinateur, puis trouvent un ordinateur doté du matériel approprié.

Sur le marché domestique, il y a une quantité décente de choix, mais une fois que vous arrivez sur le marché des stations de travail et des serveurs, il existe des options encore plus puissantes pour encore plus d'argent. Par exemple, le meilleur PC que vous pouvez construire à la maison prend en charge 16 cœurs ( ou 24 si vous comptez les cœurs d'efficacité d'Intel ). Vous pouvez également obtenir un GPU puissant. Techniquement, vous pouvez obtenir plusieurs GPU puissants, mais vous ne pouvez pas les utiliser ensemble car SLI/NVLINK est essentiellement mort.

Sur le marché des serveurs et des stations de travail, vous pouvez obtenir beaucoup plus de cœurs dans un processeur, jusqu'à 96 dans la gamme EPYC d'AMD. Vous pouvez également obtenir des GPU avec des interconnexions plus performantes et plus de VRAM. Les cœurs de processeur, cependant, sont là où va beaucoup d'argent, en particulier dans les mondes HPC ( calcul haute performance ), Hyperscaler et Supercomputing. Alors, que faites-vous si vous avez besoin de plus de 96 cœurs sur un ordinateur ? Ajoutez plus de processeurs, évidemment.

Cartes mères multi-sockets

Bien sûr, vous ne pouvez pas simplement installer un deuxième processeur sur n'importe quelle ancienne carte mère ; il n'y aurait nulle part où aller. Vous avez besoin de matériel spécifique. AMD prend en charge la possibilité de placer deux de leurs processeurs de serveur EPYC sur la même carte mère. Cela offre un total de 192 cœurs ou 384 threads. Les derniers processeurs de serveur d'Intel atteignaient un maximum de 40 cœurs, bien que la génération précédente comportait un modèle à 56 cœurs. Intel, cependant, prend en charge jusqu'à 8 processeurs sur une seule carte mère. C'est 320 ou 448 cœurs et 640 ou 896 threads. Bien que cela soit exagéré pour vérifier Instagram, certaines charges de travail peuvent utiliser toute cette puissance.

Le problème vient de la mémoire. Quatre choses limitent généralement les processeurs. Le premier est un manque de choses à faire; parfois, le CPU n'est tout simplement pas chargé. Ensuite, vous avez de l'énergie, il n'y a qu'une quantité d'énergie que vous pouvez tirer avant de commencer à endommager le processeur, et des limites sont en place pour garantir que le processeur ne risque pas de s'épuiser lorsqu'il est à pleine charge. Vous avez également la pression de température étroitement liée, plus vous utilisez de puissance, plus vous générez de chaleur et devez la dissiper ; la surchauffe est tout aussi mauvaise que trop de puissance car les choses commencent à fondre. L'autre limitation est l'accès à la mémoire.

Un processeur a généralement besoin de beaucoup de données pour effectuer de nombreux traitements. Tout cela est stocké dans la RAM. Malheureusement, la RAM est assez lente par rapport à un CPU. Cela peut le laisser inactif pendant des « éternités » avant qu'il n'obtienne les données dont il a besoin pour fonctionner. Le cache CPU aide beaucoup, mais il est si petit qu'il ne peut pas tout couvrir, et la mémoire principale doit être accessible.

Latence de la mémoire

Pour minimiser l'effet de la lenteur de la RAM, elle est physiquement placée aussi près que possible du CPU. C'est pourquoi la RAM est toujours située directement à côté du socket CPU sur une carte mère. Mais que se passe-t-il si vous avez plusieurs processeurs sur une seule carte mère ? Ensuite, il y a un temps d'accès différent pour qu'un CPU accède à sa mémoire par rapport à la mémoire à côté d'un autre. "Oh non", pourriez-vous dire, "certaines mémoires sont légèrement plus lentes". Mais il s'agit d'un problème réel qui peut avoir un effet étonnamment profond sur les performances. Ce concept est appelé accès mémoire non uniforme, ou NUMA.

NUMA implique de fournir un mécanisme permettant au système d'exploitation de comprendre que même s'il peut accéder à toute la mémoire, certaines parties sont préférées pour certaines choses par rapport à d'autres. Dans la mesure du possible, le système d'exploitation stocke ensuite les données des tâches exécutées sur CPU1 dans la RAM directement à côté de CPU1. De même, les données nécessaires à une tâche s'exécutant sur CPU2 sont stockées dans la RAM directement à côté de CPU2. Bien sûr, avec des capacités de RAM limitées et des ensembles de données volumineux, il n'est pas toujours possible de rester dans ces limites. Pourtant, les meilleurs efforts sont faits et ont un impact significatif sur les performances.

L'accès à la mémoire sur un seul canal est également séquentiel. Cela signifie que lorsque deux processeurs différents tentent d'accéder aux données sur le même canal, l'un directement connecté au DIMM et l'autre saut NUMA, la deuxième demande doit non seulement attendre, inactive, sa demande mais aussi la demande de l'autre processeur. Ainsi, dans la mesure du possible, les données doivent être stockées sur la RAM directement à côté du CPU qui en aura besoin.

Conclusion

NUMA signifie Accès mémoire non uniforme. C'est un terme utilisé dans les systèmes informatiques avec plusieurs processeurs physiques. Cela fait référence au fait qu'un processeur aura une latence de mémoire différente de la RAM qui l'entoure directement par rapport à la RAM entourant un autre processeur. La latence supplémentaire diminue les performances du système de plusieurs façons. NUMA est un moyen d'informer le système d'exploitation que c'est le cas.

Cela lui permet d'optimiser l'utilisation de la mémoire et la localité des données en fonction du processeur qui a besoin des données. Dans la mesure du possible, toutes les données des processus exécutés sur un CPU sont stockées dans la RAM directement attachée à ce CPU. Lorsque la RAM locale n'a pas une capacité suffisante, les données peuvent déborder dans la RAM autour d'autres processeurs. Là encore, dans la mesure du possible, le nombre de sauts NUMA est minimisé pour réduire la latence.



Leave a Comment

Comment cloner un disque dur

Comment cloner un disque dur

À l’ère numérique moderne, où les données constituent un atout précieux, le clonage d’un disque dur sous Windows peut être un processus crucial pour beaucoup. Ce guide complet

Comment réparer le pilote WUDFRd qui n’a pas pu se charger sous Windows 10 ?

Comment réparer le pilote WUDFRd qui n’a pas pu se charger sous Windows 10 ?

Êtes-vous confronté au message d'erreur lors du démarrage de votre ordinateur indiquant que le pilote WUDFRd n'a pas pu se charger sur votre ordinateur ?

Comment réparer le code derreur 0x0003 de NVIDIA GeForce Experience

Comment réparer le code derreur 0x0003 de NVIDIA GeForce Experience

Rencontrez-vous le code d’erreur 0x0003 de l’expérience NVIDIA GeForce sur votre bureau ? Si oui, lisez le blog pour savoir comment corriger cette erreur rapidement et facilement.

How to Use Auto Clicker for Chromebook

How to Use Auto Clicker for Chromebook

Today, were going to delve into a tool that can automate repetitive clicking tasks on your Chromebook: the Auto Clicker. This tool can save you time and

Comment supprimer un GPU dun PC Windows en 2023

Comment supprimer un GPU dun PC Windows en 2023

Avez-vous besoin de retirer le GPU de votre PC ? Rejoignez-moi pour expliquer comment supprimer un GPU de votre PC dans ce guide étape par étape.

Comment installer un SSD NVMe sur un ordinateur de bureau et un ordinateur portable

Comment installer un SSD NVMe sur un ordinateur de bureau et un ordinateur portable

Vous avez acheté un nouveau SSD NVMe M.2 mais vous ne savez pas comment l'installer ? Lisez la suite pour savoir comment installer un SSD NVMe sur un ordinateur portable ou un ordinateur de bureau.

Quest-ce quune bombe logique ?

Quest-ce quune bombe logique ?

Une bombe logique est un incident de sécurité où un attaquant met en place une action différée. Continuez à lire pour en savoir plus.

Quest-ce que Stuxnet ?

Quest-ce que Stuxnet ?

Stuxnet était un ver auto-propagé. Il s'agissait de la première utilisation d'une cyber-arme et du premier malware.

Quest-ce quun hacker éthique ?

Quest-ce quun hacker éthique ?

Un hacker éthique est un hacker qui agit dans les limites de la loi. Continuez à lire pour en savoir plus sur le sujet.

Quest-ce que le chiffrement symétrique ?

Quest-ce que le chiffrement symétrique ?

Il existe de nombreuses parties différentes de la cryptographie. Si vous souhaitez chiffrer certaines données, vous pouvez utiliser deux types d'algorithmes : symétrique