Quest-ce que NUMA ?

Si l'argent n'est pas un problème, vous pouvez acheter toutes les pièces de PC grand public les plus chères et construire un PC puissant pour consulter vos e-mails et faire défiler les réseaux sociaux. Bien sûr, ce n'est pas ainsi que la plupart des gens achètent des choses ; ce n'est même pas la façon dont les gens riches achètent des choses, car ce n'est pas un excellent moyen de rester riche. Au lieu de cela, la plupart des gens regardent ce qu'ils veulent faire avec un ordinateur, puis trouvent un ordinateur doté du matériel approprié.

Sur le marché domestique, il y a une quantité décente de choix, mais une fois que vous arrivez sur le marché des stations de travail et des serveurs, il existe des options encore plus puissantes pour encore plus d'argent. Par exemple, le meilleur PC que vous pouvez construire à la maison prend en charge 16 cœurs ( ou 24 si vous comptez les cœurs d'efficacité d'Intel ). Vous pouvez également obtenir un GPU puissant. Techniquement, vous pouvez obtenir plusieurs GPU puissants, mais vous ne pouvez pas les utiliser ensemble car SLI/NVLINK est essentiellement mort.

Sur le marché des serveurs et des stations de travail, vous pouvez obtenir beaucoup plus de cœurs dans un processeur, jusqu'à 96 dans la gamme EPYC d'AMD. Vous pouvez également obtenir des GPU avec des interconnexions plus performantes et plus de VRAM. Les cœurs de processeur, cependant, sont là où va beaucoup d'argent, en particulier dans les mondes HPC ( calcul haute performance ), Hyperscaler et Supercomputing. Alors, que faites-vous si vous avez besoin de plus de 96 cœurs sur un ordinateur ? Ajoutez plus de processeurs, évidemment.

Cartes mères multi-sockets

Bien sûr, vous ne pouvez pas simplement installer un deuxième processeur sur n'importe quelle ancienne carte mère ; il n'y aurait nulle part où aller. Vous avez besoin de matériel spécifique. AMD prend en charge la possibilité de placer deux de leurs processeurs de serveur EPYC sur la même carte mère. Cela offre un total de 192 cœurs ou 384 threads. Les derniers processeurs de serveur d'Intel atteignaient un maximum de 40 cœurs, bien que la génération précédente comportait un modèle à 56 cœurs. Intel, cependant, prend en charge jusqu'à 8 processeurs sur une seule carte mère. C'est 320 ou 448 cœurs et 640 ou 896 threads. Bien que cela soit exagéré pour vérifier Instagram, certaines charges de travail peuvent utiliser toute cette puissance.

Le problème vient de la mémoire. Quatre choses limitent généralement les processeurs. Le premier est un manque de choses à faire; parfois, le CPU n'est tout simplement pas chargé. Ensuite, vous avez de l'énergie, il n'y a qu'une quantité d'énergie que vous pouvez tirer avant de commencer à endommager le processeur, et des limites sont en place pour garantir que le processeur ne risque pas de s'épuiser lorsqu'il est à pleine charge. Vous avez également la pression de température étroitement liée, plus vous utilisez de puissance, plus vous générez de chaleur et devez la dissiper ; la surchauffe est tout aussi mauvaise que trop de puissance car les choses commencent à fondre. L'autre limitation est l'accès à la mémoire.

Un processeur a généralement besoin de beaucoup de données pour effectuer de nombreux traitements. Tout cela est stocké dans la RAM. Malheureusement, la RAM est assez lente par rapport à un CPU. Cela peut le laisser inactif pendant des « éternités » avant qu'il n'obtienne les données dont il a besoin pour fonctionner. Le cache CPU aide beaucoup, mais il est si petit qu'il ne peut pas tout couvrir, et la mémoire principale doit être accessible.

Latence de la mémoire

Pour minimiser l'effet de la lenteur de la RAM, elle est physiquement placée aussi près que possible du CPU. C'est pourquoi la RAM est toujours située directement à côté du socket CPU sur une carte mère. Mais que se passe-t-il si vous avez plusieurs processeurs sur une seule carte mère ? Ensuite, il y a un temps d'accès différent pour qu'un CPU accède à sa mémoire par rapport à la mémoire à côté d'un autre. "Oh non", pourriez-vous dire, "certaines mémoires sont légèrement plus lentes". Mais il s'agit d'un problème réel qui peut avoir un effet étonnamment profond sur les performances. Ce concept est appelé accès mémoire non uniforme, ou NUMA.

NUMA implique de fournir un mécanisme permettant au système d'exploitation de comprendre que même s'il peut accéder à toute la mémoire, certaines parties sont préférées pour certaines choses par rapport à d'autres. Dans la mesure du possible, le système d'exploitation stocke ensuite les données des tâches exécutées sur CPU1 dans la RAM directement à côté de CPU1. De même, les données nécessaires à une tâche s'exécutant sur CPU2 sont stockées dans la RAM directement à côté de CPU2. Bien sûr, avec des capacités de RAM limitées et des ensembles de données volumineux, il n'est pas toujours possible de rester dans ces limites. Pourtant, les meilleurs efforts sont faits et ont un impact significatif sur les performances.

L'accès à la mémoire sur un seul canal est également séquentiel. Cela signifie que lorsque deux processeurs différents tentent d'accéder aux données sur le même canal, l'un directement connecté au DIMM et l'autre saut NUMA, la deuxième demande doit non seulement attendre, inactive, sa demande mais aussi la demande de l'autre processeur. Ainsi, dans la mesure du possible, les données doivent être stockées sur la RAM directement à côté du CPU qui en aura besoin.

Conclusion

NUMA signifie Accès mémoire non uniforme. C'est un terme utilisé dans les systèmes informatiques avec plusieurs processeurs physiques. Cela fait référence au fait qu'un processeur aura une latence de mémoire différente de la RAM qui l'entoure directement par rapport à la RAM entourant un autre processeur. La latence supplémentaire diminue les performances du système de plusieurs façons. NUMA est un moyen d'informer le système d'exploitation que c'est le cas.

Cela lui permet d'optimiser l'utilisation de la mémoire et la localité des données en fonction du processeur qui a besoin des données. Dans la mesure du possible, toutes les données des processus exécutés sur un CPU sont stockées dans la RAM directement attachée à ce CPU. Lorsque la RAM locale n'a pas une capacité suffisante, les données peuvent déborder dans la RAM autour d'autres processeurs. Là encore, dans la mesure du possible, le nombre de sauts NUMA est minimisé pour réduire la latence.



Leave a Comment

Fix Always on Display ne fonctionne pas sur Galaxy Watch

Fix Always on Display ne fonctionne pas sur Galaxy Watch

Pour résoudre les problèmes de Always on Display sur Samsung Galaxy Watch, désactivez le mode d

La mémoire du Chromebook peut-elle être mise à niveau ?

La mémoire du Chromebook peut-elle être mise à niveau ?

Découvrez si la mémoire du Chromebook peut être mise à niveau et comment optimiser ses performances avec la gestion de la RAM.

Comment numériser sur Canon MX492

Comment numériser sur Canon MX492

Apprenez à numériser à partir de limprimante et du scanner multifonctions Canon MX492.

Principes de base de limpression 3D : astuces pour lisser les impressions PLA

Principes de base de limpression 3D : astuces pour lisser les impressions PLA

Vous avez du mal à lisser les impressions PLA ? Ce guide convivial pour les débutants vous montrera comment vous pouvez le faire facilement avec des méthodes efficaces.

Correction dune erreur Chromebook lors de la configuration de limprimante

Correction dune erreur Chromebook lors de la configuration de limprimante

Si votre Chromebook indique qu

Quest-ce que le TDP ?

Quest-ce que le TDP ?

Découvrez ce qu

Comment réinitialiser la clé Amazon Fire TV aux paramètres dusine

Comment réinitialiser la clé Amazon Fire TV aux paramètres dusine

Découvrez comment effectuer une <strong>réinitialisation d

Comment utiliser Spotify dans le nouveau Garmin Venu

Comment utiliser Spotify dans le nouveau Garmin Venu

Découvrez comment connecter votre montre Garmin Venu à Spotify et profitez de vos playlists préférées tout en restant actif !

Comment utiliser Samsung Flow

Comment utiliser Samsung Flow

Découvrez comment utiliser Samsung Flow pour connecter votre smartphone Samsung à votre PC et bénéficier de fonctionnalités avancées telles que le partage de fichiers et la synchronisation des notifications.

Comment faire une capture décran sur un ordinateur portable Chromebook

Comment faire une capture décran sur un ordinateur portable Chromebook

Découvrez comment faire une capture d