Co to jest NUMA?

Jeśli pieniądze nie stanowią problemu, możesz kupić wszystkie najdroższe części do komputerów osobistych i zbudować potężny komputer do sprawdzania poczty e-mail i przeglądania mediów społecznościowych. Oczywiście większość ludzi nie kupuje rzeczy w ten sposób; nie chodzi nawet o to, jak bogaci ludzie kupują rzeczy, ponieważ nie jest to doskonały sposób na pozostanie bogatym. Zamiast tego większość ludzi patrzy na to, co chce zrobić z komputerem, a następnie znajduje komputer z odpowiednim sprzętem.

Na rynku krajowym istnieje przyzwoity wybór, ale gdy dojdziesz do rynku stacji roboczych i serwerów, istnieje kilka jeszcze potężniejszych opcji za jeszcze większe pieniądze. Na przykład najlepszy komputer, jaki możesz zbudować w domu, obsługuje 16 rdzeni ( lub 24, jeśli liczyć wydajne rdzenie Intela ). Możesz także uzyskać potężną kartę graficzną. Technicznie rzecz biorąc, możesz uzyskać wiele potężnych procesorów graficznych, ale nie możesz ich używać razem, ponieważ SLI/NVLINK jest zasadniczo martwy.

Na rynku serwerów i stacji roboczych można uzyskać znacznie więcej rdzeni w procesorze, do 96 w ofercie AMD EPYC. Możesz także uzyskać procesory graficzne z wydajniejszymi połączeniami i większą ilością pamięci VRAM. Rdzenie procesorów są jednak miejscem, w którym idzie dużo pieniędzy, szczególnie w światach HPC ( przetwarzanie o wysokiej wydajności ), hiperskalerów i superkomputerów. Co więc zrobić, jeśli potrzebujesz więcej niż 96 rdzeni w jednym komputerze? Oczywiście dodaj więcej procesorów.

Płyty główne z wieloma gniazdami

Oczywiście nie możesz tak po prostu włożyć drugiego procesora do jakiejkolwiek starej płyty głównej; nie byłoby gdzie się podziać. Potrzebujesz konkretnego sprzętu. AMD obsługuje możliwość umieszczenia dwóch procesorów serwerowych EPYC na tej samej płycie głównej. Daje to łącznie 192 rdzenie lub 384 wątki. Najnowsze serwerowe procesory Intela miały maksymalnie 40 rdzeni, chociaż poprzednia generacja zawierała model 56-rdzeniowy. Intel obsługuje jednak do 8 procesorów na jednej płycie głównej. To 320 lub 448 rdzeni i 640 lub 896 wątków. Chociaż jest to przesada w przypadku sprawdzania Instagrama, niektóre obciążenia mogą wykorzystać całą tę moc.

Problem pochodzi z pamięci. Cztery rzeczy ogólnie ograniczają procesory. Pierwszym z nich jest brak rzeczy do zrobienia; czasami procesor po prostu nie jest obciążony. Następnie masz moc, jest tylko tyle mocy, którą możesz pobrać, zanim zaczniesz uszkadzać procesor, i istnieją ograniczenia, aby upewnić się, że procesor nie jest narażony na ryzyko wypalenia, gdy jest pod pełnym obciążeniem. Masz również ściśle związane ciśnienie temperaturowe, im więcej zużywasz energii, tym więcej ciepła generujesz i musisz rozproszyć; przegrzanie jest tak samo złe, jak zbyt duża moc, ponieważ rzeczy zaczynają się topić. Kolejnym ograniczeniem jest dostęp do pamięci.

Procesor zwykle potrzebuje dużo danych do wykonania dużej ilości przetwarzania. Wszystko to jest przechowywane w pamięci RAM. Niestety pamięć RAM jest dość wolna w porównaniu do procesora. Może to pozostawić go bezczynnego przez „wieki”, zanim uzyska dane potrzebne do działania. Pamięć podręczna procesora bardzo pomaga, ale jest tak mała, że ​​nie może objąć wszystkiego, a pamięć główna musi być dostępna.

Opóźnienie pamięci

Aby zminimalizować efekt spowolnienia pamięci RAM, jest ona fizycznie umieszczona tak blisko procesora, jak to możliwe. Dlatego pamięć RAM zawsze znajduje się bezpośrednio obok gniazda procesora na płycie głównej. Ale co się stanie, jeśli masz wiele procesorów na jednej płycie głównej? Następnie jest inny czas dostępu dla procesora, aby uzyskać dostęp do swojej pamięci w porównaniu do pamięci obok innej. „O nie”, możesz powiedzieć, „niektóre pamięci są nieco wolniejsze”. Jest to jednak rzeczywisty problem, który może mieć zaskakująco duży wpływ na wydajność. Ta koncepcja nosi nazwę Non-Uniform Memory Access lub NUMA.

NUMA polega na zapewnieniu mechanizmu, dzięki któremu system operacyjny zrozumie, że chociaż może on uzyskać dostęp do całej pamięci, niektóre części są bardziej preferowane do pewnych rzeczy niż inne. Tam, gdzie to możliwe, system operacyjny przechowuje następnie dane dotyczące zadań uruchomionych na CPU1 w pamięci RAM bezpośrednio obok CPU1. Podobnie, dane niezbędne do wykonania zadania na CPU2 są przechowywane w pamięci RAM bezpośrednio obok CPU2. Oczywiście przy ograniczonych pojemnościach pamięci RAM i ogromnych zbiorach danych utrzymanie się w tych granicach nie zawsze jest możliwe. Mimo to dokłada się wszelkich starań i ma to znaczący wpływ na wydajność.

Dostęp do pamięci przez pojedynczy kanał jest również sekwencyjny. Oznacza to, że gdy dwa różne procesory próbują uzyskać dostęp do danych na tym samym kanale, jeden bezpośrednio podłączony do modułu DIMM, a drugi NUMA przeskakuje, drugie żądanie nie tylko musi czekać w stanie bezczynności na swoje żądanie, ale także na żądanie drugiego edytor. W związku z tym, jeśli to możliwe, dane powinny być przechowywane w pamięci RAM bezpośrednio obok procesora, który będzie ich potrzebował.

Wniosek

NUMA oznacza niejednolity dostęp do pamięci. Jest to termin używany w systemach komputerowych z wieloma fizycznymi procesorami. Odnosi się to do faktu, że jeden procesor będzie miał inne opóźnienie pamięci niż bezpośrednio otaczająca go pamięć RAM w porównaniu z pamięcią RAM otaczającą inny procesor. Dodatkowe opóźnienie zmniejsza wydajność systemu na wiele sposobów. NUMA to sposób na poinformowanie systemu operacyjnego, że tak jest.

Pozwala zoptymalizować wykorzystanie pamięci i lokalizację danych w oparciu o procesor, który potrzebuje danych. Tam, gdzie to możliwe, wszystkie dane dotyczące procesów uruchomionych na procesorze są przechowywane w pamięci RAM bezpośrednio podłączonej do tego procesora. Gdy lokalna pamięć RAM nie ma wystarczającej pojemności, dane mogą przenosić się do pamięci RAM wokół innych procesorów. Ponownie tam, gdzie to możliwe, liczba przeskoków NUMA jest minimalizowana, aby zmniejszyć opóźnienie.



Leave a Comment

Jak sklonować dysk twardy

Jak sklonować dysk twardy

We współczesnej epoce cyfrowej, gdzie dane są cennym zasobem, klonowanie dysku twardego w systemie Windows może być dla wielu kluczowych procesów. Ten obszerny przewodnik

Jak naprawić błąd ładowania sterownika WUDFRd w systemie Windows 10?

Jak naprawić błąd ładowania sterownika WUDFRd w systemie Windows 10?

Czy podczas uruchamiania komputera pojawia się komunikat o błędzie informujący, że nie udało się załadować sterownika WUDFRd na Twój komputer?

Jak naprawić błąd NVIDIA GeForce Experience o kodzie 0x0003

Jak naprawić błąd NVIDIA GeForce Experience o kodzie 0x0003

Czy na pulpicie pojawia się błąd NVIDIA GeForce o kodzie 0x0003? Jeśli tak, przeczytaj blog, aby dowiedzieć się, jak szybko i łatwo naprawić ten błąd.

How to Use Auto Clicker for Chromebook

How to Use Auto Clicker for Chromebook

Today, were going to delve into a tool that can automate repetitive clicking tasks on your Chromebook: the Auto Clicker. This tool can save you time and

Jak usunąć procesor graficzny z komputera z systemem Windows w 2023 r

Jak usunąć procesor graficzny z komputera z systemem Windows w 2023 r

Czy musisz usunąć GPU z komputera? Dołącz do mnie, gdy wyjaśnię, jak usunąć procesor graficzny z komputera w tym przewodniku krok po kroku.

Jak zainstalować dysk SSD NVMe na komputerze stacjonarnym i laptopie

Jak zainstalować dysk SSD NVMe na komputerze stacjonarnym i laptopie

Kupiłeś nowy dysk SSD NVMe M.2, ale nie wiesz, jak go zainstalować? Czytaj dalej, aby dowiedzieć się, jak zainstalować dysk SSD NVMe na laptopie lub komputerze stacjonarnym.

Co to jest bomba logiczna?

Co to jest bomba logiczna?

Bomba logiczna to incydent związany z bezpieczeństwem, w którym osoba atakująca przeprowadza opóźnioną akcję. Czytaj dalej, aby dowiedzieć się więcej.

Co to jest SoC?

Co to jest SoC?

Jeśli kiedykolwiek zajrzałeś do wnętrza wieży PC, możesz zobaczyć, że jest tam wiele różnych komponentów. Twój przeciętny laptop zawiera większość tych samych komponentów

Co to jest szyfrowanie asymetryczne?

Co to jest szyfrowanie asymetryczne?

Algorytmy szyfrowania asymetrycznego wykorzystują dwa różne klucze. Jeden klucz służy do szyfrowania, a drugi do deszyfrowania.

Steam Deck: Jak sformatować kartę SD

Steam Deck: Jak sformatować kartę SD

Steam Deck jest dostępny w trzech opcjach przechowywania: 64 GB eMMC, 256 GB NVMe SSD i 512 GB NVMe SSD. W zależności od biblioteki gier i rozmiaru gier