¿Qué es la caché L0?

Las CPU son bestias increíblemente complejas. Hay muchas partes interconectadas que tienen que funcionar perfectamente al unísono para lograr los niveles de rendimiento que vemos. Una de las características clave de una CPU es el caché. No es una característica llamativa. No anuncia tan bien como el conteo de núcleos o la frecuencia máxima de impulso. Sin embargo, es fundamental para el rendimiento.

¿Por qué caché?

Las CPU modernas son increíblemente rápidas. Realizan más de cinco mil millones de operaciones cada segundo. Mantener la CPU alimentada con datos cuando funciona tan rápido es difícil. La RAM tiene suficiente capacidad para suministrar datos a la CPU. Incluso puede transferir datos cada segundo, gracias a anchos de banda muy altos. Aunque ese no es el problema. El problema es la latencia.

La memoria RAM puede responder muy rápidamente. El problema es que “muy rápido” es mucho tiempo cuando haces cinco mil millones de cosas por segundo. Incluso la memoria RAM más rápida tiene una latencia superior a los 60 nanosegundos. Nuevamente, 60 nanosegundos suenan como nada de tiempo. El problema es que si la CPU funciona a 1 GHz, tardaría 1 ns en completar un ciclo. Con CPU de gama alta que alcanzan los 5,7 GHz, eso es un ciclo cada 175 picosegundos. ¿Cómo se ven ahora esos 60 nanosegundos de latencia? Eso es 342 ciclos de latencia.

Ese tipo de latencia sería un asesino para cualquier rendimiento de la CPU. Para evitar eso, se usa un caché. El caché se coloca en la propia CPU. También es mucho más pequeño que la RAM y usa una estructura diferente, SRAM en lugar de DRAM. Esto hace que responda mucho más rápido que la RAM del sistema principal. La memoria caché suele estar en niveles, y se utilizan L1, L2 y L3 para indicar los niveles que se alejan cada vez más de los núcleos de la CPU. Los niveles inferiores son más rápidos pero más pequeños. L1 puede tener una latencia de cuatro o cinco ciclos de reloj, mucho mejor que 342.

¿Pero algunas CPU mencionan un L0?

La terminología para L1, L2 y L3 es bastante estándar. La vaga comprensión de lo que significan y hacen es relativamente común, incluso entre los proveedores de CPU. Esto se debe a que se rigen por la física material y eléctrica; no mucho puede cambiar. Puede tener un caché rápido o un caché grande, pero no ambos. Debe ser más grande si comparte un caché entre varios núcleos. Con ese fin, L1 y L2 tienden a ser específicos del núcleo. La caché L3 más grande tiende a compartirse entre algunos o todos los núcleos de la CPU o el chiplet.

Como probablemente pueda adivinar, L0 está relacionado con el almacenamiento en caché, pero se ha incluido en el esquema de nombres después del hecho. Sin embargo, no ayuda entender lo que significa. Sin embargo, probablemente puedas adivinar algunas cosas. Se limitará a un núcleo, será pequeño y rápido. El otro nombre por el que pasa puede ayudar un poco; eso es caché de microoperaciones.

En lugar de almacenar en caché los datos de la memoria o las instrucciones completas, L0 almacena en caché las microoperaciones. Como describimos recientemente , una micro-operación es una característica de las CPU modernas. Las instrucciones en x86 y otras ISA son grandes, complejas y desafiantes para encajar de manera eficiente en una canalización. Puede canalizarlos de manera mucho más eficiente si los divide en microoperaciones constituyentes. En algunos casos, incluso puede agrupar varias microoperaciones, incluso de diferentes instrucciones, en una sola microoperación para lograr una mejora del rendimiento y una reducción de la energía.

Arquitectura de CPU ft Micro-Op Cache

Para ejecutar una instrucción, una CPU moderna la decodifica. Esto implica dividir la instrucción en sus microoperaciones constituyentes y determinar las ubicaciones de memoria a las que se debe hacer referencia. Muchos software utilizan una funcionalidad similar con regularidad y, a menudo, pueden reutilizar el mismo código en un bucle o desde una función llamada. Esto significa que las instrucciones exactas se pueden llamar una y otra vez. Esto significa que se llama a los mismos microoperadores una y otra vez. Y si se necesitan las mismas microoperaciones repetidamente, se pueden almacenar en caché. El almacenamiento en caché de microoperaciones puede reducir la carga en los decodificadores de instrucciones, reduciendo el consumo de energía o ayudando a llenar la canalización más rápido.

La memoria caché debe mantenerse pequeña, pero cuando se administra con cuidado, se puede acceder a ella con una latencia de un solo ciclo o incluso sin ella. Esto puede ser suficiente para evitar la necesidad de asumir la latencia de 4 ciclos en el caché L1 y viene sin penalización por pérdida de caché.

Conclusión

Caché L0 es otro nombre para el caché de microoperaciones. Puede ser parte de las CPU modernas que utilizan microoperaciones. Por lo general, contiene unos pocos miles de entradas y tiene capacidades enumeradas en números de entradas en lugar de bytes. Se puede acceder a L0 más rápido que a L1, normalmente con una latencia de 1 o 0 ciclos. El almacenamiento en caché de microoperaciones reduce la carga en los decodificadores de instrucciones, especialmente en el código que hace un buen uso de bucles o funciones.



Leave a Comment

Cómo clonar un disco duro

Cómo clonar un disco duro

En la era digital moderna, donde los datos son un activo valioso, clonar un disco duro en Windows puede ser un proceso crucial para muchos. Esta guía completa

¿Cómo reparar el controlador WUDFRd que no se pudo cargar en Windows 10?

¿Cómo reparar el controlador WUDFRd que no se pudo cargar en Windows 10?

¿Se enfrenta al mensaje de error al iniciar su computadora que dice que el controlador WUDFRd no se pudo cargar en su computadora?

Cómo reparar el código de error 0x0003 de la experiencia NVIDIA GeForce

Cómo reparar el código de error 0x0003 de la experiencia NVIDIA GeForce

¿Tiene el código de error 0x0003 de la experiencia NVIDIA GeForce en su escritorio? En caso afirmativo, lea el blog para descubrir cómo solucionar este error de forma rápida y sencilla.

Cómo quitar una GPU de una PC con Windows en 2023

Cómo quitar una GPU de una PC con Windows en 2023

¿Necesitas quitar la GPU de tu PC? Únase a mí mientras explico cómo quitar una GPU de su PC en esta guía paso a paso.

Cómo instalar un SSD NVMe en una computadora de escritorio y una computadora portátil

Cómo instalar un SSD NVMe en una computadora de escritorio y una computadora portátil

¿Compró un nuevo SSD NVMe M.2 pero no sabe cómo instalarlo? Siga leyendo para aprender cómo instalar un SSD NVMe en una computadora portátil o de escritorio.

¿Qué es una bomba lógica?

¿Qué es una bomba lógica?

Una bomba lógica es un incidente de seguridad en el que un atacante establece una acción retrasada. Sigue leyendo para saber más.

¿Qué es Stuxnet?

¿Qué es Stuxnet?

Stuxnet era un gusano que se propagaba a sí mismo. Fue el primer uso de un arma cibernética y la primera instancia de malware.

¿Qué es un hacker ético?

¿Qué es un hacker ético?

Un hacker ético es un hacker que actúa dentro de los límites de la ley. Sigue leyendo para saber más sobre el tema.

¿Qué es el cifrado simétrico?

¿Qué es el cifrado simétrico?

Hay muchas partes diferentes de la criptografía. Sin embargo, si desea cifrar algunos datos, hay dos tipos de algoritmos que puede usar: simétrico

Cómo hacer una prueba de estrés de GPU en 2023: + 6 mejores herramientas

Cómo hacer una prueba de estrés de GPU en 2023: + 6 mejores herramientas

¿Quiere hacer una prueba de estrés de la GPU en su PC con Windows para garantizar un rendimiento confiable para los juegos de alta definición? ¡Lea esta guía de GPU de prueba de estrés ahora!