O que é memória ECC?

Alguma RAM, ou memória de acesso aleatório, é anunciada como memória ECC. ECC significa Código de Correção de Erros e é um processo de identificação e correção de erros na memória. Erros na RAM podem causar corrupção ou alteração de dados, o que pode resultar em travamentos do dispositivo e até mesmo em vulnerabilidades de segurança. A RAM ECC normalmente não é compatível com hardware de PC de consumo.

O que são erros de memória?

Os erros de memória são um problema em que o valor armazenado na memória é alterado. Os dados na RAM são armazenados em binário, com valores de 1 ou 0. Se o valor de 1 for alterado para 0 ou vice-versa, em um processo denominado “bit-flipping”, os dados armazenados na RAM mudam.

Por exemplo, o bit alterado pode ser usado para armazenar um valor em uma planilha. Nesse caso, o valor da planilha poderia ser alterado para um número completamente diferente, o que afetaria o resultado de quaisquer cálculos, por exemplo, alterando as previsões econômicas de um negócio. Em outros casos, o bit alterado pode desativar um recurso de segurança ou criar um erro de digitação que altera a forma como um programa é executado. Esses dois exemplos são extremamente difíceis de detectar e resolver sem o uso da memória ECC. Em um cenário extremo, um único bit sendo invertido pode causar um erro catastrófico que causa uma falha do sistema.

A inversão de bits tem muitas causas potenciais; a causa mais comum é o resultado da radiação de fundo, causada principalmente por nêutrons criados por eventos de raios cósmicos. Um raio cósmico é uma partícula de alta energia, normalmente um próton, que viaja quase à velocidade da luz. Eles são emitidos por corpos estelares, incluindo o Sol e outros objetos astronômicos de alta energia. Quando um raio cósmico atinge um átomo, uma chuva de nêutrons e outras partículas subatômicas são criadas, esses nêutrons passam a ter interações secundárias.

Acredita-se que essas interações de nêutrons secundários sejam a fonte primária de erros de inversão de bits. Os raios cósmicos são mais comuns em altitudes mais elevadas, com um aumento de 3,5x a 1,5 km acima do nível do mar e um aumento de 300x na altitude de cruzeiro de aviões de passageiros. Este risco aumentado em altitude requer medidas extras de confiabilidade.

Quão comuns são os erros de memória?

A maioria das pessoas não vê seus computadores travando todos os dias, então seria fácil pensar que esse é principalmente um risco teórico. Pesquisas em data centers em hiperescala foram usadas para analisar a taxa de incidentes de bit flipping. Pesquisa realizada pelo Google em seus data centers mostrou uma taxa de erro de aproximadamente 1 erro de bit único por gigabyte de RAM a cada 1,8 horas.

A missão Cassini-Huygens da Nasa, lançada em 1997 para viajar a Saturno, foi configurada com dois computadores de vôo idênticos, cada um com 2,5 Gb de RAM. Ao longo dos primeiros dois anos e meio de sua jornada, a espaçonave observou 280 erros de bit único por dia. Durante um dia, quando a Cassini-Huygens estava no caminho de uma explosão solar, um aumento de quatro vezes nos erros de bit foi observado, fornecendo mais evidências de que o Sol é a causa da maioria dos problemas de inversão de bits.

Havia preocupações de que o aumento contínuo na densidade dos módulos de RAM levaria a versões posteriores de RAM cada vez mais vulneráveis ​​a bit-flips. Estudos mais recentes mostraram que o oposto é de fato o caso, pois os erros diminuíram conforme a geometria do processo diminuiu.

Como a memória ECC protege contra erros?

A memória ECC usa códigos de correção de erros, como os códigos de Hamming, para corrigir erros de bit único na RAM. Erros de bit duplo podem ser detectados, mas não corrigidos. Os códigos de correção de erros de Hamming funcionam usando uma matriz de bits de paridade. Juntos, esses bits de paridade podem ser usados ​​para detectar se os bits de dados foram alterados. Se um bit for identificado como tendo sido invertido, ele será alterado de volta automaticamente.

Dica: Um erro de bit único é um incidente de inversão de bits quando apenas um único bit é invertido. Em erros double0bit, dois bits são invertidos. Os dois bits não precisam ser invertidos no mesmo incidente, o segundo bit invertido só precisa acontecer antes que o primeiro bit invertido seja corrigido.

Um bit de paridade a mais do que o necessário está incluído nos códigos de correção de erros de Hamming. Esse bit de paridade extra dá ao código a capacidade de detectar a ocorrência de erros de bit duplo; no entanto, esses erros não podem ser corrigidos.

O processo de detecção e correção de erros é executado no controlador de memória integrado no stick de RAM.

Disponibilidade e suporte do consumidor

A maioria dos hardwares de PC para consumidores não oferece suporte para memória ECC. Isso é parcialmente como um método de distinguir artificialmente o hardware do servidor do hardware do consumidor. ECC RAM, no entanto, custa mais e funciona um pouco mais devagar. Além disso, a estabilidade extra que ele forneceria aos consumidores domésticos é mínima, pois os erros de conversão de bits não são a principal causa de falhas no sistema.

Nenhuma das CPUs para consumidores e entusiastas da Intel suporta memória ECC, apenas suas CPUs para servidores, como as CPUs da linha Xeon. As CPUs de consumo da AMD não suportam ECC, no entanto, suas CPUs de workstation e server, Threadripper e EPYC respectivamente, suportam memória ECC.



Leave a Comment

O Que Fazer Se o Powerbeats Pro Não Carregar no Estojo

O Que Fazer Se o Powerbeats Pro Não Carregar no Estojo

Se o seu Powerbeats Pro não estiver carregando, experimente usar outra fonte de energia e limpe seus fones de ouvido. Deixe o estojo aberto enquanto carrega seus fones.

Canon Pixma MG5220: Digitalize sem Tinta

Canon Pixma MG5220: Digitalize sem Tinta

Como ativar a digitalização na Canon Pixma MG5220 quando você ficar sem tinta.

5 Motivos pelos Quais Seu Laptop Está Superaquecendo

5 Motivos pelos Quais Seu Laptop Está Superaquecendo

Descubra algumas das possíveis razões pelas quais seu laptop está superaquecendo, juntamente com dicas e truques para evitar esse problema e manter seu dispositivo fresco.

Como Corrigir o Código de Erro 0xC272008F do GeForce Now

Como Corrigir o Código de Erro 0xC272008F do GeForce Now

Você está se preparando para uma noite de jogos, e será uma grande noite – você acaba de adquirir “Star Wars Outlaws” no serviço de streaming GeForce Now. Descubra a única solução conhecida que mostra como corrigir o Código de Erro 0xC272008F do GeForce Now para que você possa começar a jogar jogos da Ubisoft novamente.

Fundamentos da Impressão 3D: Dicas de Manutenção para a Sua Impressora 3D

Fundamentos da Impressão 3D: Dicas de Manutenção para a Sua Impressora 3D

Manter suas impressoras 3D é muito importante para obter os melhores resultados. Aqui estão algumas dicas importantes a serem lembradas.

Como Encontrar o Endereço IP de uma Impressora

Como Encontrar o Endereço IP de uma Impressora

Está tendo dificuldades para descobrir qual endereço IP sua impressora está usando? Vamos mostrar como encontrá-lo.

Como desligar o Roku

Como desligar o Roku

Descubra como desligar o Roku Player, enquanto aprende sobre suas opções de economia de energia e melhores práticas.

O que é SLI?

O que é SLI?

SLI ou Scalable Link Interface é uma tecnologia da Nvidia que permite que várias placas gráficas trabalhem juntas para obter maior desempenho.

O que é N-Key Rollover e Anti-Ghosting?

O que é N-Key Rollover e Anti-Ghosting?

Entenda os conceitos de N-key rollover e Anti-Ghosting, dois recursos essenciais em teclados para gamers que melhoram a experiência de jogo.

O que é VRAM?

O que é VRAM?

VRAM, ou Video Random Access Memory, é uma forma essencial de RAM utilizada em processadores gráficos, fundamental para o desempenho em videogames.