Migliorare l’affidabilità con i moduli Rdimm

Tra i fattori più critici da considerare nella scelta delle apparecchiature hardware per applicazioni aziendali vi sono le prestazioni, l’affidabilità e la scalabilità. I moduli di memoria Dram influenzano tutti questi fattori. I responsabili dei sistemi informativi possono scegliere tra due tipi di moduli Dram in piattaforme che supportano i protocolli Ddr3. Si tratta di moduli Ecc Udimm (Error-Correcting Code, Unregistered Dual In-line Memory Modules) e Rdimm (Registered Dual In-line Memory Modules). Nella maggior parte delle applicazioni, i moduli Rdimm offrono migliori prestazioni, una maggiore scalabilità e un più ricco set di caratteristiche di affidabilità, disponibilità e manutenibilità (rispetto agli Ecc Udimm. Utilizzando i moduli Rdimm, le aziende possono inoltre ridurre il numero totale di server insieme ai rispettivi costi di possesso.

Moduli Rdimm e registri Ddr3
L’impiego di moduli Ecc Udimm si limita ad applicazioni che richiedono memorie fino a 48 GB. Se l’utilizzo stimato della Dram supera i 48 GB di picco nell’unità di tempo, sono necessari moduli Rdimm per evitare colli di bottiglia nelle operazioni di memorizzazione. Con i moduli Rdimm, i sistemi sono scalabili potendo gestire memorie con capacità fino a 192 GB. Questi valori elevati di capacità sono possibili grazie alla presenza di registri Ddr3 nei moduli Rdimm. Questi registri sono dei chip specializzati che rigenerano tramite un buffer i segnali di clock, comando e indirizzamento dal controllore di memoria. Essi permettono l’integrazione di più chip Dram in ciascuna Rdimm e di più Rdimm per ciascun canale di memoria, il che produce migliori prestazioni e una maggiore scalabilità nelle applicazioni finali. Sul piano applicativo, l’impiego di moduli Rdimm con registri Ddr3 permette di realizzare sistemi scalabili con prestazioni prevedibili nel tempo. Per comprendere meglio in che modo i registri Ddr3 consentono di ottenere maggiori prestazioni e una capacità di memorizzazione quattro volte più grande rispetto a quelli Ecc Udimm, occorre esaminare in che modo i moduli di memoria caricano la linea. Ogni modulo di memoria, Rdimm o Ecc Udimm, comunica con un controllore di memoria inviando segnali di dati, dati strobe, indirizzi, comandi, clock e chip select. Prendendo come esempio il progetto di un modulo reale, un modulo Rdimm da 16 GB contenente 36 chip di Dram e comprendente quattro Dram per la correzione degli errori è organizzato in quattro banchi di nove chip di Dram. Un banco di memoria è un gruppo che comunica sul bus dati a 72 bit di un modulo di memoria, selezionabile indipendentemente tramite il segnale di selezione del chip. Analizzando lo schema a blocchi dell’esempio di cui sopra, si può notare che il controllore della memoria possiede un carico sul registro Ddr3 in corrispondenza di ciascuna linea di clock, comando, indirizzo e CS, e quattro carichi sulle linee DQ e Dqs. Senza il registro Ddr3, il controller vedrebbe nove carichi sulle linee CS. Inoltre, I carichi sulle linee di clock, di comando e di indirizzo si portano drasticamente a 36 a causa del collegamento diretto ai chip Dram. Questi sovraccarichi possono impedire al controllore di memoria di comunicare ad alta velocità. Per questo motivo, i moduli Ecc Udimm utilizzano tipicamente una capacità Dram quattro volte più piccola rispetto ai moduli Rdimm.

L’importanza della Dram nei sistemi aziendali
Aumentare la capacità di memorie Dram in piattaforme avide di memoria utilizzando moduli Rdimm è spesso il modo più veloce, più efficiente e meno costoso per potenziare le prestazioni del server. Se un server non ha abbastanza memoria installata per sostenere l’applicazione, i processori devono compensare ricorrendo a memorie di massa come hard disk o hard drive allo stato solido, che sono più lenti di qualche ordine di grandezza. Questo approccio allunga in maniera significativa i tempi di elaborazione, anche se la percentuale di transazioni fatte passare per la memoria di massa è piccola. Consideriamo un sistema con le seguenti caratteristiche:
•    Drive allo stato solido con velocità media di trasmissione di 100 MB/s
•    Memoria Ddr3, 1333 Mbps, bus dati a 64 bit con velocità di trasmissione di 10 GB/s (100 volte più veloce della velocità dell’Ssd)
•    Memoria Ddr3 installata sul server: 48 GB, 12 moduli Udimm ciascuno da 4 GB
•    Memoria Ddr3 richiesta dall’applicazione: 64 GB

Il risultato è che il sistema deve utilizzare una memoria di massa da 16 GB per soddisfare richieste per 64 GB. Questa memoria virtuale di 16 GB rallenta l’intero sistema. Poiché l’Ssd è 100 volte più lento della memoria Ddr3, il 25% dei dati trasmessi mediante Ssd (16 dei 64 GB) impiega un tempo 100 volte più lungo rispetto alla stessa quantità di dati (16 GB) trasmessa mediante Ddr3. In totale, le prestazioni della memoria da 64 GB vengono rallentate di 25 volte (ossia 100 moltiplicato per il rapporto 16 GB / 64 GB). Pertanto, deviando il 25% delle transazioni di memoria sull’Ssd si genera un ritardo 25 volte maggiore. Inserendo una memoria da 64 GB e otto moduli Rdimm da 8 GB e rimuovendo i limiti di memorizzazione imposti dai moduli Ecc Udimm, il sistema non ha più bisogno di canalizzare i dati Dram nella memoria di massa. Questa soluzione migliora fino a 25 volte le prestazioni del sistema. Inoltre, ottimizzando la capacità di memoria Dram si risparmia potenza, dal momento che le trasmissioni su Ssd, oltre ad essere molto più lente, richiedono potenze molto superiori per ogni gigabyte di dati trasmessi.

L’importanza dell’affidabilità
Nell’ambito dei sistemi aziendali, vi è una forte attenzione alle caratteristiche Ras delle memorie, al fine di minimizzare i tempi di fermo e abbattere i costi di riparazione. La scelta del corretto modulo di memoria può fare la differenza in termini di caratteristiche Ras. I moduli Ecc Udimm danno un’affidabilità limitata e notoriamente sono soggetti a dati corrotti e crash di sistema causati da errori di singoli bit e guasti di singole Dram. I moduli Rdimm offrono una soluzione Ras completa con sistema di controllo parità e metodo Ecc esteso, riducendo al minimo i suddetti problemi. Errori di un singolo bit sono comuni nelle comunicazioni Dram. Uno studio di due anni e mezzo dei moduli Dimm su decine di migliaia di server Google ha scoperto che i tassi di errore Dimm sono di centinaia di migliaia di volte più grandi di quanto si pensa: una media di 3.751 errori di singolo bit per Dimm in un anno. Gli errori di singolo bit possono verificarsi su 64 linee dati e 26 linee di indirizzo e di comando che interconnettono le Dram e il controller di memoria. I moduli Ecc UDimm possono rivelare e correggere solo errori di bit singolo su 64 linee dati tramite a funzioni Ecc. Se si verifica un errore di singolo bit su una qualsiasi delle 26 linee di comando o di indirizzo, gli Ecc UDimm non riescono a rivelare e registrare questi errori. Questo gap nella rivelazione degli errori in quasi un terzo delle interconnessioni Dram può produrre in un anno molteplici corruzioni nelle operazioni di memorizzazione, generando gravi perdite, interruzioni di servizio, crash dei server e costi di riparazione. I moduli Rdimm offrono la protezione da errori di singolo bit su linee di dati, di indirizzo e di comando. Infatti, i moduli Rdimm utilizzano una funzione Ecc per correggere gli errori nelle linee dati e una funzione di parità per rivelare i singoli errori nelle linee di indirizzo e di comando. Se un segnale di indirizzo o di comando ha un problema, l’Rdimm invia un segnale di errore di parità al controllore della memoria. Il controllore può quindi registrare l’evento e avviare una sequenza correttiva, ad esempio inviando nuovamente l’ultimo comando. Un altro vantaggio dei moduli Rdimm è che essi supportano algoritmi di tipo Ecc esteso, come ChipKill o Chipspare. L’Ecc esteso mantiene un’elevata velocità di funzionamento anche in caso di guasto a un singolo chip Dram o di errori multi-bit in un punto qualsiasi di un singolo chip di memoria. Insieme, il controllo di parità e l’Ecc esteso minimizzano i tempi di fermo, riducono i tempi di riparazione e rendono i sistemi che utilizzano moduli Rdimm molto più affidabili dei sistemi che utilizzano moduli Ecc Udimm.

Utilizzo del canale di memoria con i moduli Rdimm
I costruttori di server che offrono soluzioni con memorie Ddr3 forniscono architetture in grado di ospitare fino a tre Dimm per canale e fino a tre canali per nucleo Cpu. Mentre gli Rdimm sfruttano tutte le prese Dimm, gli Ecc Udimm impiegano solo uno o due Dimm per canale. Le prese rimanenti non possono essere utilizzate e vanno lasciate aperte. La Jedec Solid State Technology Association definisce gli standard relativi ai moduli Rdimm. Diverse aziende sono coinvolte in questo processo. Ad esempio, i produttori Oem di sistemi aziendali e i costruttori di microprocessori contribuiscono alla standardizzazione dei moduli Rdimm, dei moduli Dram e dei registri Ddr3. In aggiunta, i costruttori di chip Dram e di registri Ddr3 prendono parte alle fasi di definizione dei moduli Rdimm.

Per applicazioni avide di memoria
L’aumento di prestazioni che deriva dall’impiego di moduli Rdimm è per lo più visibile in applicazioni avide di memoria. Il primo gruppo di queste applicazioni ricade nell’ambito dei sistemi di calcolo ad elevate prestazioni. In questo ambito sono compresi le immagini in 3-D, i video e le simulazioni Cad che operano su server di livello professionale utilizzati da ingegneri, architetti, progettisti e professionisti del settore video. I moduli Rdimm sono inoltre indispensabili nei programmi di gestione dei database aziendali installati su server. I più popolari programmi di gestione dei database sono i pacchetti software Erp e Crm, utilizzati estensivamente da team finanziari, logistici, di marketing e commerciali. Infine, gli ambienti virtualizzati e le applicazioni di cloud computing nei centri di elaborazione dati acquisiscono diversi vantaggi grazie all’aumento di Dram. Di fatto, una capacità di Dram adeguata si può tradurre direttamente nella riduzione del numero di server in questi ambienti. Ad esempio, se ogni server virtuale richiede un nucleo Cpu e 48 GB di Dram, un server da quattro nuclei potrebbe ospitare quattro macchine virtuali fintanto che comprende 192 GB di Dram. I moduli Ecc Udimm permettono di avere capacità fino a 48 GB per server utilizzando il processore Xeon serie 5500, il che significa che un sistema avrebbe bisogno di quattro server per raggiungere 192 GB. Utilizzando moduli Rdimm, i responsabili informatici possono ottenere 192 GB con un singolo server, realizzando risparmi significativi. I vantaggi aggiuntivi di questo approccio sono il risparmio energetico e il risparmio di spazio che si ottengono utilizzando un singolo server. In generale, gli amministratori possono ridurre il costo totale di possesso utilizzando moduli Rdimm in luogo di moduli Ecc UDimm. I moduli Rdimm offrono una banda eccellente in sistemi che non hanno problemi di capacità di memoria. Secondo uno studio di Intel, gli Ecc Udimm e i Rdimm producono una banda di memoria molto simile in una configurazione del tipo “un Dimm per canale” con sistema di memoria a 6 GB (considerando moduli da 1 GB, due Cpu e tre canali per Cpu). I moduli Rdimm si rivelano superiori agli Ecc UDimm di circa il 9% in una più tipica configurazione di due Dimm per canale, utilizzando un sistema di memorizzazione a 12 o a 24 GB (considerando moduli da 1 o 2 GB, due Cpu e tre canali per Cpu). In definitiva, i moduli Rdimm sono un’ottima scelta in applicazioni che utilizzano pochissima memoria e diventano una soluzione di alto livello in server di piccola capacità (fino a 12 GB). I moduli Rdimm offrono diversi vantaggi importanti nei sistemi aziendali. Essi massimizzano le prestazioni del server in applicazioni virtualizzate ad alte prestazioni e sistemi di cloud computing, offrendo una capacità di memorizzazione quattro volte superiore rispetto ai moduli Ecc Udimm. La tecnologia Rdimm migliora inoltre le prestazioni in sistemi che richiedono solo 12 GB di memoria in configurazioni con due o più moduli Dimm per canale. In aggiunta a ciò, questi moduli offrono un ampio ventaglio di caratteristiche Ras che aumentano l’affidabilità e abbattono i tempi di fermo, i tempi di riparazione e le perdite di dati, riducendo di conseguenza il costo totale di possesso dei moduli Dimm. Prestazioni ottimali e caratteristiche Ras ad ampio raggio rendono i moduli Rdimm con registri Ddr3 la scelta migliore per un server nella maggior parte delle applicazioni aziendali.

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome