News

Intel svela l’architettura mesh

Michele Braga | 16 Giugno 2017

Cpu Intel Workstation

Intel svela i primi dettagli della nuova architettura mesh alla base della futura piattaforma Xeon Scalable Processor. A delineare i […]

Intel svela i primi dettagli della nuova architettura mesh alla base della futura piattaforma Xeon Scalable Processor. A delineare i primi dettagli pubblici della nuova topologia mesh è Akhilesh Kumar, Principal Engineer in Datacenter Processor Architecture che opera all’interno del team Platform Engineering Group (PEG) dove guida i progetti delle architetture Skylake-SP e Cascade Lake. In un post pubblicato sul blog IT Peer Network di Intel, Akhilesh Kumar traccia le idee guida che hanno portato al cambiamento di maggior portata avvenuto negli ultimi anni all’interno delle architetture Intel.

Akhilesh Kumar sottolinea come la sfida di integrare un numero sempre maggiore di core per creare un processore multi core pone il problema di creare una interconnessione solida ed efficiente tra i core, la struttura della memoria e i sistemi di I/O. Queste interconnessioni funzionano come delle autostrade per le informazioni in transito e solo un corretto studio della topologia delle vie di comunicazione così come dei punti di ingresso e di uscita delle informazioni stesse permette di ottenere un traffico di dati scorrevole e che non impatti sulle prestazioni.

Il passaggio dai processori a singolo core a quelli con due, quattro, otto e più core ha portato alla nascita della topologia Ring Bus che ha debuttato nel 2011. La peculiarità  del Ring Bus (bus ad anello) era quella di garantire un’elevata scalabilità  della struttura di trasferimento dati al crescere degli agenti collegati ad essa. Con il termine agenti si identificano tutti i blocchi logici che hanno accesso al bus di comunicazione, ovvero i core, le cache, la sezione Uncore del processore e l’eventuale comparto grafico integrato.

Questa soluzione è stata la base sulla quale Intel ha espanso fino ad oggi le proprie architetture in modo semplice ed efficiente.

Pensate al Ring Bus come al percorso circolare di un treno, agli agenti come le stazioni presenti sulla linea e alle informazioni come ai passeggeri in transito. Sfruttando questa analogia è facile comprendere come l’aggiunta di una o più stazione lungo il percorso ha permesso di incrementare il numero dei core presenti nel processore senza dover apportare modifiche alla topologia dell’architettura stessa.

La topologia classica di un processore dotato di Ring Bus (in rosso) che permette di creare un anello che collega tra loro i diversi componenti dell’architettura.

Perché Intel ha deciso di abbandonare la topologia del Ring Bus e adottare un approccio diverso?

Il motivo è semplice da comprendere. Riprendendo l’analogia che abbiamo già  utilizzato, per aumentare il numero di agenti presenti sul Ring Bus è necessario aumentare non solo il numero di stazioni, ma anche allungare il tragitto. Tutto ciò comporta una aumento del tempo necessario per trasferire le informazioni tra due agenti distanti tra loro, in modo simile a quanto accade ai passeggeri di un treno locale che è costretto a rallentare o addirittura a fermarsi in tutte le stazioni. Se il Ring Bus rimane una soluzione valida quando il numero degli agenti presenti sul suo percorso è limitato, ovvero nelle architetture con un basso numero di core (LCC, Low Core Count), non possiamo dire altrettanto per architetture che prevedono l’impiego di un numero molto alto di core.

Nei processori con elevato numero di core (HCC, High Core Count) Intel è stata costretta a impiegare due Ring Bus; da un lato questo ha permesso di semplificare la struttura dell’architettura e di mantenere un sistema di comunicazione efficiente all’interno dei singoli Ring Bus, ma dall’altro ha imposto l’utilizzo di complessi sistemi di switch per permettere lo scambio di informazioni tra un Ring Bus e l’altro.

Tutto ciò non ha avuto un impatto negativo solo sulla latenza nella movimentazione dei dati, ma ha richiesto anche di dedicare una fetta consistente del budget energetico del processore al funzionamento dell’infrastruttura di supporto, limitando di fatto le possibilità  di sfruttare il budget energetico per incrementare le prestazioni delle unità  di elaborazione.

Nelle attuali architetture HCC due Ring Bus (in rosso) sono connessi tra loro per mezzo di switch dedicati che però incrementano la complessità  dell’architettura e la latenza nello scambio di informazioni tra i diversi componenti del processore.

Per mantenere un’elevata efficienza nello scambio dati tra i diversi core e le altre strutture dell’architettura, Intel ha quindi deciso di adottare la nuova topologia mesh dove gli agenti si trovano in corrispondenza delle maglie di una griglia di connessioni. Questo permette di avere a disposizione più percorsi disponibili e percorsi più brevi per mettere in comunicazione elementi fisicamente lontani tra loro all’interno dell’architettura.

La struttura di tipo mesh migliora la latenza di comunicazione sia rispetto al caso peggiore, ovvero tra i core più distanti, sia rispetto alla media in quanto nella soluzione a griglia esistono più strade possibili per le informazioni. Ancora, la topologia di tipo mesh può scalare meglio di quella di precedente generazione all’aumentare del numero di core presenti nell’architettura stessa; in particolare i vantaggi dell’architettura mesh diventano più evidenti rispetto a quella Ring Bus via via che l’architettura diventa più complessa.

Nell’architettura mesh i singoli componenti si trovano sulle maglie di una griglia di connessioni che permette un traffico dati più efficiente e con latenze minori rispetto a quanto possibile con le soluzioni adottate fino ad oggi.

Osservando una delle prime immagini pubbliche che rivelano i dettagli dell’architettura mesh è possibile vedere come la nuova topologia utilizza connessioni orizzontali e verticali che mettono in comunicazione i core, le cache, la memoria e i controller I/O. Dal diagramma risulta evidente come questa topologia ha permesso di eliminare in modo completo gli switch, di mettere in comunicazione diretta tutti gli elementi dell’architettura e di consentire l’utilizzo di percorsi ottimizzati sfruttando le diverse intersezioni della griglia di connessioni.

L’impatto positivo in termini di latenza e banda di trasferimento tra i core si riflette in modo analogo anche sulla memoria, in quanto i controller sono collegati in modo diretto alla griglia. Per quanto riguarda le operazioni di I/O, le informazioni entrano ed escono dall’architettura mesh attraverso il bus Pci Express e connessioni inter socket dedicate.

I vantaggi dell’architettura mesh non si limitano a garantire una maggiore efficienza e una minore latenza nello scambio di informazioni, ma vanno ben oltre. Questa nuova topologia permette di incrementare la banda di trasmissione dati all’interno del processore tra i singoli core e tra questi e le unità  di cache così come, i controller I/O e la memoria di sistema.

La nuova architettura mesh nasce per garantire fondamenta solide allo sviluppo delle future generazioni di processori per i datacenter dove la scalabilità , l’efficienza operativa ed energetica, la velocità  delle trasmissioni dati e le latenza di accesso alle informazioni rivestono un ruolo primario per assicurare un miglioramento delle prestazioni da una generazione all’altra.

Noctua

CPU

Noctua, arriva il dissipatore “fanless” da 1,5kg

Alfonso Maruccia | 23 Dicembre 2020

Cpu Dissipatori Noctua

La specialista di dissipatori Noctua è pronta ad avviare la produzione di massa di una nuova unità senza ventola. Il design “fanless” comporta un aumento significativo nel peso del dispositivo.

Noctua, azienda austriaca specializzata in dissipatori per CPU desktop, sarebbe pronta a portare sul mercato il suo primo prodotto basato su un design “fanless”. La nuova unità di raffreddamento fa a meno delle ventole di ordinanza ma richiede un’attenta gestione del peso da parte di utenti finali e appassionati builder di PC custom.

Un prototipo del primo dissipatore fanless di Noctua era stato inizialmente mostrato in occasione del Computex 2019, dove era riuscito a tenere a bada le temperature estreme di una CPU Core i9-9900K anche in un’ambiente affollato (e accaldato) come la fiera informatica di Taipei.

Noctua, dissipatore fanless

Il prototipo del Computex includeva 12 alette di alluminio da 1,5 mm, sei heatpipe di rame e una piastra di collegamento al processore (heatsink) sempre di rame. Il dissipatore usa un design asimmetrico per una migliore gestione delle schede PCIe, ed è pienamente compatibile con l’installazione dei moduli RAM su piattaforme LGA115x (Intel) e AM4 (AMD).

Stando alle ultime indiscrezioni pubblicate online, dopo oltre un anno di attesa il dissipatore fanless di Noctua è oramai quasi pronto al debutto con l’avvio della produzione di massa. Il design finale è del tutto simile a quello del prototipo mostrato a Taipei, il periodo di commercializzazione previsto è il prossimo mese di febbraio.

L’adozione di un design fanless permette al dissipatore Noctua di ridurre al minimo le parti in movimento e quindi di migliorare la silenziosità di funzionamento. Ma con i suoi 1,5 kg di peso, il nuovo cooler è destinato a imporre uno stress non indifferente alla motherboard su cui verrà fissato. Il peso extra-large è in effetti una caratteristica comune (e piuttosto comprensibile) per i pochi dissipatori fanless fin qui arrivati sul mercato.

CPU Intel

CPU

Rocket Lake-S, primi benchmark per le future CPU di Intel

Alfonso Maruccia | 16 Dicembre 2020

AMD Cpu Intel Zen

Arrivano nuove indiscrezioni sulle performance di Rocket Lake-S, CPU Intel Core di undicesima generazione in arrivo nel 2021. AMD e Ryzen (non) possono dormire sonni tranquilli.

Come già confermato da Intel, le CPU Rocket Lake-S debutteranno il prossimo anno prendendo il posto di Comet Lake-S come piattaforma desktop x86 ad alte prestazioni. Il canto del cigno del nodo produttivo a 14nm userà lo stesso socket di Comet Lake-S (LGA-1200) ma includerà diverse architetturali, e stando a Intel sarà anche molto più performante.

In attesa del debutto ufficiale sul mercato, le prossime CPU di Chipzilla sono già in circolazione sotto forma di esemplari ingegneristici e relativi leak tramite i benchmark online. Nuove indiscrezioni in tal senso sono di recente emerse in merito ai modelli Core i5-11400 e Core i9-11900K, con novità decisamente interessanti su entrambe i fronti.

La CPU Core i5-11400 ha fatto la propria comparsa nel database di SiSoftware SANDARA, con un clock di base da 2,60GHz, Turbo da 4,4GHz, 6 core fisici e 12 thread logici. In confronto alla CPU Core i5-10400 (Comet Lake-S) oggi in commercio, il modello di undicesima generazione presenta una frequenza base inferiore di 300MHz e una Turbo maggiorata di 100MHz.

Le prestazioni della versione preliminare di Core i5-11400 non sono particolarmente interessanti, mentre lo stesso non si può dire per l’ultimo leak sul Core i9-11900K. Quello che dovrebbe essere il processore di punta della linea Rocket Lake-S è comparso nel database dei benchmark di Ashes of the Singularity, gioco ben noto per lo stress che impone alle CPU oltre che alle GPU discrete.

Usando il preset “Crazy” con risoluzione 1080p e una GPU GeForce RTX 2080 Ti, la CPU Core i9-11900K raggiunge i 63 fps contro i 57 fps di Ryzen 9 5950X. Rocket Lake-S sarebbe dunque più veloce di almeno il 10% rispetto a Ryzen 5000/Zen 3, suggerisce il leak, una presunta conferma della bontà della futura offerta di Intel e dell’incremento di prestazioni in ambito IPC promesso dalla corporation.

Intel Tiger Lake

CPU

Overclock, il Celeron D 347 sfonda (di nuovo) la barriera degli 8 Gigahertz

Alfonso Maruccia | 14 Dicembre 2020

Cpu Intel Overclock

Lo storico processore Celeron D 347 viene ancora una volta spinto oltre ogni limite con un record di overclock a una frequenza di oltre 8 GHz. Ennesima testimonianza delle qualità ingegneristiche della Intel del recente passato.

La CPU Intel Celeron D 347 è in circolazione da oltre 15 anni, e gli overclocker continuano a sfruttarla per raggiungere frequenze di funzionamento assolutamente fuori scala. Niente CPU multicore o ad alte prestazioni, in questo caso, ma solo la potenza bruta di un’architettura che dimostra ancora una volta la facilità di adattamento agli esperimenti folli dell’overclock made-in-China.

Il nuovo record è stato infatti raggiunto dall’utente cinese ivanqu0208, con una frequenza di funzionamento di 8,36GHz contro i 3,06GHz di base. Intel CPU Celeron D 347 è una CPU a singolo core e set di istruzioni a 64-bit, realizzata con un processo produttivo a 65nm (nel 2006) e dotata di un TDP di 86W.

Intel Celeron D 347 overclock

Oltre a una CPU Celeron D 347, l’overclocker cinese ha usato una motherboard Asus P5E64 WS Professional, uno stick da 2GB di memoria DDR3 e l’immancabile kit di raffreddamento ad azoto liquido per mantenere stabile il funzionamento del processore durante l’esperimento. Il sistema operativo? Consono all’epoca: Windows XP.

I processori Celeron rappresentano la tradizionale offerta di Intel per i sistemi economici a basse prestazioni, una tendenza che vale ancora oggi ed è destinata a valere anche in futuro. Il Celeron D 347, in particolare, ha sempre dimostrato di reggere molto bene l’overclock: il record in tal senso è ancora una volta di un utente cinese, che nel 2013 ha spinto la sua CPU economica fino a 8.516MHz.

Aggiungi alla collezione

No Collections

Here you'll find all collections you've created before.