Nuova architettura FERMI e GF110
Il nuovo chip grafico GF110 prodotto da Nvidia è l'evoluzione del precedente chip grafico basato su architettura FERMI, ed ha sostituito il GF100, il quale è stato usato per la produzione della GeForce GTX 480.
Il chip grafico GF110 è dotato di 4 Graphics Processing Clusters (GPC), ognuno dei quai contiene 1 Raster Engine, 4 Stream Multiprocessors (SM). Ogni SM invece contiene 32 CUDA core, 16 unità Load/Store, 4 Special Function Units, 4 Texture Units, 2 Warp Schedulers ed 1 Dispatch Unit.
Troviamo in aggiunta un'unità Polymorph Engine che si occupa di tutt le operazioni di tesselazione, ben 48KB+16KB L1 cache, Unità di Registro ed infine le ROPs. A supporto del memory controller (6 x 64bit) abbiamo la cache L2. Ecco come si presenta il nuovo chip grafico prodotto da Nvidia:
Di fatto possiamo affermare con certezza che è un GF100 senza alcuna limitazione di unità SM, vi ricordiamo infatti che nella GeForce GTX 480 un’unità SM era stata disabilitata per garantire alte rese produttive. Adesso grazie agli affinamenti del processo produttivo e di altri fattori di progettazione, Nvidia è riuscita a restituirci un GF100 senza alcuna limitazione, migliorato inoltre in alcuni aspetti che avevano ricevuto critiche da parte dei consumatori.
Troviamo in questo modo ben 512 unità CUDA core funzionanti a 1.544 MHz, 64 TMU, 48 ROPs, controller a 384bit, 1536 MB di memoria video del tipo GDDR5, funzionanti a 4.008 MHz e che garantiscono una banda passante di ben 192,4 GB/s. Naturalmente il core grafico lavora sempre in rapporto 1:2 rispetto ai CUDA core, infatti ha una frequenza di 772 MHz nella versione reference di Nvidia. Possiamo ossservare di seguito una tabella che mette in evidenza le caratteristiche architetturali di GF110:
Vi sono altre ottimizzazioni molto importati che non sono assolutamente da sottovalutare e che a prima vista possono sfuggire, pur portando a differenze significative. Le unità del precedente chip grafico erano in grado di computare 1 texture address e 4 fetch a 32bit/INT8 texture samples per clock, 2 64bit/FP16 texture samples per clock, oppure 1 128bit/FP32 texture sample per clock.
Con il chip GF104 c'è stato un passo avanti e le texture units hanno subito un miglioramento riuscendo a renderizzare 4 samples/clock per istruzioni a 32bit e 64bit. Allo stesso modo nel GF110 troviamo questa capacità di calcolo aumentata rispetto a GF100. Il nuovo chip è in grado di processare istruzioni 32bit (INT8) e 64bit(FP16) alla stessa velocità, vale a dire ben 4 istruzioni per ciclo di clock. Questo, anche se non ha un impatto immediato in tutti i giochi, in alcuni, specie tra i più recenti, si può tradurre in un vantaggio sostanziale rispetto a GF100. Riassumiamo questo concetto nella tabella seguente:
Vi sono state inoltre modifiche esterne al chip grafico che riguardano il sistema di dissipazione, relativo alla versione reference Nvidia. Adesso il sistema di raffreddamento è più efficace e silenzioso, grazie all’adozione della tecnologia a camera di vapore (Vapor Chamber) ed ad un generale restilyng del sistema di dissipazione.
Per contenere i consumi e garantire di non superare le specifiche PCI-E, Nvidia ha dotato il PCB di ben 3 controller di Hardware Monitoring Manage Power, che monitorizzano in tempo reale la corrente assorbita. In questa maniera non appena si va sopra le specifiche di TDP dichiarate, con particolari applicazioni come OCCT o FurMark, vi è una variazione dei clock di funzionamento, al fine di riportare i consumi entro i limiti prestabiliti.
Riassumiamo brevemente le modifiche che sono state apportate al nuovo chip grafico GF110 rispetto al precedente GF100: