Arhitectura Nvidia Turing – familia Geforce RTX (2070, 2080 si 2080 Ti)
Nu de mult, într-o transmisiune live, NVIDIA si-a anunțat noua generație de placi grafice, bazate pe arhitectura Turing, care vine sa înlocuiască bine-cunoscuta Pascal, ai cărei membrii (GTX 10xx/Ti) au ținut (si încă țin) sus FPS-urile in jocurile noastre.
Este vorba de un pas mare pentru NVIDIA, dar si mai mare pentru gameri, care vor beneficia de tehnologii noi, menite sa îmbunătățească grafica in jocuri si sa o aducă mai aproape de realitate. Exista deja producători care au integrat aceste tehnologii in jocurile lor, unele apărute, altele urmând sa fie lansate.
Noile placi sunt capabile de 4K HDR la 60Hz, iar multe jocuri suporta aceste setări, astfel încât puteți sa le jucați in aceste condiții.
Turing
Noua arhitectura NVIDIA se numește Turing si a fost botezata după celebrul Alan Turing (matematician, criptolog si specialist in știința computerelor), care a inventat mașina cu același nume. Aceasta a deschis, in 1936, era algoritmilor si computing-ului, punând bazele a ceea ce astăzi numim Inteligenta Artificiala.
Așadar, NVIDIA continua politica de a își numi arhitecturile după matematicieni celebri.
Turing a introdus o noua arhitectura pentru procesoarele grafice, numita Turing SM (Streaming Multiprocessor), care îmbunătățește, cu 50%, performanta per nucleu CUDA, comparativ cu Pascal.
Avantajul vine de la 2 schimbări de arhitectura:
a. s-a introdus o noua magistrala pentru Integer, care executa instrucțiuni simultan cu magistrala pentru FP (Floating Point). La Pascal, cele 2 acțiuni se executau pe rând.
b. magistrala memoriei a fost redesenata pentru a unifica memoria partajată + cache texturi + zona de încărcare a memoriei, într-o singura unitate. Aceasta manevra dublează lățimea de banda si asigura de cel puțin 2x mai mult spațiu pentru cache-ul L1.
Pe lângă CUDA, exista acum si nuclee Tensor, dar si RT, fiecare oferind accelerare hardware pentru diverse tehnologii. Este prima arhitectura care aduce AI (Inteligenta Artificiala) si Ray-Tracing, in zona de gaming.
Noul procesor grafic beneficiază de eficienta crescuta pentru umbrire (shading), capabilități geometrice ridicate, precum si un nou tip de memorie, GDDR6, cu performante mai bune fata de GDDR5, dar si cu 20% mai eficienta energetic.
O alta veste buna este si aceea ca Turing a moștenit îmbunătățirile aduse de Volta, in special in zona de computing.
Iată câteva din tehnologiile introduse de noua arhitectura:
Mesh Shading aduce un nou model de umbrire pentru vertex, tessellation si stagiile de geometrie, îmbunătățind partea de cumputing pentru geometrie.
Variable Rate Shading (VRS) permite dezvoltatorilor sa controleze dinamic rate de umbrire, intre o data la 16 pixeli si pana la de 8 ori per pixel. In acest fel se reduce munca in zadar a GPU, in zonele unde imaginea nu are nevoie de aceste tehnici, si se poate creste FPS. Ca exemple, unele dintre tehnicile folosite ar fi Content Adaptive Shading (umbrire in funcție de nivelul de detalii), Motion Adaptive Shading (umbrire in funcție de nivelul de mișcare din scena), iar pentru VR, Foveated Rendering (in funcție de rezoluție si poziția ochilor).
Texture-Space Shading = obiectele sunt umbrite intr-un spațiu privat (spațiu de texturare), din memoria video, iar umbrirea la nivel de pixel se efectuează tot acolo, in loc sa lucreze direct in producție.
NVIDIA NGX este un nou framework al tehnologiei RTX. NGX utilizează rețele neurale (Deep Neural Networks = DNN) si un set de servicii neurale pentru a rezolva funcții de AI, îmbunătățind astfel grafica randarea si alte aplicații adiacente. Nucleele Tensor sunt responsabile pentru Deep Learning si aduc funcții noi, precum DLSS (Deep Learning Super-Sampling), AI InPainting, AI Slow-Motion si AI Super Rezolution, menite sa accelereze randarea, îmbunătățind FPS si calitatea imaginii.
NVLink este noul tip de conexiune pentru SLI, capabila de o latime de banda de 100GB/s, in sistem bidirecțional. Pe lângă aceasta, NVLink permite partajarea de memorie intre placi.
USB-C si VirtualLink sunt noi in zona de video si sunt responsabile pentru viitoarele sisteme VR, cărora sa le ofere lățime de banda suficienta, dar permit si conectarea mai multor device-uri simultan.
Nucleele Tensor se ocupa de operațiunile de computing, utilizate in Deep Learning. Noua tehnica DLSS se bazează pe puterea acestor unități, pentru a combina inteligent detalii din scene multidimensionale, in crearea unei imagini de calitate superioara.
Marea noutate este capabilitatea de Ray Tracing in timp real, care se bazează pe noile nuclee RT, dedicate pentru acest aspect. Aceste unități, combinate cu tehnologia software NVIDIA RTX si algoritmi sofisticați de filtrare, oferă randare avansata, in timp real, pentru obiecte fotorealiste, precum si umbre, reflexii si refracții.
{youtube}v=Ms7d-3Dprio{/youtube}
In paralel, Microsoft a anunțat dezvoltarea API-urilor DirectML pentru AI si DirectX RayTracing (DXR), la începutul anului. Acestea vor completa arhitectura Turing, oferind producătorilor de jocuri noi orizonturi grafice.
Numele de cod pentru cip-uri, împreuna cu plăcile bazate pe Turing, le găsiți in tabelul următor.
RTX 2070 | RTX 2070 FE | RTX 2080 | RTX 2080 FE | RTX 2080 Ti | RTX 2080 Ti FE | |
GPU | TU106 | TU106 | TU104 | TU104 | TU102 | TU102 |
Fabricație | TSMC 12 nm FFN | |||||
Arie GPU (mm²) | 445 | 445 | 545 | 545 | 754 | 754 |
Transistori | 10.8 Miliarde | 10.8 Miliarde | 13.6 Miliarde | 13.6 Miliarde | 18.6 Miliarde | 18.6 Miliarde |
Nuclee CUDA | 2304 | 2304 | 2944 | 2944 | 4352 | 4352 |
Nuclee RT | 36 | 36 | 46 | 46 | 68 | 68 |
Nuclee Tensor | 288 | 288 | 368 | 368 | 544 | 544 |
Unități Texturare | 144 | 144 | 184 | 184 | 272 | 272 |
ROP | 64 | 64 | 64 | 64 | 96 | 96 |
L2 Cache | 4096 KB | 4096 KB | 4096 KB | 4096 KB | 5632 KB | 5632 KB |
Frecventa | 1410 MHz | 1410 MHz | 1515 MHz | 1515 MHz | 1350 MHz | 1350 MHz |
Boost | 1620 MHz | 1710 MHz | 1710 MHz | 1800 MHz | 1545 MHz | 1635 MHz |
Memorie | 8GB GDDR6 | 8GB GDDR6 | 8GB GDDR6 | 8GB GDDR6 | 11GB GDDR6 | 11GB GDDR6 |
Frecventa memorie | 14 Gbps | 14 Gbps | 14 Gbps | 14 Gbps | 14 Gbps | 14 Gbps |
Magistrala | 256-bit | 256-bit | 256-bit | 256-bit | 352-bit | 352-bit |
Lățime de banda Memorie | 448 GB/s | 448 GB/s | 448 GB/s | 448 GB/s | 616 GB/s | 616 GB/s |
NVLink | Nu | Nu | Da | Da | Da | Da |
Performanta RTX | 45T RTX-Ops | 60T RTX-Ops | 78T RTX-Ops | |||
Performanta RT | 6 GR/s | 6 GR/s | 8 GR/s | 8 GR/s | 10 GR/s | 10 GR/s |
Temp max | 89C | |||||
TDP | 175W | 185W | 215W | 225W | 250W | 260W |
Alimentare | 8 pini | 8 pini | 8+6 pini | 8+6 pini | 2x 8 pini | 2x 8 pini |
Preț | $499 | $599 | $699 | $799 | $999 | $1,199 |
Din tabel aflam specificațiile noilor placi grafice, dar si faptul ca 2070 nu are NV Link, conectorul responsabil pentru SLI.
Iată câteva jocuri care suporta RTX: Battlefield V, Control, Final Fantay XV, Hitman 2, Justice, Metro Exodus, PUBG, Serious Sam 4, Shadow of Tomb Raider, Mechwarrior V.
Avem si o comparație cu GTX 1080 Ti. In tabel sunt valorile atât pentru variantele de referință (REF), cat si pentru Founders Edition (FE).
GTX 1080Ti | RTX 2080 Ti | |
GPU Boost Clock MHz (REF / FE) | 1582 / 1582 | 1545 / 1635 |
RTX-OPS (Tera-OPS) (REF / FE) | 11.3 / 11.3 | 76 / 78 |
Rays Cast (Giga Rays/sec) (REF / FE) | 1.1 / 1.1 | 10 / 10 |
Peak FP32 TFLOPS (REF/FE) | 11.3 / 11.3 | 13.4 / 14.2 |
Peak INT32 TIPS (REF/FE) | NA | 13.4 / 14.2 |
Peak FP16 TFLOPS (REF/FE) | NA | 26.9 / 28.5 |
Peak FP16 Tensor TFLOPS cu FP16 (REF/FE) | NA | 107.6 / 113.8 |
Peak FP16 Tensor TFLOPS cu FP32 (REF/FE) | NA | 53.8 / 56.9 |
Peak INT8 Tensor TOPS (REF/FE) | NA | 215.2 / 227.7 |
Peak INT4 Tensor TOPS (REF/FE) | NA | 430.3 / 455.4 |
Memorie | 11264 MB GDDR5X | 11264 MB GDDR6 |
Interfață Memorie | 352-bit | 352-bit |
Rata Memorie | 11 Gbps | 14 Gbps |
Lățime de banda (GB/sec) | 484 | 616 |
ROPs | 88 | 88 |
Unități Texturare | 224 | 272 |
Texel Fill-rate (Gigatexels/sec) | 354.4 / 354.4 | 420.2 / 444.7 |
L2 Cache | 2816 KB | 5632 KB |
File Size/SM | 256 KB | 256 KB |
File Size/GPU | 7168 KB | 17408 KB |
TDP (REF/FE) | 250 / 250 W | 250 / 260 W |
Transistori | 12 Miliarde | 18.6 Miliarde |
Arie GPU | 471 | 754 |
Proces | 16 nm | 12 nm FFN |
Sursa http://www.techzone.ro/6810-arhitectura-nvidia-turing-familia-geforce-rtx-2070-2080-si-2080-ti