Arhitectura Nvidia Turing – familia Geforce RTX (2070, 2080 si 2080 Ti)

Arhitectura Nvidia Turing – familia Geforce RTX (2070, 2080 si 2080 Ti)

Nu de mult, într-o transmisiune live, NVIDIA si-a anunțat noua generație de placi grafice, bazate pe arhitectura Turing, care vine sa înlocuiască bine-cunoscuta Pascal, ai cărei membrii (GTX 10xx/Ti) au ținut (si încă țin) sus FPS-urile in jocurile noastre.

Este vorba de un pas mare pentru NVIDIA, dar si mai mare pentru gameri, care vor beneficia de tehnologii noi, menite sa îmbunătățească grafica in jocuri si sa o aducă mai aproape de realitate. Exista deja producători care au integrat aceste tehnologii in jocurile lor, unele apărute, altele urmând sa fie lansate.

Turing features

Noile placi sunt capabile de 4K HDR la 60Hz, iar multe jocuri suporta aceste setări, astfel încât puteți sa le jucați in aceste condiții.

Turing

Noua arhitectura NVIDIA se numește Turing si a fost botezata după celebrul Alan Turing (matematician, criptolog si specialist in știința computerelor), care a inventat mașina cu același nume. Aceasta a deschis, in 1936, era algoritmilor si computing-ului, punând bazele a ceea ce astăzi numim Inteligenta Artificiala.

Așadar, NVIDIA continua politica de a își numi arhitecturile după matematicieni celebri.

Turing a introdus o noua arhitectura pentru procesoarele grafice, numita Turing SM (Streaming Multiprocessor), care îmbunătățește, cu 50%, performanta per nucleu CUDA, comparativ cu Pascal.

Turing SM arch

Avantajul vine de la 2 schimbări de arhitectura:

a. s-a introdus o noua magistrala pentru Integer, care executa instrucțiuni simultan cu magistrala pentru FP (Floating Point). La Pascal, cele 2 acțiuni se executau pe rând.

b. magistrala memoriei a fost redesenata pentru a unifica memoria partajată + cache texturi + zona de încărcare a memoriei, într-o singura unitate. Aceasta manevra dublează lățimea de banda si asigura de cel puțin 2x mai mult spațiu pentru cache-ul L1.

Pe lângă CUDA, exista acum si nuclee Tensor, dar si RT, fiecare oferind accelerare hardware pentru diverse tehnologii. Este prima arhitectura care aduce AI (Inteligenta Artificiala) si Ray-Tracing, in zona de gaming.

Turing arch

Noul procesor grafic beneficiază de eficienta crescuta pentru umbrire (shading), capabilități geometrice ridicate, precum si un nou tip de memorie, GDDR6, cu performante mai bune fata de GDDR5, dar si cu 20% mai eficienta energetic.

O alta veste buna este si aceea ca Turing a moștenit îmbunătățirile aduse de Volta, in special in zona de computing.

Iată câteva din tehnologiile introduse de noua arhitectura:

Mesh Shading aduce un nou model de umbrire pentru vertex, tessellation si stagiile de geometrie, îmbunătățind partea de cumputing pentru geometrie.

Variable Rate Shading (VRS) permite dezvoltatorilor sa controleze dinamic rate de umbrire, intre o data la 16 pixeli si pana la de 8 ori per pixel. In acest fel se reduce munca in zadar a GPU, in zonele unde imaginea nu are nevoie de aceste tehnici, si se poate creste FPS. Ca exemple, unele dintre tehnicile folosite ar fi Content Adaptive Shading (umbrire in funcție de nivelul de detalii), Motion Adaptive Shading (umbrire in funcție de nivelul de mișcare din scena), iar pentru VR, Foveated Rendering (in funcție de rezoluție si poziția ochilor).

Texture-Space Shading = obiectele sunt umbrite intr-un spațiu privat (spațiu de texturare), din memoria video, iar umbrirea la nivel de pixel se efectuează tot acolo, in loc sa lucreze direct in producție.

NVIDIA NGX este un nou framework al tehnologiei RTX. NGX utilizează rețele neurale (Deep Neural Networks = DNN) si un set de servicii neurale pentru a rezolva funcții de AI, îmbunătățind astfel grafica randarea si alte aplicații adiacente. Nucleele Tensor sunt responsabile pentru Deep Learning si aduc funcții noi, precum DLSS (Deep Learning Super-Sampling), AI InPainting, AI Slow-Motion si AI Super Rezolution, menite sa accelereze randarea, îmbunătățind FPS si calitatea imaginii.

NVLink este noul tip de conexiune pentru SLI, capabila de o latime de banda de 100GB/s, in sistem bidirecțional. Pe lângă aceasta, NVLink permite partajarea de memorie intre placi.

USB-C si VirtualLink sunt noi in zona de video si sunt responsabile pentru viitoarele sisteme VR, cărora sa le ofere lățime de banda suficienta, dar permit si conectarea mai multor device-uri simultan.

Nucleele Tensor se ocupa de operațiunile de computing, utilizate in Deep Learning. Noua tehnica DLSS se bazează pe puterea acestor unități, pentru a combina inteligent detalii din scene multidimensionale, in crearea unei imagini de calitate superioara.

Turing DLSS

Marea noutate este capabilitatea de Ray Tracing in timp real, care se bazează pe noile nuclee RT, dedicate pentru acest aspect. Aceste unități, combinate cu tehnologia software NVIDIA RTX si algoritmi sofisticați de filtrare, oferă randare avansata, in timp real, pentru obiecte fotorealiste, precum si umbre, reflexii si refracții.

{youtube}v=Ms7d-3Dprio{/youtube}

In paralel, Microsoft a anunțat dezvoltarea API-urilor DirectML pentru AI si DirectX RayTracing (DXR), la începutul anului. Acestea vor completa arhitectura Turing, oferind producătorilor de jocuri noi orizonturi grafice.

Numele de cod pentru cip-uri, împreuna cu plăcile bazate pe Turing, le găsiți in tabelul următor.

RTX 2070

RTX 2070 FE

RTX 2080

RTX 2080 FE

RTX 2080 Ti

RTX 2080 Ti FE

GPU

TU106

TU106

TU104

TU104

TU102

TU102

Fabricație

TSMC 12 nm FFN

Arie GPU (mm²)

445

445

545

545

754

754

Transistori

10.8 Miliarde

10.8 Miliarde

13.6 Miliarde

13.6 Miliarde

18.6 Miliarde

18.6 Miliarde

Nuclee CUDA

2304

2304

2944

2944

4352

4352

Nuclee RT

36

36

46

46

68

68

Nuclee Tensor

288

288

368

368

544

544

Unități Texturare

144

144

184

184

272

272

ROP

64

64

64

64

96

96

L2 Cache

4096 KB

4096 KB

4096 KB

4096 KB

5632 KB

5632 KB

Frecventa

1410 MHz

1410 MHz

1515 MHz

1515 MHz

1350 MHz

1350 MHz

Boost

1620 MHz

1710 MHz

1710 MHz

1800 MHz

1545 MHz

1635 MHz

Memorie

8GB GDDR6

8GB GDDR6

8GB GDDR6

8GB GDDR6

11GB GDDR6

11GB GDDR6

Frecventa memorie

14 Gbps

14 Gbps

14 Gbps

14 Gbps

14 Gbps

14 Gbps

Magistrala

256-bit

256-bit

256-bit

256-bit

352-bit

352-bit

Lățime de banda Memorie

448 GB/s

448 GB/s

448 GB/s

448 GB/s

616 GB/s

616 GB/s

NVLink

Nu

Nu

Da

Da

Da

Da

Performanta RTX

45T RTX-Ops

60T RTX-Ops

78T RTX-Ops

Performanta RT

6 GR/s

6 GR/s

8 GR/s

8 GR/s

10 GR/s

10 GR/s

Temp max

89C

TDP

175W

185W

215W

225W

250W

260W

Alimentare

8 pini

8 pini

8+6 pini

8+6 pini

2x 8 pini

2x 8 pini

Preț

$499

$599

$699

$799

$999

$1,199

Din tabel aflam specificațiile noilor placi grafice, dar si faptul ca 2070 nu are NV Link, conectorul responsabil pentru SLI.

Iată câteva jocuri care suporta RTX: Battlefield V, Control, Final Fantay XV, Hitman 2, Justice, Metro Exodus, PUBG, Serious Sam 4, Shadow of Tomb Raider, Mechwarrior V.

Avem si o comparație cu GTX 1080 Ti. In tabel sunt valorile atât pentru variantele de referință (REF), cat si pentru Founders Edition (FE).

GTX 1080Ti

RTX 2080 Ti

GPU Boost Clock MHz (REF / FE)

1582 / 1582

1545 / 1635

RTX-OPS (Tera-OPS) (REF / FE)

11.3 / 11.3

76 / 78

Rays Cast (Giga Rays/sec) (REF / FE)

1.1 / 1.1

10 / 10

Peak FP32 TFLOPS (REF/FE)

11.3 / 11.3

13.4 / 14.2

Peak INT32 TIPS (REF/FE)

NA

13.4 / 14.2

Peak FP16 TFLOPS (REF/FE)

NA

26.9 / 28.5

Peak FP16 Tensor TFLOPS cu FP16 (REF/FE)

NA

107.6 / 113.8

Peak FP16 Tensor TFLOPS cu FP32 (REF/FE)

NA

53.8 / 56.9

Peak INT8 Tensor TOPS (REF/FE)

NA

215.2 / 227.7

Peak INT4 Tensor TOPS

(REF/FE)

NA

430.3 / 455.4

Memorie

11264 MB GDDR5X

11264 MB GDDR6

Interfață Memorie

352-bit

352-bit

Rata Memorie

11 Gbps

14 Gbps

Lățime de banda (GB/sec)

484

616

ROPs

88

88

Unități Texturare

224

272

Texel Fill-rate (Gigatexels/sec)

354.4 / 354.4

420.2 / 444.7

L2 Cache

2816 KB

5632 KB

File Size/SM

256 KB

256 KB

File Size/GPU

7168 KB

17408 KB

TDP (REF/FE)

250 / 250 W

250 / 260 W

Transistori

12 Miliarde

18.6 Miliarde

Arie GPU

471

754

Proces

16 nm

12 nm FFN

Sursa http://www.techzone.ro/6810-arhitectura-nvidia-turing-familia-geforce-rtx-2070-2080-si-2080-ti