Nachrichten

Was ist von den neuen NVIDIA- und AMD-Grafikkarten zu erwarten?

Neue Details zur Radeon RX 7900 XT mit neuer RDNA 3-Architektur und GeForce RTX 4090 Grafikkarten auf Basis von Ada Lovelace kommen immer wieder. Von diesen GPUs wird erwartet, dass sie erhebliche Leistungsverbesserungen bringen und auch die leistungshungrigsten Chips sein werden, die jemals produziert wurden.

Während NVIDIA mit seiner Ada Lovelace-Architektur einen monolithischen Ansatz anstrebt, wird AMD voraussichtlich ein Multi-Chip-Design (MCM) wie bei der CDNA 2-Architektur verwenden. AMD wird nun die Eins-zu-Eins-MCM-Technologie für Consumer- und Gaming-GPUs verwenden.

AMD Radeon RX 7900 XT: RDNA 3-Architektur und Navi 21

Der Flaggschiff-RDNA-3-Chip, die AMD Navi 31 GPU, wird die Radeon RX 7900 XT-Grafikkarte der nächsten Generation antreiben. WGPs (Working Set Processors) werden anstelle von CU (Information Processing Unit) in AMDs RDNA 3-Chips der neuen Generation verwendet. Die Grafikkarte soll zwei Basis-IPs haben, eine GCD (Graphics Core Die) basierend auf dem 5nm-Prozess von TSMC und eine MCD (Multi-Cache Die) basierend auf dem 6nm-Prozess von TSMC.

Die scheinbare Navi 31 GPU-Konfiguration umfasst zwei GCDs (Graphics Core Die) und eine einzelne MCD (Multi-Cache Die). Jede GCD hat 3 Shader Engines (insgesamt 6) und jede Shader Engine hat 2 Shader Arrays (2 pro SE / 6 pro GCD / 12 insgesamt).

Außerdem besteht jedes Shader-Array aus 5 WGPs (10 pro SE / 30 pro GCD / insgesamt 60) und jedes WGP besteht aus 8 SIMD32-Einheiten mit 32 ALUs (40 SIMD32 pro SA / 80 pro SE / 240 pro GCD / 480 insgesamt) Besitzer . Diese SIMD32-Einheiten liegen in der Mitte und bilden 7.680 Kerne pro GCD und 15.360 Kerne insgesamt.

Das Navi 31 MCD wird über den Infinity Fabric Mid-Contact der nächsten Generation mit zwei GCDs verbunden sein und einen Infinity Cache Cache mit einer Kapazität von 256-512 MB tragen. Jede GPU muss außerdem über 4 Speicherthemen (32 Bit) verfügen. Das bedeutet, dass es insgesamt 8 32-Bit-Speichercontroller für die 256-Bit-Busschnittstelle geben wird.

Ein weiteres aktuelles Gerücht enthüllte, dass AMD die 3D Infinity Cache-Speichertechnologie in der RDNA 3-Familie verwenden wird. Genau wie der L3-Cache der Milan-X-Chips wird es neben dem vorhandenen Cache auf der GPU eine zusätzliche vertikal gestapelte Cache-Einheit geben.

AMD RDNA GPU-Vergleich

GPU-Name Navi 10 Navi 21 Navi 31
GPU-Fertigungstechnologie 7nm 7nm 5nm (6nm?)
GPU-Verpackung Monolithisch Monolithisch MCD (Multi-Chiplet-Die)
Shader-Engines 2 4 6
GPU WGP 20 40 30 (Pro MCD)
60 (insgesamt)
SP pro WGP 128 128 256
Berechnungseinheit 40 80 120 (pro MCD)
240 (gesamt)
Kern (pro Die) 2560 5120 7680
Kern (Gesamt) 2560 5120 15360 (2 x MCD)
Speicherbus 256-Bit 256-Bit 256-Bit
Speichertyp GDDR6 GDDR6 GDDR6
Speicherkapazität 8GB 16GB 32GB
Unendlich Cache 128 MB 256-512MB
Flaggschiff-Artikelnummer Radeon RX 5700 XT Radeon RX 6900 XTX Radeon RX 7900 XT
TBP 225W 330W 350-550W
Veröffentlichungsdatum 2019 3. Quartal 2020 4. Quartal 2022 4. Quartal

NVIDIA GeForce RTX 4090: Ada Lovelace-Architektur und AD102-GPU

Für NVIDIAs Ada Lovelace-GPUs wird nach aktuellen Informationen die N5 (5nm)-Fertigungstechnologie von TSMC verwendet. Im Gegensatz zu AMD wird das grüne Team bei seinen neuen Grafikkarten ein monolithisches Design verwenden. Fügen wir hinzu, dass das Flaggschiff RTX 4090-Modell die AD102-GPU haben wird.

Die AD102-GPU soll eine Taktrate von bis zu 2,5 GHz haben (2,3 GHz durchschnittlicher Boost). NVIDIA AD102 scheint 18432 CUDA-Kerne zu haben, entsprechend den (veränderbaren) Frontfunktionen, die in 144 SM-Einheiten enthalten sind. Dies bedeutet eine fast doppelt so hohe Anzahl an Kernen im Vergleich zur Turing-Architektur. 2.3-2. Die Taktrate von 5 GHz bietet uns bis zu 85 bis 92 TFLOPs Prozessleistung (FP32). Das ist mehr als das Doppelte der FP32-Leistung der aktuellen RTX 3090, die 36 TFLOPs FP32-Rechenleistung beinhaltet.

Der Leistungszuwachs von 150% scheint riesig, aber man sollte nicht vergessen, dass NVIDIA mit Ampere tatsächlich einen großen Sprung bei den FP32-Preisen dieser Generation gemacht hat. Die Ampere GA102 GPU (RTX 3090) bietet 36 TFLOPs, während die Turing TU102 GPU (RTX 2080 Ti) 13 TFLOPs Rohleistung bietet. Mit anderen Worten, die FP-Kosten stiegen um über 150 %. Die RTX 3090 war jedoch in Bezug auf die reale Spieleleistung etwa 50-60% stärker als die RTX 2080 Ti.

Zudem steht auch mitten in der Information, dass das NVIDIA GeForce RTX 40 Flaggschiff ähnlich wie die RTX 3090 über ein 384-Bit-Businterface verfügen wird. Die unterlegenen Fahrzeuge werden wieder von GDDR6X-Speichern profitieren, wir werden aber höhere Bandbreiten sehen im Vergleich zu den aktuellen Modellen. Die RTX 4090 wird über 24 GB Speicher verfügen, sodass wir einseitige 16-GB-DRAM- oder doppelseitige 8-GB-DRAM-Module erwarten können.

NVIDIA GPU-Benchmark

GPU-Name TU102 GA102 AD102
GPU-Architektur Turing Ampere Ada Lovelace
GPU-Fertigungstechnologie TSMC 12nm NFF Samsung 8nm 5nm
Grafische Prozesssätze (GPC) 6 7 12
Texturprozesssätze (TPC) 36 42 72
Stream-Prozessoren (SM) 72 84 144
CUDA-Kernel 4608 10752 18432
Theoretisches TFLOP 16. einer 37. 6 ~90 TFLOPS?
Speichertyp GDDR6 GDDR6X GDDR6X
Speicherbus 384-Bit 384-Bit 384-Bit
Speicherkapazität 11 GB (2080 Ti) 24GB (3090) 24GB (4090?)
Flaggschiff-Artikelnummer RTX 2080 Ti RTX 3090 RTX 4090?
TGP 250W 350W 450-650W?
Veröffentlichungsdatum September 2018 September 2020 2022?

Ähnliche Artikel

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.