NVIDIA, aylar ve hatta yıllar süren söylentilerin akabinde GeForce RTX 4000 serisi ekran kartlarını oyuncuların ve içerik üreticilerin beğenisine sundu. GTC 2022 aktifliği özel bir “GeForce Beyond” sunumuna sahne olurken “Ada Lovelace” mimarisi hakkında ayrıntılar sağlandı. Bu mimari ismini tarihteki bir matematikçiden alıyor.
NVIDIA CEO’su Jensen Huang, birinci etapta RTX 4090, RTX 4080 16 GB ve RTX 4080 12 GB modellerini tanıttı. RTX 4070 ile ilgili şimdi bir gelişme bulunmuyor. Ya da şirketin RTX 4070 yerine RTX 4080 12 GB üzere bir kart hazırladığını söyleyebiliriz. NVIDIA, anladığımız kadarıyla bir müddet düşük performans segmenti için RTX 3000 serisine güvenmeye devam edecek.
Yeşil grubun mühendisleri, 5nm (N5) üretim teknolojisinin optimize edilmiş bir versiyonu olan TSMC 4nm (N4) üretim teknolojisinden faydalandı. Şirket böylece GPU’larına 76 milyar transistör ve 18.000’den fazla gölgelendirici dahil etmeyi başardı. RTX 4000 serisi GPU’ların hiçbirinde NVLink bulunmuyor. Kartlar ayrıyeten tıpkı biçimde PCIe Gen4 x16 arabirimini kullanmaya devam edecek.
Hatırlarsanız Ampere mimarisiyle birlikte birlikte Tensor ve Ray Tracing çekirdekleri güncellenmişti. NVIDIA artık Ada Lovelace mimarisiyle birlikte dördüncü kuşak Tensor çekirdeklerine ve üçüncü jenerasyon RT çekirdeklerine geçiş yapıyor. Argümanlara bakılırsa iki kata kadar daha yüksek yapay zeka performansı ve iki kata kadar performanslı Işın İzleme performansı sunulacak.
RT ve Tensor Çekirdekleri
Ada’nın yeni dördüncü kuşak Tensor çekirdekleri, birinci olarak Hopper H100 bilgi merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak randımanı 5 kata kadar artırıyor ve 1,4 Tensor-petaFLOPS’a çıkarıyor. Öte taraftan, RT çekirdekleri yeni Opacity Micromap (OMM) Motoru ve yeni Displaced Micro-Mesh (DMM) Motoru ile birlikte geliyor. OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha uygun işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha süratli Bounding Volume Hierarchy (BVH) oluşturma mühleti sunarak geometrik olarak karmaşık sahnelerin gerçek vakitli ışın takibini mümkün hale getiriyor.
Shader Execution Reordering
Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı objeye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylece çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, evvelce verimsiz olan bu iş yüklerini dinamik olarak yine düzenleyerek çok daha verimli hale getirecek. SER, ışın izleme süreçleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare suratlarını %25’e kadar artırabiliyor.
AV1 Kodek Desteği
Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama dayanağı sunan sekizinci jenerasyon NVIDIA Encoder’a (NVENC) sahip olacak. Böylece yayıncılar ve görüntü işiyle uğraşanlar için yeni imkanlar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıca 1080p’de yayın yapan kullanıcıların birebir bit suratı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.
DLSS 3
DLSS 3, performansı büyük ölçüde artırırken yapay zeka dayanaklı grafiklerde ihtilal niteliğinde atılımlar sunuyor. Berbat haberi baştan verelim, yeni kuşak DLSS sürümü sadece RTX 4000 serisi ekran kartlarında desteklenecek. Eski jenerasyon RTX 3000 serisi ise DLSS 2 ile yoluna devam edecek. NVIDIA, DLSS 3 ile DLSS 1 ortasında 16 katlık performans artışı meydana geldiğini söylüyor.
Mimarinin Getirileri
Genel olarak, Ampere ve Ada Lovelace mimarisini kıyaslayacak olursak aşağıdaki sonuçlar karşımıza çıkıyor.
- 2 kat daha fazla GPC (Grafik Sürece Kümeleri).
- %50 daha fazla çekirdek.
- %50 daha fazla L1 önbellek.
- 16 kat daha fazla L2 önbellek.
- ROP sayısı iki katına çıktı.
- 4. Jenerasyon Tensor ve 3. Jenerasyon RT Çekirdekleri.
NVIDIA’nın GeForce RTX 4090’ı uzun vakittir bekleniyordu ve nihayet burada. Yeni amiral gemisini kalbinde Ada Lovelace AD102 GPU yer alıyor. Yaklaşık 600 mm2 boyuta sahip olan GPU, muazzam formda 76 milyar transistör barındırıyor.
AD102 GPU aslında 144 adede kadar SM takviyesi sunuyor. GeFore RTX 4090, bunların 128 adedini kullanırken 16.384 CUDA çekirdeğini bir ortaya getiriyor. Yeni GPU 96 MB L2 önbellek ve toplam 384 ROP’a sahip olabilecek. Lakin RTX 4090’ın kullandığı GPU kırpılmış olduğundan ötürü bu sayılar biraz daha düşük olabilir.
RTX 4090 Founders Edition, 2.23 GHz standart saat suratı ve 2.52 GHz artırılmış saat suratına sahip görünüyor. NVIDIA, laboratuvarlarında sürat aşırtma ile Ada GPU’ları 3 GHz’in üzerine çıkardığını söylüyor. Referans tasarım bu suratlara ulaşamıyor. Fakat fabrika çıkışlı olarak overclock edilen özel soğutmalı modellerin 3.0 GHz’e yakın suratlara erişmesini bekliyoruz.
Bellek özelliklerine gelince, AD102 GPU’ya 384 bit bilgi yolu arabiriminde ve 21 Gbps suratında çalışan 24 GB kapasiteli 24 GDDR6X bellekler eşlik edecek. Böylece kağıt üzerinde GeForce RTX 3090 Ti ile birebir olan 1 TB/s bant genişliği ortaya çıkıyor.
Ekran kartının TBP bedeli (toplam kart gücü) 450W olarak listeleniyor, bu da TGP’nin (toplam grafik gücü) daha düşük olabileceği manasına geliyor. Bununla birlikte, devasa soğutmaya sahip özel dizaynların 500W üzerinde güç tüketmesi mümkün görünüyor.
RTX 4090 | RTX 4080 16 GB | NVIDIA GEFORCE RTX 4080 12 GB | RTX 3090 Ti | RTX 3080 | |
---|---|---|---|---|---|
GPU | AD102-300 | AD103-300 | AD104-400 | Ampere GA102-225 | Ampere GA102-200 |
Üretim Teknolojisi | TSMC 4N | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
Kalıp Boyutu | ~600mm2 | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
Transistör | ~75 milyar | ? | ? | 28 milyar | 28 milyar |
CUDA Çekirdekleri |
16384 | 9728 | 7680 | 10240 | 8704 |
TMU / ROP | ? | ? | ? | 320 / 112 | 272 / 96 |
Tensor / RT Çekirdekleri | ? | ? | ? | 320 / 80 | 272 / 68 |
Taban Saat | 2230 MHz | 2210 MHz | 2310 MHz | 1365 MHz | 1440 MHz |
Boost Saati | 2520 MHz | 2510 MHz | 2610 MHz | 1665 MHz | 1710 MHz |
FP32 Hesaplama | 82.6 TFLOPs | ~50 TFLOPs | ~40 TFLOPs | 34 TFLOPs | 30 TFLOPs |
Bellek | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
Veri Yolu | 384-bit | 256-bit | 192-bit | 384-bit | 320-bit |
Bellek Hızı | 21 Gbps | 23 Gbps | 21 Gbps | 19 Gbps | 19 Gbps |
Bant Genişliği | 1008 GB/s | 736 GB/s | 504 GB/s | 912 Gbps | 760 Gbps |
TBP | 450W | 320W | 285W | 350W | 320W |
Maks. TGP | 660W | 516W | 366W | – | – |
Liste Fiyatı | 1599$ | 1199$ | 899$ | 1199$ | 699$ |
Çıkış Tarihi | 12 Ekim 2022 | Kasım 2022 | Kasım 2022 | 3 Haziran 2021 | Eylül 2020 |
Yeni kuşak ekran kartları, NVIDIA’nın savlarına bakılırsa kullanım senaryosuna bağlı olarak iki ila dört kata kadar daha yüksek performans sunacak.
NVIDIA, rekabetçi oyunlarda 1440p çözünürlükte 300 FPS’nin üzerinde pahalara ulaştıklarını söylüyor. Piyasada hala 360 Hz tazeleme suratına sahip 1440p monitör yok, fakat artık üreticiler kolları sıvamış olmalı zira bundan faydalanabilecek donanımlar piyasaya çıkıyor.
NVIDIA tarafından sunulan RTX 3090 Ti kıyaslama tablosunda Microsoft Flight Simulator, Warhammer 40,000: Darktide ve Cyberpunk 2077 üzere oyunlar görüyoruz. Testler i9-12900K işlemci, 32 GB RAM ve Windows 11 işletim sisteminde yapıldı. DLSS Performans modunda çalışıyordu.
NVIDIA GeForce RTX 4090 Founders Edition, 1599 dolarlık fiyatla birlikte 12 Ekim’de satışa sunulacak. Bildiğiniz üzere MSI, ASUS ve Gigabyte üzere üretim ortaklarının ekran kartları modeline nazaran farklı fiyat etiketine sahip oluyor. Bu nedenle fiyatlan
RTX 3090 Ti, RTX 3000 serisi tanıtıldıktan uzun vakit sonra piyasaya çıkmıştı. Bu nedenle RTX 4090 Ti yahut muhtemel Titan modelini yakın bir vakitte beklemiyoruz.