NVIDIA, nihayet yeni kuşak RTX 4000 ekran kartlarını piyasaya sundu. Gücünü Ada Lovelace mimarisinden alan seride üç farklı ekran kartı yer alıyor: RTX 4090, RTX 4080 16 GB ve RTX 4080 12 GB. Daha evvel amiral gemisi GeForce RTX 4090’ın ayrıntılarına bakmıştık. Artık ise kardeşlerine göz atalım.
NVIDIA, geçmişte sızıntılarda bahsettiğimiz RTX 4070 modelini şimdi duyurmadı. RTX 4070 ve RTX 4060 üzere daha alt düzey modellerin ne vakit geleceğini bilmiyoruz. Lakin RTX 4080 12 GB, özellikleriyle RTX 4070’in yerini almış görünüyor.
16 GB ve 12 GB’lık modellerin teknik özelliklerine baktığımızda büyük farklılıklar var. RTX 3080 ile kıyaslandığında ise değerli performans artışları sağlanmış.
Yeşil takımın mühendisleri, 5nm (N5) üretim teknolojisinin optimize edilmiş bir versiyonu olan TSMC 4nm (N4) üretim teknolojisinden faydalandı. Şirket böylece GPU’larına 76 milyar transistör ve 18.000’den fazla gölgelendirici dahil etmeyi başardı. RTX 4000 serisi GPU’ların hiçbirinde NVLink bulunmuyor. Kartlar ayrıyeten tıpkı formda PCIe Gen4 x16 arabirimini kullanmaya devam edecek.
Hatırlarsanız Ampere mimarisiyle birlikte birlikte Tensor ve Ray Tracing çekirdekleri güncellenmişti. NVIDIA artık Ada Lovelace mimarisiyle birlikte dördüncü jenerasyon Tensor çekirdeklerine ve üçüncü jenerasyon RT çekirdeklerine geçiş yapıyor. Savlara bakılırsa iki kata kadar daha yüksek yapay zeka performansı ve iki kata kadar performanslı Işın İzleme performansı sunulacak.
RT ve Tensor Çekirdekleri
Ada’nın yeni dördüncü kuşak Tensor çekirdekleri, birinci olarak Hopper H100 bilgi merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak randımanı 5 kata kadar artırıyor ve 1,4 Tensor-petaFLOPS’a çıkarıyor. Öte taraftan, RT çekirdekleri yeni Opacity Micromap (OMM) Motoru ve yeni Displaced Micro-Mesh (DMM) Motoru ile birlikte geliyor. OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha düzgün işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha süratli Bounding Volume Hierarchy (BVH) oluşturma mühleti sunarak geometrik olarak karmaşık sahnelerin gerçek vakitli ışın takibini mümkün hale getiriyor.
Shader Execution Reordering
Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı objeye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylece çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, evvelden verimsiz olan bu iş yüklerini dinamik olarak tekrar düzenleyerek çok daha verimli hale getirecek. SER, ışın izleme süreçleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare suratlarını %25’e kadar artırabiliyor.
AV1 Kodek Desteği
Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama dayanağı sunan sekizinci kuşak NVIDIA Encoder’a (NVENC) sahip olacak. Böylece yayıncılar ve görüntü işiyle uğraşanlar için yeni imkanlar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıca 1080p’de yayın yapan kullanıcıların birebir bit suratı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.
DLSS 3
DLSS 3, performansı büyük ölçüde artırırken yapay zeka takviyeli grafiklerde ihtilal niteliğinde atılımlar sunuyor. Makus haberi baştan verelim, yeni kuşak DLSS sürümü sadece RTX 4000 serisi ekran kartlarında desteklenecek. Eski jenerasyon RTX 3000 serisi ise DLSS 2 ile yoluna devam edecek. NVIDIA, DLSS 3 ile DLSS 1 ortasında 16 katlık performans artışı meydana geldiğini söylüyor.
Mimarinin Getirileri
Genel olarak, Ampere ve Ada Lovelace mimarisini kıyaslayacak olursak aşağıdaki sonuçlar karşımıza çıkıyor.
- 2 kat daha fazla GPC (Grafik Sürece Kümeleri).
- %50 daha fazla çekirdek.
- %50 daha fazla L1 önbellek.
- 16 kat daha fazla L2 önbellek.
- ROP sayısı iki katına çıktı.
- 4. Kuşak Tensor ve 3. Kuşak RT Çekirdekleri.
GeForce RTX 4080, toplamda 84 SM’lik kapasiteye çıkan AD103-300 GPU’nun 76 adetlik ünitesini kullanıyor. Böylece toplamda 9728 CUDA çekirdeği ortaya çıkıyor. Tam yapılandırmalı AD103 GPU, 64 MB L2 önbellek ve 224’e kadar ROP sunuyor. RTX 4080’in kullandığı GPU’da ise daha düşük ROP ve önbellek ölçüsü mevcut.
2210 MHz’lik temel frekansa sahip olan GPU, 2510 MHz süratle neredeyse RTX 4090 ile eşit frekans suratı sunuyor. Elbette burada referans dizayndan kelam ediyoruz. NVIDIA, laboratuvar testlerinde yeni GPU’ları 3.0 GHz’ın üzerine çıkardığını belirtmişti. Yani özel soğutmayla desteklenen kartlar 3.0 GHz’e yakın frekanslarla gelebilir.
16 GB’lık RTX 4080, 256 bit data yolundan bağlantı kuran, 23 Gbps sürate ulaşabilen GDDR6X bellek ile çalışıyor. Böylece 720 GB/s üzere bir teorik bant genişliğine ulaşıyoruz. Geçmiş kuşak RTX 4080 760 GB/s ile daha yüksek bant genişliğine sahipti zira 320 bitlik bellek bilgi yolu kullanılıyordu.
NVIDIA, 320W TBP (Toplam Kart Gücü) kıymetine sahip olan kartı için en az 750W’lık bir güç kaynağı öneriyor. Resmi olarak açıklanmamış olsa da, BIOS ile azamî TGP pahasının 516W olarak ayarlandığı söyleniyor.
RTX 3070’in yerini alan GeForce RTX 4080, toplamda 7.680 çekirdek taşıyan 60 SM ile destekleniyor. AD104 GPU, toplam 48 MB L2 önbelleğe sahip olacak. Bellek tarafına gelince, 192 bit ile arayüz genişliği üst modele kıyasla düşüyor. Bu nedenle alt sürümde 12 GB kapasiteli GDDR6X bellekler kullanıldı. Sonuç olarak, 21 Gbps suratında çalışan belleklerle birlikte bant genişliği 504 GB/sn’de kısıtlanıyor.
Founders Edition, 2310 MHz taban saat suratına ayarlanırken azamî 2610 MHz frekansa çıkabiliyor. Yani frekans suratı RTX 4080 16 GB ve RTX 4090’dan daha yüksek. Güç konusunda, TBP kıymeti RTX 3080 10 GB modeline nazaran 35W daha düşük ve 285W olarak derecelendirildi.
NVIDIA, bu kartın RTX 3080 Ti’den daha süratli olduğunu söylüyor. Lakin RTX 4080 16 GB ile teknik özellikler kıyaslandığında her iki model ortasında büyük bir boşluk olacak. Ayrıyeten azamî BIOS TGP bedelinin 366W olarak ayarlandığını belirtelim.
RTX 4090 | RTX 4080 16 GB | 4080 12 GB | RTX 3090 Ti | RTX 3080 | |
---|---|---|---|---|---|
GPU | AD102-300 | AD103-300 | AD104-400 | Ampere GA102-225 | Ampere GA102-200 |
Üretim Teknolojisi | TSMC 4N | TSMC 4N | TSMC 4N | Samsung 8nm | Samsung 8nm |
Kalıp Boyutu | ~600mm2 | ~450mm2 | ~450mm2 | 628.4mm2 | 628.4mm2 |
Transistör | ~75 milyar | ? | ? | 28 milyar | 28 milyar |
CUDA Çekirdekleri |
16384 | 9728 | 7680 | 10240 | 8704 |
TMU / ROP | ? | ? | ? | 320 / 112 | 272 / 96 |
Tensor / RT Çekirdekleri | ? | ? | ? | 320 / 80 | 272 / 68 |
Taban Saat | 2230 MHz | 2210 MHz | 2310 MHz | 1365 MHz | 1440 MHz |
Boost Saati | 2520 MHz | 2510 MHz | 2610 MHz | 1665 MHz | 1710 MHz |
FP32 Hesaplama | 82.6 TFLOPs | ~50 TFLOPs | ~40 TFLOPs | 34 TFLOPs | 30 TFLOPs |
Bellek | 24 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X |
Veri Yolu | 384-bit | 256-bit | 192-bit | 384-bit | 320-bit |
Bellek Hızı | 21 Gbps | 22.5 Gbps | 21 Gbps | 19 Gbps | 19 Gbps |
Bant Genişliği | 1008 GB/s | 720 GB/s | 504 GB/s | 912 Gbps | 760 Gbps |
TBP | 450W | 320W | 285W | 350W | 320W |
Maks. TGP | 660W | 516W | 366W | – | – |
Liste Fiyatı | 1599$ | 1199$ | 899$ | 1199$ | 699$ |
Çıkış Tarihi | 12 Ekim 2022 | Kasım 2022 | Kasım 2022 | 3 Haziran 2021 | Eylül 2020 |
Yeni kuşak ekran kartları, NVIDIA’nın argümanlarına bakılırsa kullanım senaryosuna bağlı olarak iki ila dört kata kadar daha yüksek performans sunacak.
RTX 4080 serisi hakkında ayrıntılı performans bedelleri göremedik. Bu nedenle yakında gelecek olan ayrıntılı incelemelerimizi beklemenizde yarar var. Şirket tarafından yayınlanan kıyaslamada sırf üç oyuna yer verilmiş. RTX 3080 Ti ile yapılan kıyaslamalarda ortalama iki katlık performans artışı sağlandığını görüyoruz. Tabloya bakılırsa RTX 4080 serisi ekran kartları RTX 3090 serisinden de performanslı olacak.
NVIDIA GeForce RTX 4080 16 GB ve RTX 4080 12 GB ekran kartları sırasıyla 1199 dolar ve 899 dolarlık fiyatla piyasaya sürülecek. Tam bir gün verilmedi, lakin satışların Kasım ayında başlamasını bekliyoruz.