NVIDIA GeForce RTX 4090 İncelemesi - Meteor Haber

NVIDIA, yakın tarihte yesyeni bir grafik mimarisiyle birlikte GeForce RTX 4000 serisi ekran kartlarını tanıtmıştı. Ada Lovelace mimarili kartların hükümdarı GeForce RTX 4090, artık ofisimize konuk oluyor.

İlk bilgisayar programcısı olarak kabul edilen Ada Lovelace’ın ismini taşıyan GeForce “Ada” grafik mimarisi, CUDA çekirdeklerinden RT çekirdeklerine, yapay zeka konusunda kıymetli bir faktör olan Tensor çekirdeklerinden gölgelendirici performansını artıran Shader Execution Reordering SIMD optimizasyonlarına kadar her alanda yenilikler getiriyor.

“Ada” CUDA çekirdekleri, Ampere mimarisi üzerinde çok büyük frekans ve IPC artışları sağlıyor. Yeni kuşak GPU’ların NVIDIA’ya özel olarak optimize edilen TSMC 4nm üretim teknolojisinden faydalandığını biliyoruz. GeForce RTX 4090 ise bu jenerasyon için geliştirilen en büyük GPU olan “AD102” silikonundan gücünü alıyor. AD102 silikonu aslında 18.432 CUDA çekirdeğinin kullanılmasına imkan tanıyor, lakin mevcut amiral gemisi 16.384 CUDA çekirdeğiyle çalışacak halde ayarlanmış.

CUDA çekirdeklerinin yanı sıra, 568 Tensor çekirdeğinden 512’si, 142 RT çekirdeğinden 128’i kullanılıyor. Kart ayrıyeten 512 TMU ve 192 ROP ile donatılmış. Tam yapılandırma ise muhtemelen GeForce RTX 4090 Ti için saklanıyor. Mevcuttaki en güçlü kart olan 4090, RTX 3090 Ti ile tıpkı biçimde 21 Gbps süratte çalışan, teorik olarak 1008 GB/sn bant genişliği sunan 24 GB GDDR6X belleklerden yararlanıyor.

NVIDIA, donanımsal ve rasterizasyon açısından kuşaklar ortasında büyük performans artışları sağlamış. Tüm bunlara bir de devrimsel DLSS 3 teknolojisi dahil olduğunda işler bambaşka bir noktaya geliyor. Sırf RTX 4000 serisine özel olan DLSS 3 teknolojisi, GPU’nun ana grafik sürece sisteminden hariç olarak sadece yapay zeka kullanarak yeni kareler üretebiliyor. Şirket bundan “sinirsel sürece (neural rendering)” olarak bahsediyor ve grafik dünyasına yeni tabir daha getiriyor. Bu sahiden çok kıymetli bir atılım. NVIDIA, yeni teknolojisini rasterizasyon ve ışın izleme tekniklerinin yanında farklı bir biçimde konumlandırıyor.

İncelememize konuk NVIDIA GeForce RTX 4090 Founders Edition, yeşil ekil takımın referans dizaynını temsil ediyor. Yeni kuşak kartların genel görünümü RTX 3000 serisiyle birebir kalmış, lakin RTX 4090 nitekim heybetli ve çok büyük. RTX 4000 serisi PCI-Express Gen 4 irtibat arabirimini kullanmaya devam ederken, güç mimarisi için PCIe Gen 5 standardına geçiş yapılmış. 12VHPWR ismi verilen yeni 12+4 pin tasarımı, referans tasarım da dahil olmak üzere üretim ortakları tarafından geliştirilen RTX 4090 modellerinde standart haline geliyor.

Türkiye’de satışa sunulmayan RTX 4090 Founders Edition 1.599 dolarlık fiyatla satışa çıktı. GeForce RTX 4090 ise iki yıl öncesinde 100 dolarlık farkla, 1.499 dolar fiyatla çıkış yapmıştı. Bu ortada, özel soğutmalı RTX 4090 modellerinin 1.999 dolara kadar uzandığını ve hatta kimi modellerin 2.000 dolar üzerine çıktığını belirtelim. Ülkemizde ise özel dizaynlar 40.000-50.000 lira civarında fiyatlarla satılıyor.

Graphics Card	RTX 4090	RTX 3090 Ti	RTX 3090	RTX 3080 Ti	RX 6950 XT	Arc A770 16GB
Mimari	AD102	GA102	GA102	GA102	Navi 21	ACM-G10
Üretim Teknolojisi	TSMC 4N	Samsung 8N	Samsung 8N	Samsung 8N	TSMC N7	TSMC N6
Transistör Sayısı	76.3 milyar	28.3 milyar	28.3 milyar	28.3 milyar	26.8 milyar	21.7 milyar
Kalıp Boyutu	608.4 mm^2	628.4 mm^2	628.4 mm^2	628.4 mm^2	519 mm^2	406 mm^2
SM / CU / Xe-Core	128	84	82	80	80	32
GPU Çekirdeği	16384	10752	10496	10240	5120	4096
Tensor Çekirdeği/ XMX Motoru	512	336	328	320	–	512
Işın İzleme Çekirdeği	128	84	82	80	80	32
Boost Frekansı	2520 MHz	1860 MHz	1695 MHz	1665 MHz	2310 MHz	2100 MHz
Bellek Hızı	21 Gbps	21 Gbps	19.5 Gbps	19 Gbps	18 Gbps	17.5 Gbps
Bellek Kapasitesi	24 GB	24 GB	24 GB	12 GB	16 GB	16 GB
Bellek Bant Genişliği	384-bit	384-bit	384-bit	384-bit	256-bit	256-bit
L2 / Infinity Önbellek	72	6	6	6	128	16
ROP	176	112	112	112	128	128
TMU	512	336	328	320	320	256
TFLOPS FP32	82.6	40	35.6	34.1	23.7	17.2
TFLOPS FP16 (FP8/INT8)	661 (1321)	160 (320)	142 (285)	136 (273)	47.4	138 (275)
Bant Genişliği	1008 GBps	1008 GBps	936 GBps	912 GBps	576 GBps	560 GBps
TDP	450W	450W	350W	350W	335W	225W
Liste Fiyatı	1,599$	1,999$	1,499$	1,199$	1,099$	349$

Yukarıdaki teknik özellikler tablosu aslında birçok şeyin göstergesi; transistör sayıları Ampere mimarisine kıyasla neredeyse üç katına çıktı, RTX 4090’daki çekirdek sayıları RTX 3090 Ti’den %52 daha yüksek, GPU saat suratları %35 daha fazla ve 12 kat daha fazla L2 önbellek mevcut. RTX 4090’ın potansiyelini teorik olarak rahatlıkla görebiliyoruz ve RTX 3090/3090 Ti’ye kıyasla değerli farklar var. Fakat GPU’nun içinde fark yaratan öbür değişiklikler de var.

Eğer ekran kartlarını profesyonel hedefle kullanacaksanız, bilhassa de derin öğrenme ve yapay zeka alanında iş yapıyorsanız, GeForce RTX 4000 serisi nitekim parasının hakkını verecek bir eser serisi. Ayrıyeten içerik üreten şahıslar için de Ada mimarili kartlar ülkü bir seçenek olabilir. Bu işten para kazananlar için zaman=para demek. RTX 4000 serisi kartlar da nitekim kıymetli gelişmeler sunuyor.

NVIDIA Ada Lovelace mimarisi.

Peki ya oyuncular? RTX 3090 ve 3090 Ti’nin tersine NVIDIA, RTX 4090’ın sırf profesyoneller için tasarlandığını söylemiyor Evet, RTX 4090 profesyoneller için olağanüstü işler çıkaracak. Lakin bu kart birebir vakitte GeForce ailesinin bir modülü ve şirket oyun performansı konusunda daima grafik kıyaslamaları yapıyor. RTX 4090 ile yaptığımız testlerde gördüğünüz üzere, yeni amiral gemisi DLSS 3 devre dışı olsa bile sahiden çok güçlü. DLSS 3 devreye girdiğinde ise işler zati değişik bir hal alıyor.

3. Jenerasyon Ray Tracing Çekirdekleri

Işın izleme bir sefer daha büyük kıymet kazanıyor ve üç yeni teknoloji hayatımıza giriyor: Shader Execution Reordering (SER), Opacity Micro-Maps (OMM) ve Displaced Micro-Meshes (DMM). Bu yeniliklerin tümüyle birlikte çeşitli iyileştirmeler sunuluyor, lakin geliştiricilerin yeni teknolojileri oyunlarına uygulaması gerekecek.

NVIDIA Shader Execution Reordering performans karları.

OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha yeterli işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha süratli Bounding Volume Hierarchy (BVH) oluşturma müddeti sunarak geometrik olarak karmaşık sahnelerin gerçek vakitli ışın takibini mümkün hale getiriyor.

Opacity Micro-Maps (OMM)

Ada GPU içinde yer alan ışın izleme üniteleri, Faster Ray-Triangle Intersection Throughput (Işın-Üçgen Kesişme Verimi) açısından iki kat daha gelişmiş ve bu da geliştiricilerin sanal dünyalarına daha fazla detay eklemelerini sağlıyor.

Shader Execution Reordering

Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı objeye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylece çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, evvelden verimsiz olan bu iş yüklerini dinamik olarak yine düzenleyerek çok daha verimli hale getirecek. SER, ışın izleme süreçleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare suratlarını %25’e kadar artırabiliyor.

4. Kuşak Tensor Çekirdekleri

Derin öğrenme ve yapay zeka iş yüklerine gelince, tekrar bu alanda büyük gelişmeler kaydedildiğini görüyoruz. Ada’nın dördüncü kuşak Tensor çekirdekleri, birinci olarak Hopper H100 data merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak randımanı 5 kata kadar artırıyor ve 1.4 Tensor-petaFLOPS’luk güç ortaya çıkıyor.

Transformer Engine sayesinde FP16 yerine FP8 kullanabilen algoritmalar için Tensor çekirdeği başına hesaplama mahareti iki katına çıkıyor.

AV1 Kodek Desteği

Önceki jenerasyon Ampere ekran kartlarında AV1 kod çözme takviyesi sunulsa da AV1 kodlama dayanağı sunulmuyordu. Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama dayanağı sunan sekizinci kuşak NVIDIA Encoder’a (NVENC) sahip olacak. Böylece yayıncılar ve görüntü işiyle uğraşanlar için yeni imkanlar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıyeten 1080p’de yayın yapan kullanıcıların birebir bit suratı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.

RTX 4000 Serisi AV1 ekosistemi.

Ada GPU’lar ayrıyeten çift NVENC kodlayıcı ile destekleniyor. Bu gelişim ise profesyonel görüntü düzenleme için 8K/60 yahut dört adet 4K/60 görüntü kodlamasına imkan sağlıyor. DaVinci Resolve, Adobe Premiere Pro için tanınan Voukoder eklentisi ve Çin’in en uygun görüntü düzenleme uygulaması olan Jianying, AV1 dayanağının yanı sıra çift kodlama dayanağıyla kullanıma sunulacak. NVIDIA ayrıyeten tanınan efekt uygulaması Notch’a AV1 takviyesi getirmek ve Topaz yazılımına çift kodlama takviyesi sunmak için çalışıyor.

DLSS 3, Gerçek Vakitli 3D Uygulamalarına da Katkı Sağlıyor

Grafik dünyasında 3D düzenleme yapmak şiddetli bir tecrübedir. 3D içerik üreticileri, çalışma yaptığı sıralarda daima önizleme yapmak zorunda kalırlar. Fakat DLSS 3’ün performans kazanımları sayesinde sanatkarlar, gerçek vakitli render uygulamalarında akıcı ve sıkıntısız formda içerik üretebilecekler.

DLSS 3 teknolojisi birinci etapta Unreal Engine, Unity ve Omniverse’e geliyor. 3D sanatkarları, daha evvel hiç görülmemiş gerçekçilik düzeyleriyle gerçek vakitli etkileşime imkan tanıyan gereçler, aydınlatma, objeler, karakterler ve sahneler oluşturabilecekler. Sanatkarlar sahnelerinde değişiklikler yaparken manzara anında işlenecek ve süratli geri bildirim alabilecekler.

24 GB GDDR6X Bellek

Bildiğiniz üzere, birçok iş yükü için GPU bellek boyutu ve suratları çok değerli. GeForce RTX 4090, öteki iyileştirmelerin yanı sıra 21 Gbps suratında çalışan 24 GB GDDR6X belleğiyle içerik üreticilerin işlerini kolaylaştıracak. Çok sayıda materyal ve doku kullanan, büyük bilgi kümeleriyle çalışan şahıslar, ağır GPU kullanımına gereksinim duyan iş akışlarını rahat yürütebilecek.

DLSS 3, kaliteyi bozmadan FPS oranlarında iki kat ve kimi durumlarda daha yüksek performans artışları getiriyor. Bu hakikaten oyun ve grafik dünyasında ihtilal yaratan bir teknoloji.

DLSS 2’nin tüm özelliklerine ek olarak, bu teknoloji grafik oluşturma süreç sınırını dahil etmeden sırf yapay zeka kullanarak kareleri oluşturma yeteneğine sahip. DLSS 3 ile değişen her kare, evvelki işlenmiş karenin bir kopyası olmaksızın yapay zeka ile üretilmekte.

NVIDIA DLSS 3 Teknolojisi.

DLSS 3, manzara kalitesi ve karşılık verme özelliğini korurken performansı büyük ölçüde artıran yapay zeka takviyeli grafiklerde ihtilal niteliğinde bir atılım olarak tanımlanıyor. DLSS Frame Generation otomatik kodlayıcısı 4 temel bilgiyi ele alıyor: mevcut ve evvelki oyun kareleri, Ada mimarisinin Optical Flow Accelerator’ı tarafından oluşturulan bir optik akış alanı, hareket vektörleri ve derinlik üzere oyun motoru bilgileri.

Optical Flow Accelerator, iki ardışık oyun içi kareyi tahlil ediyor ve bir optik akış alanı hesaplaması yapıyor. Optik akış alanı, piksellerin kare 1’den kare 2’ye hareket ettiği istikameti ve suratı yakalamakta. Optik Akış Hızlandırıcı, oyun motoru hareket vektörü hesaplamalarına dahil edilmeyen parçacıklar, yansımalar, gölgeler ve aydınlatma üzere piksel seviyesinde bilgileri yakalama yeteneğine sahip. Aşağıdaki motosiklet örneğinde, motosikletlinin hareket akışı gölgenin motosiklete nazaran ekranda kabaca birebir yerde kaldığını yanlışsız bir halde temsil etmekte.

Optik Akış Hızlandırıcı, yansıma üzere piksel seviyesindeki efektleri yanlışsız bir formda takip ederken, DLSS 3 ayrıyeten sahnedeki geometrinin hareketini tam olarak izlemek için oyun motoru hareket vektörlerini kullanıyor. Aşağıdaki örnekte oyun hareket vektörleri motosikletçinin yanından geçen yolun hareketini gerçek bir formda izlediği (ancak gölgeleri değil) gösterilmiş. Sadece motor hareket vektörlerini kullanarak çerçeveler oluşturmak, gölgede pürüz üzere görsel anormalliklere neden olmakta.

DLSS Frame Generation yapay zeka ağı, her piksel için orta kareler oluşturmak üzere oyun hareket vektörlerinden, optik akış alanından ve sıralı oyun karelerinden gelen bilgilerin nasıl kullanılacağına karar veriyor. Bu ağ, hareketi izlemek için hem motor hareket vektörlerini hem de optik akışı kullanarak (aşağıdaki fotoğrafta görüldüğü gibi) hem geometriyi hem de efektleri gerçek bir biçimde yine oluşturabiliyor.

Yapay zeka, DLSS 3 etkinleştirildiğinde birinci karenin dörtte üçünü ve DLSS Frame Generation kullanarak ikinci karenin tamamını yine yapılandırıyor. Biraz evvel belirttiğimiz üzere, görüntülenen toplam piksellerin sekizde yedisi tekrar yapılandırılıyor ve performansa büyük katkı sağlanıyor.

DLSS 3’ün Performans Katkısı

NVIDIA’nın tezlerine bakılırsa muhakkak oyun ve motorlarda klâsik işlemeye kıyasla dört kata kadar performans artışı sağlanabiliyor. Erken yaptığımız DLSS 3 testlerine aşağıdaki videomuzdan ulaşabilirsiniz. Yeni şoförler, oyun güncellemeleri ve gelişmiş DLSS 3 takviyesi ile çok daha güzelini görebiliriz.

Eskiden içerik üretimi büyük stüdyolar tarafından yapılırken, artık ferdî geliştiriciler güçlü sistemleriyle birlikte üstün görseller sunan içerikler üretebiliyor. NVIDIA, bildiğiniz üzere Game Ready şoförünün yanı sıra Studio şoförüyle profesyonel kullanıcılar için yenilikler ve optimizasyonlar sağlıyor. İşte yeşil ekibin sunduğu birtakım ayrıcalıklar:

3D, görüntü ve yapay zeka takviyeli işleri hızlandırmak için özel donanım optimizasyonları.
Güvenilirliği en üst seviyeye çıkarmak için uygulamalar üzerinde kapsamlı bir biçimde test edilmiş Studio şoförleri.
110’dan fazla tanınan uygulamada RTX donanımı için uygulama optimizasyonları.
Ayrıca bu uygulamaların daha süratli çalışmasını sağlayan, Optix, DLSS ve Maxine üzere özel özellikler sunan yazılım geliştirme kitleri.
NVIDIA Omniverse, Broadcast, Canvas ve RTX Remix dahil olmak üzere Studio Suite uygulamaları.

RTX 4000 serisiyle birlikte sunulan yenilikler:

Canlı yayınlar yapıyorsanız, daha düzgün canlı akış kalitesi için AV1 takviyeli yeni sekizinci jenerasyon kodlayıcıdan yararlanabilir, ayrıyeten NVIDIA Broadcast yapay zeka efektleriyle mikrofon ses kalitenizi ve web kamera imajlarınızı güzelleştirebilirsiniz.
Video düzenleme işleriyle ilgileniyorsanız, RTX 4000 serisiyle sunulan çift kodlayıcı sayesinde 2 kata kadar daha yüksek yapay zeka performansı ve 2 kata kadar daha yüksek çıktı performansı elde edebilirsiniz.
3D sanatkarlar, 3. kuşak RT çekirdekleri, gölgelendirici yürütme yine düzenlemesi, DLSS 3 ve NVIDIA Omniverse sayesinde 4K60’ta içerik oluşturabilir.
Mod yapımcısıysanız klasik oyunları yine düzenleyebilir, RTX Remix ile RTX’i etkin edebilirsiniz.

AV1 ve Yapay Zeka Dayanaklı Yayıncılık

Canlı yayıncılar ekseriyetle bant genişliğiyle ilgili meseleler (örneğin Twitch yahut Discord’un azamî 8 Mbps bit suratı gibi) yaşar. Bu da yayıncıların sunduğu kaliteyi ve çözünürlüğü olumsuz etkilemekte. AV1 ile canlı yayınlar daha ayrıntılı ve daha kusursuz görünecek, artık daha yüksek çözünürlükte yayın yapabilecek. AV1 ayrıyeten HDR ve düşük gecikme yetenekleriyle gelişmiş kodlama özelliklerini de destekliyor.

H.264 ve AV1 kodlama verimliliği.

NVIDIA, AV1 için bölümdeki önde gelen şirketlerle birlikte çalıştığını söylüyor. Tanınan uygulamalardan olan OBS Studio, 2022 Ekim ayında yayınlanacak bir güncellemeden sonra NVENC ile AV1 dayanağı sunmaya başlayacak. Bunun yanında, oyuncuların her gün kullandığı Discord, 2022 sonlarında AV1 ile uçtan uca canlı yayın özelliği alıyor.

Video Düzenleme

Adobe Premiere Pro ve Blackmagic Design DaVinci Resolve üzere görüntü düzenleme uygulamaları, CUDA çekirdeklerinin yanı sıra yapay zeka dayanaklı Tensor çekirdekleriyle birlikte GPU gücünden yararlanıyor. Renk düzeltme, görüntü kare boyutu dönüştürme, bulanıklaştırma, sertleştirme, manzara sürece efektleri ve RAW belge dönüştürme üzere temel fonksiyonların tümü, gelişmiş GPU teknolojileri sayesinde her zamankinden daha kısa müddette tamamlanıyor.

RTX 4090 Performansı

RTX 4090, AI Magic Mask kullanımında RTX 3090 Ti’ye kıyasla 1.7 kat daha süratli:

RTX 4090, AI Magic Mask kullanımında RTX 3090 Ti’ye kıyasla 1.7 kat daha süratli.

RTX 4000 serisinde bulunan çift kodlayıcı, yeni algoritma ve mimari performans iyileştirmeleri ile birlikte HEVC/AV1 kodlamasında RTX 3000 serisine nazaran 2 kata kadar daha âlâ performans sağlıyor:

RTX 3000 serisine nazaran 2 kata kadar daha süratli kodlama.

ON1 Resize AI 2022, daha yüksek çözünürlüklü çıktılar oluşturmak için GPU hızlandırmalı AI fonksiyonelliğini kullanıyor. Böylece manzara detaylarından ödün vermeden düşük çözünürlüklü manzaralardan yüksek çözünürlüklü imaj çıktıları almamıza imkan veriyor. RTX 4090, ON1 Resize AI 2022’d yapay zeka hızlandırmalı manzara boyutlandırma senaryosunda RTX 3090 Ti’ye kıyasla 1.6 kata kadar daha süratli.

ON1 Resize AI 2022 ile yapay zeka takviyeli imaj kırpma.

Işın izleme takviyeli sürece, animatörlerin sinemalardaki görsel efektler ve oyunlardaki animasyonlu karakterler üzere fotogerçekçi dijital varlıklar tasarlamasına imkan tanıyor. Bu teknoloji yıllardır Hollywood’da standart olarak kullanılıyor lakin yüksek güçlü sunucular ve iş istasyonları gerektiriyor. RTX 4000 serisi ise bu işi son tüketici bazında öteki bir noktaya taşıyor.

Yeni amiral gemisi, ışın izlemeli sürece konusunda en güçlü GPU oldu. Bu kart Blender Cycles, Chaos VRay ve Luxion Keyshot üzere görüntü sürece uygulamalarında evvelki kuşak RTX 3090 Ti’ye kıyasla 1.9 kata kadar daha süratli kare sürece performansı sunuyor. DLSS 3 ve gölgelendirici yürütme tekrar sıralama özelliğiyle birleştirildiğinde ise gerçek vakitli render uygulamalarında 4 kata kadar daha süratli render performansı elde etmek mümkün.

RTX 4090, ışın izlemeyle imaj sürece konusunda RTX 3090 Ti’den 4 kata kadar daha yeterli performans vaat ediyor.

8K Oyunculuğa Hakikat Adım Adım

AD102 GPU, DLSS 3 Frame Generation ile desteklendiğinde ve Ultra Performans moduna oyunlarda 8K HDR oyun tecrübesine hazır. Ayrıyeten RTX 4090’da bulunan çift kodlayıcılar sayesinde GeForce Experience üzerinden 8K görüntü oyun çekimi yapabiliyoruz.

NVIDIA, 8K çözünürlüğe giden yolda DLSS 3 faktörünün çok kıymetli olduğunu vurguluyor. İşte şirket tarafından paylaşılan bir test çizelgesi:

7680×4320 çözünürlük, en yüksek oyun ayarları, DLSS performans modu, oyuna bağlı olarak DLSS Frame Generation özelliği, Core i9-12900K CPU, 32 GB RAM, Windows 11 işletim sistemi.

Tags: Dlss 3 Gpu İş Oyun Performans