ASUS, geçtiğimiz Aralık ayında katıldığı MLCommons Association bünyesinde birinci sonuçlarını yayınladı. Şirket, çok sayıda testte yeni performans rekorlarına imza attı.
Bilhassa en son MLPerf Inference 2.0 testlerinde ASUS, kapalı data merkezi kategorisindeki altı farklı yapay zeka çıkarım vazifesinde tıpkı GPU yapılandırmasına sahip öbür tüm sunucuları geride bırakarak 26 adet rekor kırdı. Bu rekorların 12’si, sekiz adet 80 GB NVIDIA® A100 Tensor Core GPU içeren ASUS ESC8000A-E11 sunucuyla; 14’ü ise dört adet 24 GB NVIDIA A30 Tensor Core GPU içeren ASUS ESC4000A-E11 sunucuyla kırıldı.
Bu çığır açan sonuçlar ASUS sunucularının yapay zeka alanındaki performans liderliğini gözler önüne serdi. ASUS sunucuları, yapay zekadan yararlanmak isteyen kurumlara büyük katkı sağlıyor ve data merkezlerine en uygun performansı sunuyor.
MLPerf Inference 2.0 testi, en sık kullanılan altı yapay zeka çıkarımı iş yükünü kapsıyor. Bunlar ortasında manzara sınıflandırma (ResNet50), obje tespiti (SSD-ResNet34), tıbbi imaj bölümlendirme (3D-Unet), konuşma tanımlama (RNN-T), doğal lisan sürece (BERT) ve tavsiye (DLRM) iş yükleri bulunuyor.
ESC8000A-E11 aşağıdakiler de dahil olmak üzere birçok alanda performans liderliğini elde etti:
- ResNet50’de bir saniye içinde 298.105 görüntüyü sınıflandırdı
- SSD-ResNet34’te bir saniye içinde 7.462,06 manzarada obje tanımladı
- 3D-UNet’te bir saniye içinde 24,3 tıbbi manzarayı işledi
- BERT’te bir saniye içinde 26.005,7 soruyu ve yanıtı tamamladı
- DLRM’de bir saniye içinde 2.363.760 tahmin yaptı
ESC8000A-E11 sonuçları
Kısım | Misyon | Model | Sonuçlar | Hassaslık | Senaryo | Üniteler |
Kapalı Data Merkezi | İmaj sınıflandırma |
ResNet50 | 210011 | 99,00 | Sunucu | sorgu/s |
298105 | Çevrimdışı | örnek/s | ||||
Obje tespiti (geniş) |
SSD-ResNet34 | 7096,10 | 99,00 | Sunucu | sorgu/s | |
7462,06 | Çevrimdışı | örnek/s | ||||
Tıbbi görüntüleme | 3D-UNet | 24,3 | 99,00 | Çevrimdışı | örnek/s | |
24,3 | 99,90 | Çevrimdışı | örnek/s | |||
Konuşmadan metne | RNN-T | 94.996,9 | 99,00 | Sunucu | sorgu/s | |
102.738 | Çevrimdışı | örnek/s | ||||
Doğal lisan sürece | BERT | 23.489,5 | 99,00 | Sunucu | sorgu/s | |
26.005,7 | Çevrimdışı | örnek/s | ||||
11.491,3 | 99,90 | Sunucu | sorgu/s | |||
13.168,2 | Çevrimdışı | örnek/s | ||||
Tavsiye | DLRM | 1.601.300 | 99,00 | Sunucu | sorgu/s | |
2.363.760 | Çevrimdışı | örnek/s | ||||
1.601.300 | 99,90 | Sunucu | sorgu/s | |||
2.363.760 | Çevrimdışı | örnek/s |
ESC4000A-E11 aşağıdakiler de dahil olmak üzere birçok alanda performans liderliğini elde etti:
- ResNet50’de bir saniye içinde 73.814,5 görüntüyü sınıflandırdı
- SSD-ResNet34’te bir saniye içinde 1.957,18 imajda obje tanımladı
- 3D-UNet’te bir saniye içinde 6,83 tıbbi imgeyi işledi
- RNNT’te bir saniye içinde 27.299,2 adet konuşma tespit edip dönüştürdü
- BERT’te bir saniye içinde 6.896,01 soruyu ve yanıtı tamamladı
- DLRM’de bir saniye içinde 574.371 tahmin yaptı
ESC4000A-E11 sonuçları
Kısım | Misyon | Model | Sonuçlar | Hassaslık | Senaryo | Üniteler |
Kapalı Data Merkezi | İmaj sınıflandırma |
ResNet50 | 68.192 | 99,00 | Sunucu | sorgu/s |
73.814,5 | Çevrimdışı | örnek/s | ||||
Obje tespiti (geniş) |
SSD-ResNet34 | 1.886,75 | 99,00 | Sunucu | sorgu/s | |
1.957,18 | Çevrimdışı | örnek/s | ||||
Tıbbi görüntüleme | 3D-UNet | 6,83 | 99,00 | Çevrimdışı | örnek/s | |
6,83 | 99,90 | Çevrimdışı | örnek/s | |||
Konuşmadan metne | RNN-T | 17.391,4 | 99,00 | Sunucu | sorgu/s | |
27.299,2 | Çevrimdışı | örnek/s | ||||
Doğal lisan sürece | BERT | 6.367,97 | 99,00 | Sunucu | sorgu/s | |
6.896,01 | Çevrimdışı | örnek/s | ||||
2.917,66 | 99,90 | Sunucu | sorgu/s | |||
3.383,03 | Çevrimdışı | örnek/s | ||||
Tavsiye | DLRM | 560.158 | 99,00 | Sunucu | sorgu/s | |
574.371 | Çevrimdışı | örnek/s | ||||
560.158 | 99,90 | Sunucu | sorgu/s | |||
574.371 | Çevrimdışı | örnek/s |
NVIDIA sertifikalı 4U ESC8000A-E11 model (sekiz adet 80 GB NVIDIA A100 PCIe Tensor Core GPU ve iki adet AMD EPYC 7763 CPU ile yapılandırılan) sunucuyla elde edilen 12 rekor, bu modelin yapay zeka ve makine tahsili için sunduğu üstün ölçeklendirilebilme kapasitesini ortaya koydu. CPU ve GPU için bağımsız hava tünellerine sahip gelişmiş termal tasarım, hava soğutmalı data merkezlerine son derece verimli bir soğutma tahlili sunuyor.
Pazardaki en kompakt yapılı 2U model olan NVIDIA sertifikalı ESC4000A-E11 (dört adet 24 GB NVIDIA A30 PCIe Tensor Core GPU veiki adet AMD EPYC 7763 CPU ile yapılandırılan) ise MPLerf Inference 2.0’da 14 adet rekora imza attı. Birçok farklı grafik hızlandırıcıyı kullanma imkanı sağlayan ve NVIDIA NVLink yüksek süratli dahili GPU kontağına takviye veren bu model, azamî yapay zeka performansı sunuyor.