Nvidia GB300 NVL72 wykazuje rekordowy wzrost wydajności – +45% w porównaniu z DeepSeek R1 w porównaniu z GB200
Nvidia oficjalnie publikuje wyniki testów porównawczych MLPerf dla swojego nowego systemu rack-scale Blackwell Ultra GB300 NVL72, stwierdzając 45% wzrost produktywności w wnioskowaniu DeepSeek R1 w porównaniu z poprzednią generacją GB200System łączy w sobie zaktualizowaną architekturę, przyspieszone jednostki tensorowe i szereg optymalizacji na poziomie oprogramowania, co pozwoliło firmie Nvidia pierwsze miejsce we wszystkich kluczowych testach, w tym Llama 3.1 405B, Llama 3.1 8B i Whisper.
W tle Wdrożenia GB200 w globalnych centrach danych, nowa wersja GB300 z architekturą Blackwell Ultra idzie dalej, oferując znacznie zwiększoną przepustowość między GPU - 130 TB/s przez Łącze NV 1,8 TB/s między każdym z 72 systemów graficznych w szafie. Umożliwiło to efektywne skalowanie nawet największych modeli językowych przy jednoczesnym zachowaniu stabilnych opóźnień przy dużej liczbie przetwarzanych danych.
Kluczowymi elementami wzrostu były: zaktualizowane rdzenie tensorowe, zapewniając 2x szybsze operacje uwagi i 50% więcej FLOPS-ów dla zadań AIoraz aktywnego korzystania z formatu NVFP4 do kwantyzacji wag. Umożliwiło to zmniejsz głośność modelu bez utraty dokładności i przyspieszenia obliczeń, zwłaszcza w zadaniach wnioskowania na DeepSeek R1.
Według firmy Nvidia te ulepszenia mogą sprawić, Blackwell Ultra głównym narzędziem w budowie tzw. „Fabryki AI”, gdzie optymalizacja zużycia energii bezpośrednio wpływa na rentowność przetwarzania. Według ich oświadczeń, GB300 może działać 5 razy szybciej niż akceleratory Hopper, co jest szczególnie istotne na tle konkurencyjnych rozwiązań firm AMD i Huawei, które również wykazują wzrost w segmencie akceleratorów AI.
Biorąc pod uwagę fakt, że Dostawy GB300 rozpoczną się w tym miesiącuPublikacja rekordowych wyników MLPerf wydaje się być częścią strategicznej kampanii firmy Nvidia, mającej na celu wzmocnienie jej pozycji lidera w dziedzinie rozwiązań AI dla przedsiębiorstw.




