GeForce FX 5900 Ultra cechy architektoniczne

Główne różnice w stosunku do GeForce FX 5800 Ultra
Układ 135 milionów tranzystorów: liczba tranzystorów w chipie nie wzrosła znacząco - pośrednio wskazywało to, że zmiany w chipie, opartym na architekturze NV30, były raczej kosmetyczne.
256-bitowy interfejs pamięci lokalnej: Być może najbardziej oczekiwana innowacja w NV35. Od czasu premiery NV30 entuzjaści grafiki 35D na PC przewidywali wydajność NV256, nawet nie wyobrażając sobie tego chipa bez XNUMX-bitowego interfejsu pamięci lokalnej.
4 zaawansowane, potokowe procesory pikselowe: Tutaj zamiast również oczekiwanego wzrostu liczby procesorów pikselowych do 8, NVIDIA pozostawiła te same 4 procesory. Każdy z procesorów pikselowych został wyposażony w: dwie jednostki filtrujące tekstury, dwie mieszane jednostki ALU na liczbach całkowitych i zmiennoprzecinkowych oraz jedną jednostkę ALU tylko operacyjną. zmiennoprzecinkowy. Oznacza to, że tylko trzy operacje zmiennoprzecinkowe. Taka konfiguracja umożliwiła wykonanie do 12 operacji na pikselach w jednym cyklu zegara. Jednak z pewnych powodów ta moc działała tylko w OpenGL; w D3D nadal tam była - tylko jedna operacja zmiennoprzecinkowa. Oczywiście zadeklarowano, że nowy chip będzie dwukrotnie mocniejszy od NV9 pod względem mocy procesorów pikselowych przy wykonywaniu shaderów pikseli DirectX2.0 PS 128 ze 30-bitową precyzją obliczeniową.
Technologia Intellisample HCT: Technika oszczędzania przepustowości pamięci lokalnej: bezstratna kompresja bufora ramki, w tym zarówno informacji o kolorze, jak i bufora głębi (bufor Z). Możliwy stopień kompresji wynosi do 4:1. W porównaniu do NV30 ulepszono technologię Intellisample - tak jak poprzednio, chip określał na podstawie kilku czynników, czy wystąpi efekt kompresji przesyłanych bloków danych, ale teraz, w wyniku optymalizacji, zwiększono prawdopodobieństwo kompresji danych. Również pod ogólną nazwą Intellisample HCT uwzględniono następujące techniki zwiększające efektywność pracy z pamięcią lokalną: lokalny kontroler pamięci z przełącznikiem, bufory tekstur, wczesne obcinanie niewidocznych pikseli (z-culling), szybkie czyszczenie głębi bufor (szybkie czyszczenie Z). Wszystkie te optymalizacje umożliwiły znaczne zmniejszenie spadku wydajności po włączeniu FSAA.
Технология UltraShadow: Ta technologia umożliwiła zwiększenie szybkości renderowania cieni przy użyciu techniki cieni buforowych szablonu, dokładnie tej samej techniki, która została zastosowana w Doom III. W ramach technologii UltraShadow zadeklarował zdolność chipów NV30/NV35 do podwojenia szybkości wypełniania, dostarczając do 8 pikseli na cykl zegara, jeśli pomalowany jest tylko bufor głębi i/lub bufor szablonu, w porównaniu do 4 pikseli przy normalnym renderowaniu. Drugą, najciekawszą częścią była możliwość ustawienia zakresu głębi w kadrze, w którym obiekt może rzucać cień. Aby to zademonstrować, spójrzmy na rysunek:
Jeśli podczas rysowania cieni wartość głębi pikseli przechowywana w buforze głębi nie mieściła się w określonym zakresie, oznacza to, że bufor szablonu dla piksela nie był aktualizowany. W ten sposób możliwe stało się zaoszczędzenie dość dużego procentu współczynnika wypełnienia. Najwyraźniej, aby zaimplementować tę funkcję w chipie, poprawiono blok odpowiedzialny za wcześniejsze odrzucanie niewidocznych powierzchni (early z-cull), który teraz sprawdza wartość zapisaną w buforze głębokości nie tylko z wartością bieżącą interpolowaną na podstawie współrzędnych trójkąta , ale i z dwoma dodatkowymi znaczeniami. W rezultacie zysk w porównaniu do innych chipów z tą samą liczbą rurociągów był w najgorszym przypadku dwukrotny (8 wartości bufora głębi w porównaniu do 4 wartości kolorów) i czterokrotny (biorąc pod uwagę, że wczesny z-cull mógł odrzucić aż do 16 pikseli na cykl zegara), nawet bez uwzględnienia zmniejszenia ilości danych zapisywanych z powrotem do pamięci lokalnej.
Specyfikacja NVIDIA GeForce FX 5900 Ultra
Nazwa | GeForce FX 5900 Ultra |
Rdzeń | NV35 |
Technologia procesu (µm) | 0,13 |
Tranzystory (mln) | 135 |
Częstotliwość rdzenia | 450 |
Częstotliwość pamięci (DDR) | 425 (850) |
Typ magistrali i pamięci | DDR-256bit |
Przepustowość (Gb/s) | 27,2 |
Potoki pikseli | 8 (4) |
TMU na przenośnik | 1 (2) |
tekstury na zegar | 8 |
tekstury na przejazd | 16 |
Przenośniki wierzchołkowe | 3 |
Shadery pikseli | 2+ |
Shadery wierzchołków | 2+ |
Szybkość wypełniania (Mpix/s) | 3600 |
Szybkość wypełniania (Mtex/s) | 3600 |
DirectX | 9+ |
Antyaliasing (maks.) | SS&MS - 8x |
Filtrowanie anizotropowe (maks.) | 8x |
Pojemność pamięci | 256 MB |
Interfejs | AGP 8x |
RAMDAC | 2x400MHz |
NV35 nie uzupełniał istniejącej linii firmy NVIDIA, ale zastąpił nieudaną serię NV30. Dokładnie tak nawet prezes NVIDII nazwał NV30. Dlatego nawet nazwa kodowa nie odpowiada temu, co widzimy, ponieważ wcześniej NV*5 jest planowanym ulepszeniem poprzedniej generacji, które niesie nie tylko poprawki błędów, ale także przyzwoite wzrosty prędkości, a także ulepszenia architektoniczne.
Knights of the Old Republic