enfrdepluk
Szukaj, znajdź 4120  disqus społecznościowy  tg2 f2 lin2 in2 Ikona X 3 y2  p2 Tik steam2

Cechy architektury GeForce 4 Ti 4200

GeForce 4 Ti — ewolucja GeForce 3 Ti

Główne innowacje architektoniczne NV25 (w porównaniu do NV20)

Dwa niezależne kontrolery wyświetlania (CRTC). Elastyczna obsługa różnych trybów z wyjściem dwóch buforów ramek niezależnych pod względem rozdzielczości i zawartości do dowolnych dostępnych odbiorników sygnału.
Dwa pełnoprawne RAMDAC 350 MHz zintegrowane z chipem (z 10-bitową paletą).
Zintegrowany z chipem interfejs TV-Out.
Nadajnik TDMS zintegrowany z chipem (dla interfejsu DVI).
Dwa bloki do interpretacji i wykonywania Vertex Shaderów. Obiecują znaczny wzrost szybkości przetwarzania scen o złożonej geometrii. Bloki nie mogą używać różnych shaderów mikrokodu, jedynym celem takiego powielania - przetwarzania dwóch wierzchołków jednocześnie - jest zwiększenie wydajności.
Ulepszone potoki renderowania zapewniają obsługę sprzętową dla shaderów pikseli do wersji 1.3 włącznie.
Według nVIDII efektywna szybkość wypełniania w trybach MSAA została zwiększona, teraz tryby 2x AA i Quincunx AA spowodują znacznie mniejszy spadek wydajności. Nieznacznie ulepszony Quincunx AA (przesunięte pozycje próbkowania). Pojawiła się nowa metoda AA - 4xS.
Ulepszony system oddzielnej pamięci podręcznej (4 oddzielne pamięci podręczne dla geometrii, tekstur, bufora ramki i bufora Z).
Zaawansowana kompresja bezstratna (1:4) i szybkie czyszczenie bufora Z.
Ulepszony algorytm odrzucania ukrytych powierzchni (Z Cull HSR).

Podsumowując tę ​​listę, chciałbym zwrócić uwagę na ewolucyjny, a nie rewolucyjny charakter zmian w porównaniu z poprzednim stworzeniem NVIDII (NV20). Nie jest to jednak zaskakujące – historycznie NVIDIA najpierw oferowała produkt, który niósł wiele nowych technologii, a następnie wypuściła na jego podstawie bardziej zaawansowaną (zoptymalizowaną) wersję, eliminującą niedociągnięcia, które przyciągały główną uwagę (podczas obecności produktu na sklep).

Schemat strukturalny N25

nv251

Według testów przeprowadzonych po premierze kart graficznych GeForce4 Ti okazał się zauważalnie szybszy od GeForce3 Ti. Tak imponującą lukę w wydajności NV25 osiągnięto nie dzięki jakiejś fundamentalnie nowej technologii, ale dzięki dalszemu debugowaniu i ulepszaniu technologii istniejących w GeForce3 (NV20). Pamiętaj, że rdzeń GeForce4 był tylko o 5% większy niż rdzeń NV20 przy tym samym procesie produkcyjnym (0,15 µm).

chip_block1

Moduły cieniowania wierzchołków nfiniteFX II

Jeśli GeForce3 miał tylko jeden moduł Vertex Shader, to GeForce4 Ti ma dwa z nich. Jednak raczej nie zaskoczy Cię to, ponieważ układ nVidia dla Microsoft Xbox ma również dwa moduły Vertex Shader. Chyba że moduły zostały ulepszone w NV25.

Oczywiście dwa równoległe moduły Vertex Shader mogą przetwarzać więcej wierzchołków w jednostce czasu. Aby to zrobić, chip sam rozłożył wierzchołki na dwa strumienie, dzięki czemu nowy mechanizm jest przezroczysty dla aplikacji i interfejsów API. Planowanie instrukcji jest obsługiwane przez NV25, a chip musi upewnić się, że każdy moduł Vertex Shader działa na własnym wierzchołku. Ulepszenia w modułach Vertex Shader od czasu GeForce3 spowodowały zmniejszenie opóźnień w przetwarzaniu instrukcji.

W rezultacie GeForce4 Ti4600 mógł przetwarzać około 3 razy więcej wierzchołków niż GeForce3 Ti500 ze względu na obecność dwóch modułów Vertex Shader, ich udoskonalenie i działanie z wyższą częstotliwością zegara.

Pixel Shadery nfiniteFX II

Nvidia była w stanie ulepszyć funkcjonalność shaderów pikseli w GeForce4 Ti.
Nowy układ obsługuje Pixel Shaders 1.2 i 1.3, ale nie rozszerzenie ATi 1.4.

Poniżej znajdują się nowe tryby shadera pikseli.
OFFSET_PROJECTIVE_TEXTURE_2D_NV
OFFSET_PROJECTIVE_TEXTURE_2D_SCALE_NV
OFFSET_PROJECTIVE_TEXTURE_RECTANGLE_NV
OFFSET_PROJECTIVE_TEXTURE_RECTANGLE_SCALE_NV
OFFSET_HILO_TEXTURE_2D_NV
OFFSET_HILO_TEXTURE_RECTANGLE_NV
OFFSET_HILO_PROJECTIVE_TEXTURE_2D_NV
OFFSET_HILO_PROJECTIVE_TEXTURE_RECTANGLE_NV
DEPENDENT_HILO_TEXTURE_2D_NV
DEPENDENT_RGB_TEXTURE_3D_NV
DEPENDENT_RGB_TEXTURE_CUBE_MAP_NV
DOT_PRODUCT_TEXTURE_1D_NV
DOT_PRODUCT_PASS_THROUGH_NV
DOT_PRODUCT_AFFINE_DEPTH_REPLACE_NV

Nie będziemy opisywać każdego nowego trybu, ale należy zauważyć, że GeForce4 Ti wprowadził obsługę mapowania wypukłości z korekcją Z, co umożliwiło wyeliminowanie artefaktów, które pojawiały się, gdy tekstura wypukłości wchodziła w kontakt z inną geometrią (na przykład, gdy woda w jeziorze lub rzece dotyka ziemi).

Nvidii udało się ostatecznie ulepszyć potok shadera pikseli, co znacząco wpłynęło na szybkość renderowania scen z 3-4 teksturami na piksel.

29_s1

Accuview - ulepszony antyaliasing Podczas premiery GeForce3, nVidia ogłosiła HRAA, antyaliasing wysokiej rozdzielczości oparty na wielopróbkowym pełnoekranowym antyaliasingu. GeForce4 wprowadził antyaliasing Accuview, który jest zasadniczo ulepszeniem wielopróbkowego antyaliasingu, zarówno pod względem jakości, jak i wydajności.
 Nvidia przesunęła przykładowe pozycje, co powinno poprawić jakość antyaliasingu ze względu na nagromadzenie mniejszej liczby błędów, zwłaszcza przy korzystaniu z antyaliasingu Quincunx. Nvidia opublikowała dokumentację dotyczącą tej procedury, ale czytanie jej nie miało sensu, ponieważ nie wyjaśniała zbyt wiele. Nowa technologia filtrowania była włączana za każdym razem, gdy próbki były łączone w końcowej ramce z wygładzaniem krawędzi, a technologia ta pozwalała na zapisanie jednego pełnego zapisu w buforze ramki, co z kolei znacząco wpłynęło na wydajność wygładzania.

nv25lma21

LMA II - nowa architektura pamięci ANDTo dzięki ulepszeniom w architekturze pamięci GeForce4 Ti wykazał tak silną przewagę nad GeForce3.

W GeForce3/GeForce4 kontroler pamięci został podzielony na cztery niezależne kontrolery, z których każdy korzysta z dedykowanej 32-bitowej magistrali DDR. Wszystkie żądania pamięci były współdzielone między tymi kontrolerami.

W LMA II poprawiono prawie każdy komponent. Możesz zwrócić uwagę na cztery skrzynki. Ale buforowanie jest wyłącznie dla GeForce, ponieważ Radeon 8500 również miał podobne pamięci podręczne. Ogólnie rzecz biorąc, buforowanie w układach graficznych było znacznie mniej uwagi niż pamięci podręczne w procesorach, ponieważ ich rozmiar nie był tak duży. Powód tego jest jasny: układy graficzne były wtedy wolniejsze niż magistrale pamięci, podczas gdy procesory centralne były 2-16 razy szybsze, więc pamięć podręczna odgrywała tam znacznie ważniejszą rolę.

Kontroler pamięci krzyżowej (kontroler pamięci poprzecznej)
GeForce3 już posiadał ten kontroler, pozwalający na transmisję 64-bitową, 128-bitową i normalną 256-bitową, co znacznie poprawiło przepustowość. W LMA II nVidia poprawiła algorytmy równoważenia obciążenia dla różnych sekcji pamięci i zmodernizowała schemat priorytetów.

Podsystem wizualny (podsystem widoczności) - odrzucanie nakładających się pikseli
Ta technologia istniała już w GeForce3, ale została ulepszona w NV25 w celu dokładniejszego usuwania pikseli przy użyciu mniejszej przepustowości pamięci. Odrzucenie zostało następnie przeprowadzone za pomocą specjalnej pamięci podręcznej na chipie, co umożliwiło ograniczenie dostępu do pamięci zewnętrznej karty graficznej. Według badań Anandtech, GeForce4 był o 25% lepszy w odrzucaniu pikseli niż GeForce3 przy tej samej szybkości zegara.

Bezstratna kompresja bufora Z
Ponownie, ta funkcja istniała w GeForce3, ale dzięki nowemu algorytmowi kompresji LMA II miała większe szanse na osiągnięcie udanej kompresji 4:1.

Pamięć podręczna wierzchołków
Przechowuje wierzchołki po ich wysłaniu przez AGP. Pamięć podręczna poprawiła wykorzystanie AGP, ponieważ pozwoliła nam uniknąć przekazywania identycznych wierzchołków (na przykład, jeśli prymitywy miały wspólne granice).

Prymitywna pamięć podręczna
Skumulowane prymitywy po ich przetworzeniu (po Vertex Shader) na prymitywy podstawowe w celu przesłania do modułu ustawień trójkątów.

Podwójna pamięć podręczna tekstur
Już istniał na GeForce3. Nowe algorytmy działały lepiej podczas korzystania z multiteksturowania lub filtrowania wysokiej jakości. Dzięki temu GeForce4 Ti znacznie poprawił wydajność przy nakładaniu 3-4 tekstur.

Pamięć podręczna pikseli
Pamięć podręczna była używana na końcu potoku renderowania do akumulacji, bardzo podobnie do funkcji w procesorach Intel/AMD. Pamięć podręczna gromadziła określoną liczbę pikseli, a następnie w trybie wsadowym zapisywała je w pamięci.

Automatyczne ładowanie wstępne (wstępne ładowanie)
Przed odczytem z banku pamięci należy go wstępnie naładować, co prowadzi do opóźnień. GeForce4 Ti może proaktywnie ładować za pomocą specjalnego algorytmu przewidywania.

Szybki Z-clear (Z-clear)
Ta funkcja jest już od jakiegoś czasu znana i wykorzystywana w innych układach. Szybkie czyszczenie Z zostało po raz pierwszy zastosowane w układzie ATi Radeon. Po prostu ustawia flagę dla określonej sekcji bufora ramki, tak że zamiast wypełniać tę sekcję zerami, można po prostu ustawić flagę, która oszczędza przepustowość pamięci.

nfxii8_small1

Dane techniczne NVIDIA GeForce 4 Ti 4200

Nazwa GeForce4Ti 4200
Rdzeń NV25
Technologia procesu (µm) 0,15
Tranzystory (mln) 63
Częstotliwość rdzenia 250
Częstotliwość pamięci (DDR) 222 (444)
Typ magistrali i pamięci DDR-128bit
Przepustowość (Gb/s) 7,1
Potoki pikseli 4
TMU na przenośnik 2
tekstury na zegar 8
tekstury na przejazd 4
Przenośniki wierzchołkowe 2
Shadery pikseli 1,3
Shadery wierzchołków 1,1
Szybkość wypełniania (Mpix/s) 1000
Szybkość wypełniania (Mtex/s) 2000
DirectX 8.0
Antyaliasing (maks.) SM - 4x
Filtrowanie anizotropowe (maks.) 8x
Pojemność pamięci 64 / 128 MB
Interfejs AGP 4x
RAMDAC 2x350MHz

GeForce4 Ti 4200 jest lżejszą wersją GeForce4 Ti 4600 lub 4400, która miała niższą częstotliwość taktowania, ale była znacznie tańsza. 
Pod wieloma względami GeForce4 Ti 4200 może być uważany za potencjalnego „grabarza” linii GeForce3 Ti 500. nie na korzyść tego drugiego. Dlatego nVIDIA opóźniła premierę Ti 4200 na późniejszą datę, do czasu, gdy nastąpił znaczny spadek sprzedaży w linii GeForce4.

Mafia

mafia_colh_car_pursuit1

Najważniejsze wiadomości GameGPU