enfrdepluk
Szukaj, znajdź 4120  disqus społecznościowy  tg2 f2 lin2 in2 Ikona X 3 y2  p2 Tik steam2

GeForce GT 9600

21 lutego 208 roku kanadyjska firma oficjalnie wprowadziła na rynek kartę graficzną 9600 GT. Został zaprojektowany, aby umieścić 8600 GTS w segmencie średniej klasy w kategorii cenowej do 0. Nowy rdzeń G94 różni się od swojego starszego „brata” G92 jedynie ilościowymi lub znaczącymi zmianami. Pod względem cech ilościowych 9600 GT ma na stanie 64 uniwersalne procesory - to dwa razy więcej niż „stary” 8600 GTS i dwa razy mniej niż GeForce 8800 GTS (G92) lub GeForce 8800 GTX. Tym razem miejmy nadzieję, że nie będzie tak dużej różnicy w wydajności w porównaniu ze starszymi rozwiązaniami, jak to było między 8800 a 8600.
Tak więc nowy rdzeń G94 składa się z 505 milionów tranzystorów (dla porównania: G86 miał 210 milionów, G92 miał 754 miliony, a G80 miał 681 milionów). Działa z nominalną częstotliwością 650 MHz dla karty NVIDIA GeForce 9600 GTS. Procesor graficzny wykorzystuje ujednoliconą architekturę shaderów, która doskonale sprawdziła się w chipach G80/84/92. Pomysł ujednolicenia bloków funkcjonalnych GPU przedstawia się następująco: poprzednio dzieliły się one na jednostki wierzchołkowe i cieniujące, obecnie jednostki uniwersalne są w stanie przetwarzać dowolny typ instrukcji bez znaczących strat w wydajności. Umożliwi to dynamiczną zmianę wydajności jądra poprzez redystrybucję zasobów pod aktualnie potrzebne zadanie. W rezultacie otrzymujemy pełne obciążenie chipa, a co za tym idzie, wydajność wzrasta.
1992621 

W przypadku G94 widzimy elementarną redukcję – 4 jednostki cieniujące, z których każda zawiera 16 procesorów strumieniowych (Streaming Processor) i 8 jednostek teksturujących (TMU). Otrzymuje się łącznie 64 procesory strumieniowe i 32 jednostki teksturujące. Wszystkie procesory G94, podobnie jak w poprzednich układach, pracują ze stosunkowo dużą wydajnością GPU częstotliwości zegara. W szczególności dla 9600 GT jest to 1650 MHz. Na koniec zwróćmy uwagę na bloki zapisu bufora ramki (ROP), których w tym przypadku jest 4 (niebieskie bloki obok pamięci podręcznej L2 na schemacie). NVIDIA nie wprowadziła żadnych zmian w działaniu i koncepcji budowy procesorów strumieniowych (SP) od czasu chipów G84.

Na każde cztery procesory strumieniowe przypadają dwa adresery tekstur TA i dwa moduły filtrów tekstur TF. Dlatego teraz każda jednostka tekstury, dzięki zwiększeniu liczby obliczonych adresów tekstur, będzie w stanie przetworzyć dwa razy więcej próbek niż np. w G80. Każda jednostka cieniująca ma własną pamięć podręczną L1. Może przechowywać nie tylko tekstury, ale także, dzięki ujednoliceniu samych bloków, różnego rodzaju dane. Wszystkie procesory strumieniowe (SP), na których oparta jest architektura G94, są skalarne. Dlaczego nie wektor? Powodem tego jest fakt, że na podstawie badań nad programami cieniującymi, twórcy NVIDIA odkryli, że architektura wektorowa wykorzystuje zasoby obliczeniowe dość nieekonomicznie, gdy złożone instrukcje są przetwarzane jednocześnie, na przykład instrukcje skalarne i wektorowe (ogólnie mówiąc, obliczenia skalarne na procesorach wektorowych są wykonywane bardzo nieefektywnie ). W świetle niedawnego trendu w kierunku coraz większego przejścia od obliczeń wektorowych do skalarnych, strategia programistów NVIDIA staje się być może jasna. Cóż, co zrobić z kodem programu wektorowego? Wszystko jest bardzo proste: są one konwertowane na operacje skalarne bezpośrednio przez sam układ G94. Jak już wspomniano, GeForce 9600 ma 4 jednostki zapisu bufora ramki (ROP). Nie przeszły żadnych zmian dotyczących architektury G92 i obsługują następujące metody wygładzania krawędzi: multisampling, supersampling i adaptacyjny antyaliasing.

Specyfikacja NVIDIA GeForce 9600 GT

Nazwa GeForce GT 9600
Rdzeń G94 (D9P)
Technologia procesu (µm) 0.065
Tranzystory (mln) 505
Częstotliwość rdzenia 650
Częstotliwość pamięci (DDR) 900
Typ magistrali i pamięci GDDR3 256-bitowy
Przepustowość (Gb/s) 57.60
Zunifikowane bloki shaderów 64
Częstotliwość zunifikowanych jednostek cieniujących 1625
TMU na przenośnik 32
RPO 16
Model cieniowania 4.0
Szybkość wypełniania (Mpix/s) 10400
Szybkość wypełniania (Mtex/s) 20800
DirectX 10.0
Pojemność pamięci 512/1024
Interfejs PCI-E 2.0