enfrdepluk
Szukaj, znajdź 4120  disqus społecznościowy  tg2 f2 lin2 in2 Ikona X 3 y2  p2 Tik steam2

GeForce GTX 960

960

Wraz z kartą graficzną GeForce GTX 960, NVIDIA wprowadziła zalety architektury „Maxwell” na główny rynek. Karty graficzne otrzymały takie zalety architektoniczne, jak kompresja pamięci, DSR, MFAA, VXGI i DirectX 12. Dla firmy NVIDIA jej własne interfejsy API GameWorks i PhysX stają się coraz ważniejsze, nie ma jeszcze o tym żadnych wiadomości, ale nabywcy GeForce GTX 960 będą korzystają również z ich wsparcia.

Wykorzystuje kartę graficzną GeForce GTX 960 GPU GM206 prawdopodobnie nie jest w pełnej wersji - oznaczonej jako GM206-300-A1. Kryształ wyposażony jest w 2,94 miliarda tranzystorów, jest znacznie mniej skomplikowany niż „Tahiti” czy „Tonga” AMD. Ponieważ nie przedstawiono referencyjnej karty graficznej GeForce GTX 960, informacje o częstotliwości bazowej i wzmocnieniu w powyższej tabeli nie mają praktycznego znaczenia. NVIDIA określa częstotliwość bazową 1.126 MHz i częstotliwość GPU Zwiększenie – 1.178 MHz. NVIDIA ustawiła 2.048 MB pamięci GDDR5 na 1.750 MHz, pamięć podłączona jest poprzez 128-bitowy interfejs. Rezultatem jest przepustowość pamięci na poziomie 112,2 GB/s – niewiele w porównaniu do konkurencji. Ale nie zapominaj, że NVIDIA wykorzystuje technologię kompresji pamięci, która teoretycznie zwiększa efektywną przepustowość pamięci, ale obiecane przez NVIDIA 148,8 GB/s wciąż rzadko jest osiągane.

wykres 1

GPU GM206 opiera się na 1.024 procesorach strumieniowych, które są zorganizowane w osiem bloków SMM (multiprocesorów strumieniowych), każdy z 4x 32 procesorami strumieniowymi. Cztery SMM tworzą klaster GPC, otrzymujemy po dwa takie klastry GPU. 8 (SMM) x 4 (jednostki SMM) x 32 procesorów strumieniowych równa się 1.024 procesorom strumieniowym.

Każdy SMM wykorzystuje osiem jednostek tekstur. W związku z tym osiem SMM w GeForce GTX 960 daje 64 jednostki tekstur. Dwa 64-bitowe kontrolery pamięci są połączone z 32 potokami operacji rastrowych (ROP).

smm

NVIDIA była w stanie osiągnąć wyższą wydajność Maxwella dzięki kilku rozwiązaniom. Pamięć podręczna L2 w architekturze „Maxwell” została zwiększona do 2.048 KB w porównaniu do 256 KB w architekturze „Kepler”. Przepustowość pamięci podręcznej pozostała na poziomie 512 bajtów na zegar. W porównaniu z architekturą Maxwell pierwszej generacji, całkowita pamięć dla każdego SMM została nieznacznie zwiększona. Teraz to już 96 kb, a nie 64 kb. Możemy również zwrócić uwagę na nową wersję silnika Polymorph 3.0.

Silnik PolyMorph 3.0 jest odpowiedzialny za zapytania o tekstury, teselację, ustawienie atrybutów, transformację pola widzenia i wyjście strumieniowe. Wyniki obliczeń klastra SMM i silnika PolyMorph 3.0 są następnie przekazywane do silnika rasteryzacji. W drugim etapie tesselator rozpoczyna obliczanie położenia powierzchni, w zależności od odległości wybierany jest wymagany poziom szczegółowości. Skorygowane wartości są wysyłane do klastra SMM, gdzie współpracują z nimi shadery domeny i geometrii. Shader domeny oblicza ostateczną pozycję każdego trójkąta na podstawie shaderów Hull i tesselatorów. Na tym etapie mapy przemieszczeń nakładają się na siebie. Geometry Shader porównuje następnie obliczone dane z faktycznie widocznymi obiektami i wysyła wyniki z powrotem do silnika teselacji w celu wykonania ostatecznych obliczeń. W ostatnim etapie silnik PolyMorph 3.0 dokonuje transformacji pola widzenia i korekcji perspektywy. Na koniec obliczone dane są wyprowadzane przez wyjście strumienia, pamięć jest zwalniana do dalszych obliczeń.

Przejdźmy do poszczególnych bloków multiprocesora SMM. Każdy blok 32 procesorów strumieniowych jest wyposażony w bufor instrukcji i harmonogram warp. Obaj dyspozytorzy pracują z 16.384 32-bitowymi rejestrami każdy. Patrząc na architekturę "Kepler", było 192 procesorów strumieniowych z czterema programatorami warp i ośmioma jednostkami dyspozytorskimi, co daje w sumie 65.536 32 512-bitowych rejestrów. Teoretycznie na każdy procesor strumieniowy w architekturze Maxwell przypada 341 rejestrów, w Keplerze ich liczba wynosiła około 35. Miara ta przyczyniła się również do wzrostu wydajności procesorów strumieniowych do XNUMX%.

Specyfikacja GeForce GTX 960

 Data wydania  22 stycznia roku 2015
 Cena wywoławcza, $  199

Chip

 Model GPU 28 nm GM206-300
 Rdzenie: TMU: ROP 1024: 64: 32

Częstotliwości

 częstotliwość GPU(wzmocnienie), MHz 1127 (1178)
 Częstotliwość pamięci (efektywna), MHz 1753 (7012)
 Wydajność FP32, GFLOPS 2,308

Память

 Rozmiar pamięci wideo, MB  2048/4096
 Szyna pamięci, bit  128
 Przepustowość pamięci, GB/s  112

Interfejs i TDP

 Interfejs PCI-Express  3.0 x16
 TDP. Wt 120

Nieco zmieniła się także relacja pomiędzy procesorami strumieniowymi a tak zwanymi jednostkami funkcji specjalnych (SFU). W architekturze Keplera stosunek ten wynosił 6/1, w Maxwellu spadł do 4/1. To samo dotyczy stosunku procesorów strumieniowych i jednostek odczytu/zapisu (Load/Store, LD/ST). Specjalne bloki obliczeń podwójnej precyzji nie są pokazane na schemacie, najprawdopodobniej zostaną przedstawione GPU GM210 (podobny do GK110 i GK104). Ale według NVIDII stosunek pojedynczej do podwójnej precyzji wynosi 1/24, podobnie jak w chipach „Kepler” pierwszej generacji (GK104).

Niewielkie zmiany w stosunku do poprzedniej implementacji architektury „Maxwell” nastąpiły w silniku przetwarzania wideo (Video Engine). Obecnie zapewnia nie tylko sprzętowe kodowanie do H.265, ale także sprzętowe dekodowanie. GeForce GTX 980 i GeForce GTX 970 również nie miały obsługi HDCP w HDMI 2.2, GeForce GTX 960 i GPU GM206 został dodany.