arzh-CNenfrdejakoplptesuk
Szukaj, znajdź 4120  disqus społecznościowy  tg2 f2 lin2 in2 Ikona X 3 y2  p2 Tik steam2

Radeon R9 290X

 Nowy układ graficzny Hawaii w sercu karty graficznej AMD Radeon R9 290X jest oparty na znanej już architekturze Graphics Core Next (GCN), która została nieco zmodyfikowana pod kątem możliwości obliczeniowych i pełnej obsługi wszystkich funkcji DirectX 11.2. wcześniej wykonany w chipie Bonaire (Radeon HD 7790), który również stał się podstawą dla Radeona R7 260X. Zmiany architektoniczne na Bonaire i na Hawajach dotyczą ulepszeń w możliwościach obliczeniowych (obsługa większej liczby jednocześnie wykonywanych wątków) oraz nowej wersji technologii AMD PowerTune, o której więcej omówimy poniżej.

Radeon R9 290X

Nowe funkcje w DirectX 11.2 obejmują zasoby kafelków, które wykorzystują możliwości sprzętowe pamięci wirtualnej Hawaii GPU, zwane teksturami częściowo rezydentnymi (PRT). Korzystając z wirtualnej pamięci wideo, łatwo jest uzyskać efektywną obsługę sprzętową algorytmów, które pozwalają aplikacjom wykorzystywać ogromne ilości tekstur i przesyłać je strumieniowo do pamięci wideo. PRT pozwala zwiększyć efektywność wykorzystania pamięci wideo w tego typu zadaniach, a podobne techniki są już stosowane w niektórych silnikach gier.

Choć możliwości GCN zostały rozszerzone, to główne wyzwanie AMD przy projektowaniu nowego top-endu GPU Nastąpiła poprawa efektywności energetycznej chipa, ponieważ Tahiti zużywało już zbyt dużo energii, a Hawaje zawierały więcej jednostek obliczeniowych. Zobaczmy, co udało się inżynierom AMD zrobić, aby wprowadzić na rynek konkurencyjny produkt:

Diag GPU mały


Nowy procesor graficzny jest logicznie podzielony na cztery części (Shader Engine), z których każda zawiera 11 powiększonych jednostek obliczeniowych (Compute Unit), w tym moduły tekstur, jeden procesor geometryczny i rasteryzator, a także kilka jednostek ROP. Innymi słowy, schemat blokowy najnowocześniejszego układu AMD stał się jeszcze bardziej podobny do schematu układów NVIDIA, które również mają podobną organizację.

W sumie układ graficzny Hawaii składa się z: 44 jednostek obliczeniowych zawierających 2816 procesorów strumieniowych, 64 jednostek ROP i 176 jednostek TMU. Uważany za GPU posiada 512-bitową magistralę pamięci składającą się z ośmiu 64-bitowych kontrolerów, a także 1 MB pamięci podręcznej L28. Jest produkowany w tej samej technologii procesowej 6.2 nm co Tahiti, ale zawiera już 4.3 miliarda tranzystorów (Tahiti ma XNUMX miliarda).

Rozważ schemat blokowy silnika cieniującego, który tworzy GPU Hawaii. Jest to wielkoblokowa część chipa, która zawiera cztery z tych silników:


Każdy silnik cieniujący zawiera jeden procesor geometrii i rasteryzator, które są w stanie przetwarzać jeden prymityw geometrii na cykl zegara. Wygląda na to, że wydajność geometryczna Hawaii nie tylko wzrosła, ale powinna być całkiem dobrze zrównoważona w porównaniu do poprzednich GPU Firma AMD.

dx112

Silnik cieniowania architektury GCN może zawierać do czterech powiększonych bloków renderowania zaplecza (RB), z których każdy zawiera cztery bloki ROP. Liczba jednostek obliczeniowych w silniku cieniowania również może być różna, ale w tym przypadku jest ich 11, chociaż pamięci podręczne dla instrukcji i stałych są podzielone na każde cztery jednostki obliczeniowe. Oznacza to, że bardziej logiczne byłoby uwzględnienie nie 11, ale 12 jednostek obliczeniowych w Shader Engine, ale wydaje się, że taka liczba nie była już uwzględniana w limitach zużycia energii na Hawajach.


Jednostka obliczeniowa architektury GCN obejmuje różne jednostki funkcjonalne: moduły pobierania tekstur (16 sztuk), moduły filtrowania tekstur (cztery), jednostkę przewidywania rozgałęzień, harmonogram, jednostki obliczeniowe (cztery wektorowe i jeden skalarny), pamięć podręczna pierwszego poziomu pamięć (16 KB na jednostkę obliczeniową), pamięć na rejestry wektorowe i skalarne oraz pamięć współdzielona (64 KB na jednostkę obliczeniową).


Ponieważ w procesorze graficznym Hawaii znajdują się cztery silniki cieniujące, ma on w sumie cztery jednostki przetwarzania geometrii i silniki rasteryzacji. W związku z tym nowy top GPU AMD może przetwarzać do czterech prymitywów geometrycznych na cykl zegara. Ponadto na Hawajach udoskonalono buforowanie danych geometrycznych i zwiększono pamięć podręczną dla prymitywnych parametrów geometrycznych. Wszystko razem zapewnia znaczny wzrost wydajności przy dużej liczbie obliczeń w shaderach geometrii i aktywnym wykorzystaniu teselacji.

Wprowadzono również pewne zmiany w możliwościach obliczeniowych nowego, aczkolwiek graficznego, ale wciąż procesora. Układ zawiera dwa silniki DMA, które zapewniają pełne wykorzystanie możliwości magistrali PCI Express 3.0, deklarowana jest dwukierunkowa przepustowość 16 GB/s. Stosunkowo nową można też nazwać możliwość obliczeń asynchronicznych, które realizowane są za pomocą ośmiu (w przypadku układu Hawaii) Asynchronous Compute Engines (ACE).

płaszcz


Bloki ACE współpracują równolegle z graficznym procesorem poleceń i każdy z nich jest w stanie zarządzać ośmioma strumieniami poleceń. Organizacja ta zapewnia niezależne planowanie i pracę w środowisku wielozadaniowym, dostęp do danych w pamięci globalnej i pamięci podręcznej L2, a także szybkie przełączanie kontekstów. Jest to szczególnie ważne w zadaniach komputerowych, a także w aplikacjach do gier podczas użytkowania GPU zarówno do obliczeń graficznych, jak i ogólnych. Ponadto ta innowacja może teoretycznie być zaletą w przypadku korzystania z dostępu do możliwości na niskim poziomie GPU przy użyciu interfejsów API takich jak Mantle.

Wróćmy do funkcji Hawajów, które dotyczą obliczeń graficznych. Ze względu na rosnące wymagania dotyczące zezwoleń z oczekiwanym rozłożeniem Ultramonitorów HD, konieczne staje się zwiększenie możliwości obliczeniowych jednostek operacji rastrowych – ROP. Układ Hawaii zawiera 16 bloków Render Back End (RBE), czyli dwa razy więcej niż Tahiti. Szesnaście RBE zawiera 64 ROP, które są w stanie przetwarzać do 64 pikseli na zegar, co może być bardzo przydatne w niektórych przypadkach.

Jeśli chodzi o podsystem pamięci, Hawaii ma 1 megabajt pamięci podręcznej L16, która jest podzielona na 64 sekcji po 33 KB. Twierdzono, że wzrost pamięci podręcznej o 2% i wzrost wewnętrznej przepustowości o jedną trzecią. Całkowita przepustowość pamięci podręcznych L1/L1 jest deklarowana jako równa XNUMX TB/s.

Dostęp do pamięci uzyskuje się za pośrednictwem ośmiu 64-bitowych kontrolerów, które razem tworzą 512-bitową magistralę. Układy pamięci w Radeonie R9 290X są taktowane z częstotliwością 5.0 GHz, co daje całkowitą przepustowość pamięci 320 GB/s, czyli o ponad 20% wyższą niż w Radeonie HD 7970 GHz. Jednocześnie obszar chipa zajmowany przez kontroler pamięci został zmniejszony o 20% w porównaniu do 384-bitowego kontrolera na Tahiti. 

Dane techniczne Radeona R9 290X

Nazwa Radeon R9 290X
Rdzeń Hawaje
Technologia procesu (µm) 0.028
Tranzystory (mln) 6200
Częstotliwość rdzenia 1000
Częstotliwość pamięci (DDR) 5000
Typ magistrali i pamięci GDDR5 512-bitowy
Przepustowość (Gb/s) 320
Zunifikowane bloki shaderów 2816
Częstotliwość zunifikowanych jednostek cieniujących 1000
TMU na przenośnik 176
RPO 64
Szybkość wypełniania (Mpix/s) 64600
Szybkość wypełniania (Mtex/s) 176400
DirectX 11.2
Pojemność pamięci 4096
Interfejs PCI-E 3.0 x16

W porównaniu do swojego poprzednika Radeon HD 7970, wydajność na Hawajach w obliczu Radeona R9 290X wzrośnie o około 40-60%.