enfrdepluk
Szukaj, znajdź 4120  disqus społecznościowy  tg2 f2 lin2 in2 Ikona X 3 y2  p2 Tik steam2

Cechy architektury Radeona HD 3870

4574242

Nie jest dziś dla nikogo tajemnicą, że pierwsza generacja masowych procesorów graficznych z obsługą DirectX 10, a także opartych na nich kart wideo, okazała się wyjątkowo nieudana – przede wszystkim pod względem wydajności. Mimo innowacyjnej architektury, ATI Radeon HD 2600 i Nvidia GeForce 8600 radzą sobie słabo w grach, często ustępując rozwiązaniom poprzedniej generacji, co prawda nie aż tak perfekcyjnie, ale bez oczywistych wąskich gardeł w postaci niewielkiej liczby jednostek wykonawczych, jak jak również niewystarczające sterowniki optymalizacji. Równie ważnym ograniczeniem było stosowanie przez obu gigantów rynku graficznego 128-bitowej magistrali pamięci, która wyraźnie nie jest w stanie nasycić GPU danymi w nowoczesnych grach, zwłaszcza przy użyciu FSAA i wysokich rozdzielczościach.

Wydawało się, że AMD, obecny właściciel wszystkich aktywów ATI Technologies, powinien pospieszyć się z „bronią odwetu”, zwłaszcza w świetle coraz bardziej niepewnej pozycji firmy w sektorze konsumenckiej grafiki 2006D. Pod kierownictwem AMD, przychody ATI w drugim kwartale roku kalendarzowego 40 w tym roku spadły o 2006% w porównaniu do drugiego kwartału 19,1, podczas gdy udział w rynku Radeonów ATI spadł do 27,6% z 670% w momencie ogłoszenia fuzji firm. ATI i AMD. Oczywiście AMD pilnie potrzebowało środków, aby naprawić sytuację i wrócić na właściwe tory. Gwałtowna zapowiedź nowego GPU RV19 i rozpoczęcie masowych dostaw opartych na nim rozwiązań mogło być właśnie takimi środkami, zwłaszcza że procesor został pomyślnie przetestowany w sierpniu zeszłego roku, jednak Advanced Micro Devices zdecydowało się na wprowadzenie na rynek nowego Radeona ATI. Linia HD w ramach zapowiedzi nowej platformy do gier o kryptonimie „Spider”. Z kolei jego premiera była wielokrotnie opóźniana z powodu problemów z osiąganiem przez procesory AMD Phenom wymaganych częstotliwości zegara. W rezultacie ogłoszenie platformy zostało opóźnione do 2.30 listopada, a nawet do tego czasu nowe procesory AMD mogły osiągnąć tylko 670 GHz, a dział graficzny nadal ponosił straty. Wróćmy jednak do RVXNUMX, który, co prawda z opóźnieniem, ale jednak, w końcu ujrzał światło dzienne.

Wcześniej firma ATI Technologies była wielokrotnie i słusznie krytykowana za zamieszanie w nazwach swoich produktów. Nie zmieniła swoich nawyków nawet teraz, będąc oddziałem Advanced Micro Devices. Spodziewano się, że karty wideo oparte na RV670 będą nazywane Radeon HD 2950, ​​co byłoby całkiem logiczne z punktu widzenia zdrowego rozsądku – nowego układu nie można nazwać rewolucyjnym; był to naturalny ewolucyjny rozwój modelu R600. Zamiast tego całkowicie zmieniono system nazewnictwa, a nowa rodzina nosi nazwę Radeon HD 3800, jakby była oparta na nowej generacji GPU. Obecność wsparcia dla DirectX 10.1 nie była podstawą do przypisania nowym produktom statusu „rozwiązań nowej generacji”, jednak to, co zostało zrobione, jest zrobione, a nowe karty graficzne AMD ATI Radeon są oznaczone w następujący sposób:

114110

ATI Radeon HD 3850
ATI Radeon HD 3870

Architektura ATI Radeon HD 3800

AMD poszło dalej w opanowaniu bardziej subtelnych procesów technicznych niż Nvidia – jej chip stał się pierwszym GPU na świecie, który wykorzystywał standardy produkcyjne 55 nm, co pozwoliło mu pewnie przekroczyć granicę 700 MHz, przynajmniej w starszym modelu Radeon HD 3800. złożoność układu, najwyraźniej poprzez optymalizację wewnętrznej architektury układu i uproszczenie topologii kontrolera pamięci pierścieniowej, ponieważ liczba bloków funkcjonalnych RV670 odpowiada R600. To pierwszy przypadek od dłuższego czasu, kiedy nowy procesor graficzny ATI pod względem liczby tranzystorów pozostaje w tyle za procesorem Nvidia podobnej klasy. Z tego punktu widzenia ATI udało się ponownie zostać liderem technologicznym, ale jak wyglądają nowe produkty w porównaniu z GeForce 8800 GT?

Przede wszystkim ATI Radeon HD 3800 przewyższa Nvidia GeForce 8800 GT pod względem taktowania rdzenia, co jest jednak rekompensowane mniejszą liczbą jednostek funkcjonalnych, takich jak TMU. Istotna przewaga w liczbie jednostek wykonawczych, jak już wiemy, nie jest w zasadzie taka, i nie tylko i nie tyle, że jednostki ALU w układach Nvidii działają z wyższą częstotliwością: architektura VLIW zaimplementowana w Radeonie HD wymaga szczególnej ostrożności optymalizacje sterowników w celu zapewnienia wydajnej równoległości kodu modułu cieniującego. W przeciwnym razie, jeśli nie jest możliwe załadowanie wszystkich jednostek ALU niezależnymi instrukcjami, wydajność procesorów superskalarnych cieniowania Radeon HD gwałtownie spada; w najgorszym przypadku można użyć tylko 1 jednostki ALU na 5 należących do każdego z 64 takich procesorów. Jak na ironię, to właśnie AMD/ATI Technologies ma najwięcej problemów z optymalizacją oprogramowania, ponieważ nie ma dostępu do kodu gier opracowanych w ramach programu Nvidii „The Way It's Meant To Be Played” przed ich oficjalną premierą. Często taki stan rzeczy wpływa bezpośrednio na wydajność rozwiązań graficznych AMD/ATI w grach i oczywiście nie na lepsze.

114092

Jeśli skupisz się wyłącznie na schemacie blokowym RV670, nie będzie można na nim wykryć różnic w stosunku do R600. Leżą na głębszym poziomie, dlatego należy je bardziej szczegółowo omówić. Godne uwagi różnice między RV670 i R600 obejmują obsługę DirectX 10.1 (Shader Model 4.1) oraz pełnoprawny sprzętowy procesor wideo UVD, podobny do tego zawartego w ATI Radeon HD 2600.

Podobnie jak R600, każdy procesor cieniujący RV670 składa się z sześciu bloków — pięciu jednostek ALU i jednego bloku do wykonywania instrukcji sterowania przepływem, takich jak rozgałęzienia, sprawdzanie dopasowania, pętle i wywołania podprogramów. Ponadto zawiera zestaw rejestrów ogólnego przeznaczenia

114093

Spośród pięciu jednostek ALU, cztery są proste, zdolne do wykonywania jednej instrukcji FP MAD na zegar, a piąta jednostka ALU może również wykonywać złożone instrukcje, takie jak SIN, COS, LOG, EXP, itp. Architektura ta jest niezwykle elastyczna i wysoce skalowalna, ale jej słabym punktem jest zależność od optymalizacji oprogramowania. Chociaż rdzenie graficzne ATI Radeon HD zawierają menedżera zadań specjalnych, jego wydajność zależy bezpośrednio od wydajności kompilatora kodu cieniującego, który jest częścią sterowników. Faktem jest, że architektura superskalarna osiąga największą wydajność, gdy wszystkie jednostki ALU są zajęte wykonywaniem niezależnych operacji, a jest to dość trudne do osiągnięcia, ponieważ w aplikacjach 3D wiele operacji zależy od wyników poprzednich.

Procesory tekstur architektonicznych i rastrowych ATI Radeon HD 3800 również nie różnią się od podobnych bloków ATI Radeon HD 2900. Są to skomplikowane urządzenia, więc możemy mówić tylko o ich równoważności z tradycyjnymi TMU i ROP-ami. W sumie RV670 ma cztery duże procesory tekstur, z których każdy zawiera w środku następujące bloki:

8 jednostek adresu tekstury
20 bloków próbkowania tekstur
4 jednostki filtrujące tekstury

114094

Każdy z procesorów rastrowych RV670 zawiera:
4 bloki pracy z kanałem alfa i mgłą
8 bloków pracy z buforami Z- i szablonowymi
4 jednostki miksujące
16 multisamplingowych jednostek przetwarzania
Jest więc w przybliżeniu równoważny 4 klasycznym ROP i może przetwarzać cztery piksele na cykl, w sumie 16, ponieważ w sumie są cztery takie procesory. W przypadku pracy z buforem Z, czyli pikselami, które nie zawierają danych o kolorze, wydajność jest podwojona i wynosi 32 piksele na zegar. Podobnie jak jednostki tekstur, procesory rastrowe w RV670 przeszły dość poważne zmiany w celu obsługi funkcji DirectX 10.1.

Kontroler pamięci RV670 został ulepszony, a przepustowość pamięci jest wykorzystywana przez nowy układ znacznie wydajniej, co pozwala mu konkurować na równych warunkach z R600. Jednak w praktyce widzimy tylko zmniejszenie szerokości zewnętrznej magistrali pamięci z 512 do 256 bitów, a także zmniejszenie całkowitej szerokości wewnętrznych magistrali pierścieniowych kontrolera z 1024 do 512 bitów. Bardziej subtelne zmiany, jeśli w ogóle, są niestety przed nami ukryte i nie możemy powiedzieć, czy deklarowana porównywalna wydajność RV670 i R600 jest ich wynikiem, czy wynikiem nieefektywnego wykorzystania możliwości podsystemu pamięci tego ostatniego. Skłaniamy się ku drugiej opcji, ponieważ w rzeczywistych warunkach grania obecność 512-bitowej magistrali pamięci zewnętrznej o przepustowości ponad 100 GB/s często nie dawała ATI Radeonowi HD 2900 XT żadnych przewag.

ATI RV670 jest także pierwszym na świecie procesorem graficznym do komputerów stacjonarnych, który oferuje te same zaawansowane możliwości zarządzania energią, co rdzenie graficzne ATI do urządzeń przenośnych. Dzięki technologii ATI PowerPlay nowy układ jest w stanie elastycznie kontrolować swoje częstotliwości, napięcie zasilania, a nawet wyłączać nieużywane bloki, gdy rdzeń jest lekko obciążony. W przeciwieństwie do innych desktopowych procesorów graficznych, funkcje oszczędzania energii RV670 są wbudowane w sprzęt, aby zapewnić szybszą reakcję na obciążenie i wyeliminować błędy wykrywania GPU.

W historii ATI Technologies zdarzały się już przypadki, kiedy firma wspierała standard, który nie był wcześniej szeroko rozpowszechniany. Na przykład ATI Radeon 8500 obsługiwał specyfikację Pixel Shader 1.4, która była częścią DirectX 8.1. Specyfikacje te były znacznie bardziej elastyczne niż PS1.0/1.1/1.3 obsługiwane przez układy Nvidii i pozwalały na uzyskanie efektów specjalnych o wyższej jakości, ale właśnie z powodu ograniczonego wsparcia nie zostały one powszechnie przyjęte przez twórców gier w cyklu życia ATI Radeon 8000. Podobny los spotkał obsługę Shader Model 2.0b zaimplementowaną w rodzinie ATI Radeon X700/X800/X850, a także Shader Model 2.0a promowany przez Nvidię w rodzinie GeForce FX. DirectX 9 Shader Model 3.0 zaczął zyskiwać znaczącą dystrybucję dopiero po pojawieniu się portów gier z konsol Microsoft Xbox 360 i Sony PlayStation 3, co wyraźnie wykraczało poza cykl życia GeForce 6 i wczesnego GeForce 7.

DirectX 10.1 był pierwszym i ostatnim podzbiorem DirectX 10. Został oficjalnie włączony do systemu Windows Vista wraz z wydaniem dodatku Service Pack 1

Kluczowe innowacje w DirectX 10.1:

Obsługa tablic sześciennych map: pozwala osiągnąć akceptowalną prędkość podczas korzystania z globalnego oświetlenia sceny poprzez dostęp do kilku map sześciennych w jednym przebiegu renderowania. Ta metoda globalnego oświetlenia obejmuje obliczanie pośredniego oświetlenia rozproszonego, załamań, miękkich cieni i dokładniejszych obliczeń odbić.
Ulepszone renderowanie odroczone i techniki FSAA: obsługa niezależnych trybów mieszania dla każdego MRT, obowiązkowa obsługa MSAA 4x, obsługa pisania masek pokrycia pikseli z shadera, wybór próbki wzorca, próbkowanie z bufora multisamplingu, obsługa filtrów wykrywania pikseli, które wymagają -aliasing.
Zwiększono liczbę rejestrów Vertex Shader: nowe specyfikacje zapewniają 32 rejestry zamiast 16 w specyfikacjach DirectX 10.
Obsługa Gather4: Podobnie jak funkcja Fetch4 w ATI Radeon X1000, umożliwia pobranie bloku 4 pikseli (2x2) dla tekstury jednoskładnikowej. Służy do przyspieszenia pracy z mapami cieni i poprawy jakości cieni.
Ulepszone techniki mieszania i filtrowania: obsługa instrukcji LOD, która zwraca poziom szczegółowości filtrowanego pobierania tekstur, obsługa INT16 do mieszania i FP32 do filtrowania (INT8 i FP16 w DirectX 10)

GPU RV670 imponuje rozmiarem rdzenia - pomimo tego, że składa się z 666 milionów tranzystorów, jego powierzchnia to zaledwie 192 milimetry kwadratowe (13.7x14 mm.). To wyraźnie pokazuje, do czego zdolny jest nowy proces 55 nm. Poza logo ATI i datą produkcji rdzeń nie zawiera istotnych informacji dla użytkownika końcowego. Nasz egzemplarz powstał w 39 tygodniu 2007 roku, który przypadał na 23-29 września. Ponieważ procesory graficzne ATI Radeon HD nie deklarują różnych częstotliwości zegara dla różnych części układu, pomimo faktu, że różne domeny działają na 26 różnych częstotliwościach, zwyczajowo wskazuje się tylko „główną” częstotliwość układu; dla Radeona HD 3870 jest to 775 MHz. Kryształowe opakowanie pozbawione jest ramki ochronnej, dlatego podczas montażu i demontażu układu chłodzenia należy uważać, aby nie odpryskiwać rdzenia.

Pod względem konfiguracji bloków nie ma różnic w stosunku do ATI Radeon HD 2900 XT: chip zawiera 320 jednostek ALU pogrupowanych w 64 superskalarne jednostki obliczeniowe po 5 jednostek ALU każda. Jednocześnie 4 jednostki ALU w każdym takim bloku są w stanie wykonać proste instrukcje, takie jak MAD (Multiply+Add), a piąta, bardziej złożona, może również wykonywać instrukcje transcendentalne, takie jak SIN, COS, LOG, EXP itp. Dodatkowo każdy procesor obliczeniowy zawiera blok sterowania gałęziami odpowiedzialny za wykonywanie instrukcji sterowania przepływem (porównania, pętle, wywołania podprogramów itp.). Jedyną różnicą w stosunku do R600 w tym przypadku jest obsługa zaawansowanych funkcji DirectX 10.1 (Shader Model 4.1)

 

Dane techniczne ATI Radeon HD 3870

Nazwa Radeon HD 3870
Rdzeń RV670
Technologia procesu (µm) 0.055
Tranzystory (mln) 666
Częstotliwość rdzenia 775
Częstotliwość pamięci (DDR) 1125 (2250)
Typ magistrali i pamięci GDDR4 256 bitów
Przepustowość (Gb/s) 72
Zunifikowane bloki shaderów 320
Częstotliwość zunifikowanych jednostek cieniujących 775
TMU na przenośnik 16 (łącznie)
RPO 16
tekstury na zegar 16
tekstury na przejazd 16
Model cieniowania 4.1
Szybkość wypełniania (Mpix/s) 12400
Szybkość wypełniania (Mtex/s) 12400
DirectX 10.1
Antyaliasing (maks.) MS-24x
Filtrowanie anizotropowe (maks.) 16x
Pojemność pamięci 512
Interfejs PCI-E 2.0
RAMDAC 2x400

 

Chociaż karty graficzne ATI Radeon HD 3870 i ATI Radeon HD 3850 mają dobrą wydajność, pozycjonowanie HD 3870 pozostawiło bardzo nieprzyjemny posmak. Jak się okazało, zamiast konkurować z GeForce 8800 GT 512MB i Radeonem HD 3870, dostaliśmy niechęć AMD do konkurowania z Nvidią, ATi nadal konkurowało nie szybkością, ale ceną.

Need for Speed ​​Pro Street

210708143a3c