Zagórski Emil Kl. 1Tia 2 Czerwiec 2008
Temat :
Rodzina procesorów AMD Phenom
Prowadzący: Rudnicki Artur
Wprowadzenie
Firma AMD tym razem zupełnie odmiennie podeszła do premiery swojego najnowszego procesora. Zrezygnowała z konkurowania z Intelem na polu najszybszych procesorów i skupiła się nie tyle na samym procesorze, ale na całej platformie. Po przejęciu ATI ma już teraz w swojej ofercie nie tylko procesory, ale również układy graficzne i chipsety. Umożliwiło jej to zaprezentowanie jednocześnie trzech kluczowych, dopasowanych do siebie komponentów: czterordzeniowego procesora, dwóch nowych kart graficznych oraz nowych chipsetów. Cała platforma otrzymała nazwę kodową Spider, która powinna nam się kojarzyć z ośmioma odnóżami pająka; Spider umożliwia bowiem instalację w komputerze procesora o czterech rdzeniach i czterech kart graficznych. Stąd liczba osiem. Kluczowym i najważniejszym elementem nowej platformy jest nowy procesor AMD, znany dotychczas pod nazwą kodową K10 (chociaż niektórzy mylnie określali go mianem K8L). Od kilku miesięcy znamy już oficjalną nazwę procesora - AMD Phenom. Zastąpiła ona popularną markę Athlon, która stosowana będzie wyłącznie względem procesorów opartych na architekturze K8 (oraz K9 - czyli procesorów dwurdzeniowych). Chociaż początkowo za nazwą Phenom znajdować się miał przyrostek X4, sugerujący, że mamy do czynienia z procesorem czterordzeniowym (analogicznie procesory dwurdzeniowe miały nosić oznaczenie X2, a trójrdzeniowe - X3), ostatecznie jednak za nazwą Phenom znajdzie się jedynie czterocyfrowa liczba. Początkowo do sprzedaży trafią dwa procesory z nowej rodziny, AMD Phenom 9600 (2,3 GHz) oraz AMD Phenom 9500 (2,2 GHz). W grudniu lub styczniu dołączy do nich Phenom 9700, taktowany zegarem 2,4 GHz. Zaraz po nim ukaże się Phenom 9900 - 2,6 GHz.
1) Budowa
Architektura AMD K10 wnosi kilka istotnych zmian w stosunku do K8/K9. Przede wszystkim mamy do czynienia z układami czterordzeniowymi, w dodatku zaprojektowanymi z góry jako procesory czterordzeniowe - w przeciwieństwie do układów Kentsfield i Penryn Intela, które są "sklejkami" dwóch procesorów dwurdzeniowych. Według AMD taka budowa procesorów Phenom powinna im zapewnić wyższą efektywność podczas pracy w trybie tzw. "megataskingu", czyli przy wykorzystywaniu "masywnej wielowątkowości".
Phenomy mają trzy poziomy pamięci cache. Na każdy rdzeń przypada po 512 KB pamięci drugiego poziomu (L2), co daje łącznie 2 MB pamięci L2. Otrzymały ponadto pamięć L3 - 2 MB - którą współdzielą wszystkie cztery rdzenie. Pamięć ta ułatwia rdzeniom wymianę danymi. Podobne rozwiązanie, tyle że zastosowaniem pamięci L2, znajduje się w dwurdzeniowych procesorach rodziny Intel Core (w przypadku układów czterordzeniowych na każde dwa rdzenie przypada odrębny blok pamięci L2). Układy AMD Phenom otrzymały 128-bitowe jednostki zmiennoprzecinkowe o wysokiej wydajności, zapewniające procesorom wysokie osiągi w aplikacjach naukowych, multimedialnych czy grach. W Phenomach poprawiono także jednostki przewidywania rozgałęzień, które pracują efektywniej w aplikacjach pisanych w C++, Javie czy Visual Basicu.
W procesorach znalazł się kontroler pamięci DDR2, obsługujący moduły do DDR2 1066 włącznie.
Z płytą główną procesory Phenom komunikują się przez łącze HyperTransport 3.0, zapewniające przepustowość nawet do 20,8 GB/s (w porównaniu do HT 1.0 - 6,4 GB/s i HT 2.0 - 8 GB/s).
Procesory Phenom wykorzystują ponadto nowy typ podstawki Socket AM2+, chociaż - jak zapewnia AMD - działają także na starszych płytach z podstawką AM2 (tylko że przełączają się wtedy w tryb HyperTransport 1.0 lub 2.0, co lekko obniża ich osiągi).
2) Zasada działania
Pamięć podręczna:
AMD Phenom do synchronizacji pracy rdzeni wykorzystuje pamięć cache nie drugiego, lecz trzeciego poziomu. Innymi słowy, dane „przerobione” przez CPU0 muszą przeskoczyć przez L1, L2 i trafić do L3, by tam mogły zostać zestawione z wynikiem pracy CPU1.
Wady, zalety? W zasadzie trudno byłoby zarzucić jakieś istotne wady temu rozwiązaniu, gdyby nie fakt, że przepustowość cache L3, jak i czas dostępu jest dwa razy gorszy od L2 w tym procesorze. O ile L2 dysponuje przepustowością na poziomie (2200 MHz) 17000 MB/s (odczyt) oraz czasem dostępu 4,2ns, o tyle w L3 to już 7500 MB/s oraz 9ns. Jednak największa różnica jest w przypadku losowego czasu dostępu do pamięci cache. Do L2 wynosi ona niemal 7ns, zaś do L3 ponad 22ns. Najprawdopodobniej jest to wynikiem dwa razy niższej częstotliwości pamięci cache L3 względem L2. W konkretnej chwili tylko jeden rdzeń pracuje i zawsze jest to 100% obciążenia. .
Testując Need for Speed ProStreet oraz Most Wanted na Phenomie. Można zaobserwować w przypadku, że obciążenie zawsze jest to 100% dla jednego rdzenia, z tą różnicą, że cały czas to obciążenie „przeskakuje” między rdzeniami. W konkretnej chwili tylko jeden rdzeń pracuje i zawsze jest to 100% obciążenia. Z tego powodu wnioskujemy, że cały problem źle działających aplikacji jednordzeniowych na procesorach to była fizyczna wada tych procesorów, którą próbowano naprawić za pomocą programu, ale nie do końca się to udawało.
Kontroler pamięci:
Po opisie pamięci podręcznej czas na kontroler pamięci. Ten został odziedziczony po procesorach K8, czyli jest zintegrowany z procesorem - zawiera się w tym samym kawałku krzemu. Jednak AMD poczyniło pewne modyfikacje. Po pierwsze, dostępne są dwa tryby jego pracy. Pierwszy, znany z dotychczasowych jednostek AMD, 128-bitowy jednokanałowy - w BIOSie znajdziemy go pod nazwą „Ganged”. Drugi to tryb znany z kart graficznych, 2 kontrolery po 64-bit - w BIOSie opcja nazywa się „Unganged”. Zastanawiając się nad tymi dwoma trybami pracy można bardzo szybko dojść do pewnych wniosków. Jeden 128-bitowy kontroler z pewnością lepiej będzie się sprawował w wykonywaniu zadania wykorzystującego jeden rdzeń - dana aplikacja ma dostęp do całego kontrolera pamięci. Jednak w przypadku, gdy wykonujemy dwie różne operacje, które korzystają z różnych rdzeni, to dwa kontrolery powinny się okazać szybsze. Powodem tego stanu rzeczy jest fakt, że kontroler będzie pracował w rzeczywistości jako dwa osobne - innymi słowy, jeden z rdzeni może używać jednego kontrolera, a w tym samym czasie drugi rdzeń może się odwołać do pamięci za pomocą drugiego kontrolera.
HTT, FSB, HT, NB? O co chodzi?
Wraz z Phenomem zmieniło się dość wiele w kwestii zależności częstotliwości procesora od HTT, częstotliwości pamięci od procesora itd. Dotychczas było tak, że była częstotliwość bazowa - HTT, względem której taktowany był procesor (po uwzględnieniu mnożnika ustawionego w BIOSie). Względem dokładnie tego samego zegara, gdyż HTT to nie była magistrala, ustalana była częstotliwość HyperTransport - również po uwzględnieniu mnożnika ustalonego w BIOSie. Częstotliwość pamięci zależna była JEDYNIE od taktowania procesora - występowały odpowiednie dzielniki, które zależnie od użytego mnożnika procesora oraz wybranego DIV'a w BIOSie (zadanej częstotliwości, co jednak z rzeczywistym zegarem praktycznie nigdy się nie pokrywało).
3) Przykłady
AMD Phenom X3 8000
Nowe trójrdzeniowe układy AMD są pierwszymi tego typu procesorami na świecie. Ich największą zaletą jest niewiele niższa wydajność, w stosunku do układów czterordzeniwych, przy znacznie niższej cenie. Phenom X3 bazują na architekturze K10, którą zubożono o jeden rdzeń.
Pierwsza z nowości, Phenom X3 8400, pracuje z zegarem 2.1 GHz, natomiast drugi premierowy model, Phenom X3 8600, taktowany jest już zegarem 2.3 GHz. Choć procesory bazują na rewizji B2, przy taktowaniu ich zegarów, błąd TLB nie będzie miał wpływu na ich poprawną pracę. W połączeniu z chipsetem AMD 780, procesor X3 jest w stanie sprostać oczekiwaniom najbardziej wymagających użytkowników HD, jak i graczy. Rozwiązanie AMD zapewnia bardzo dobry odbiór w rozdzielczości full HD, z obsługą najnowszych i najbardziej zaawansowanych formatów (włącznie z VC-1, MPEG-2 i H.264). Dzięki Unified Video Dekoder, procesor jest mniej obciążony (kosztem GPU), co zapewnia mniej opóźnień obrazu i jego lepszą jakość.
Urządzenie wyposażone będzie w architekturę Direct Connect wraz ze zintegrowanym kontrolerem pamięci, wspomagającym prędkość sprzętu, zwłaszcza w obsłudze gier. Ponadto, architektura procesora będzie posiadać technologie Balanced Smart Cache, umożliwiającą szybki dostęp do pamięci, czy Cool'n'Quiet 2.0 dla niezależnej regulacji częstotliwości zegarów poszczególnych rdzeni.
AMD Phenom X3 8450
Oferowany model Phenom 8450 pracuje z zegarem taktowanym częstotliwością 2.1 GHz. Procesor wyposażony jest w 3x128 KB pamięci pierwszego poziomu, 1,5 MB pamięci podręcznej drugiego poziomu oraz 2 MB współdzielonej pamięci L3.
Parametry techniczne:
Typ |
AMD Phenom |
Złącze |
Socket AM2 / AM2+ |
Częstotliwość zegara |
2100 MHz |
Częstotliwość szyny procesora |
3600 MHz |
Technologia |
0,065 µ |
L1 Cache |
3 x 128 kB |
L2 Cache |
3 x 512 kB |
Napięcie |
1,10 - 1,25 V |
L3 Cache |
2048 kB |
Wydzielana moc |
95 W |
Funkcje dodatkowe |
Technologia HyperTransport 3, Triple Core |
AMD Phenom X3 8750 s.AM2 BOX
Układy wykonane są w nowej rewizji B3. Seria 8x50 pod względem mikroarchitektury jest identyczna z procesorami czterordzeniowymi 9x50. Oferowany model Phenom 8750 pracuje z zegarem taktowanym częstotliwością 2.4GHz. Procesor wyposażony jest w 3x128 KB pamięci pierwszego poziomu, 1,5 MB pamięci podręcznej drugiego poziomu oraz 2 MB współdzielonej pamięci L3.
Parametry techniczne:
Typ |
AMD Phenom |
Złącze |
Socket AM2 / AM2+ |
Częstotliwość zegara |
2400 MHz |
Częstotliwość szyny procesora |
3600 MHz |
Technologia |
0,065 µ |
L1 Cache |
3 x 128 kB |
L2 Cache |
3 x 512 kB |
Napięcie |
1,10 - 1,25 V |
L3 Cache |
2048 kB |
Wydzielana moc |
95 W |
Funkcje dodatkowe |
Technologia HyperTransport 3, Triple Core |
AMD Phenom X4 9500
AMD Phenom kryje pod swoją nazwą rodzinę procesorów bazujących na innowacyjnej architekturze AMD K10. Prezentowany model Phenom 9500 jest układem posiadającym cztery rdzenie, z których każdy pracuje z częstotliwością 2.2 GHz. Uwagę zwraca zastosowanie 2048kB pamięci cache L3 (trzeciego poziomu). Rozwiązanie to ma na celu zwiększenie wydajności bufora procesora, co w prostej linii przekłada się na wzrost mocy obliczeniowej całego układu.
Parametry techniczne:
Typ |
AMD Phenom |
Złącze |
Socket AM2/AM2+ |
Częstotliwość zegara |
2200 MHz |
Częstotliwość szyny procesora |
3600 MHz |
Technologia |
0,065 µ |
L1 Cache |
4 x 128 kB |
L2 Cache |
4 x 512 kB |
Napięcie |
1,25 V |
L3 Cache |
2048 kB |
Wydzielana moc |
95 W |
Funkcje dodatkowe |
Quad Core, Technologia HyperTransport 3 |
Phenom X4 9750
Model Phenom 9750 jest układem posiadającym cztery rdzenie, z których każdy pracuje z częstotliwością 2.4 GHz. Procesor zbudowany jest na bazie rdzenia Agena w nowej rewizji B3. Zastosowanie 2048 kB pamięci cache L3 (trzeciego poziomu), ma na celu zwiększenie wydajności bufora procesora, co w prostej linii przekłada się na wzrost mocy obliczeniowej całego układu.
Parametry techniczne:
Typ |
AMD Phenom |
Złącze |
Socket AM2 / AM2+ |
Częstotliwość zegara |
2400 MHz |
Technologia |
0,065µ |
L1 Cache |
4 x 128 kB |
L2 Cache |
4 x 512 kB |
Napięcie |
1,25 V |
L3 Cache |
2048 kB |
Wydzielana moc |
125 W / 95 W |
Funkcje dodatkowe |
Quad Core, Technologia HyperTransport 3 |
AMD Phenom X4 9850 Black Edition
Prezentowany model Phenom 9850 jest układem posiadającym cztery rdzenie, z których każdy pracuje z częstotliwością 2.5 GHz. Procesor zbudowany jest na bazie rdzenia Agena w nowej rewizji B3. Zastosowanie 2048 kB pamięci cache L3 (trzeciego poziomu), ma na celu zwiększenie wydajności bufora procesora, co w prostej linii przekłada się na wzrost mocy obliczeniowej całego układu.
Parametry techniczne:
Typ |
AMD Phenom Black Edition |
Złącze |
Socket AM2 / AM2+ |
Częstotliwość zegara |
2500 MHz |
Technologia |
0,065µ |
L1 Cache |
4 x 128 kB |
L2 Cache |
4 x 512 kB |
Napięcie |
1,25 V |
L3 Cache |
2048 kB |
Wydzielana moc |
125 W |
Funkcje dodatkowe |
Quad Core, Technologia HyperTransport 3 |
Źródła które pomogły mi stworzyć prace :
2