cosinus utk 017 procesory kompilacja 2006, I


Procesory 2003/2004 i wcześniej

Prawo Moore'a

Dawno, dawno temu - w 1972 roku - Gordon Moore, jeden z założycieli firmy Intel, stwierdził, że gęstość upakowania układów scalonych podwaja się średnio co 18 miesięcy. Ten żart stał się obecnie prawem obowiązującym w technologii komputerowej - w 18-miesięcznym rytmie nie tylko podwaja się gęstość upakowania, lecz także wiele innych parametrów. Warto przyjrzeć się bliżej temu zjawisku. Jego zrozumienie pozwala nie tylko na spoglądanie z dystansu na kolejne, chwilowe rekordy technologiczne, ale także na przewidywanie tych nowości, które dopiero mają nadejść. A przy okazji pozwala na docenienie różnych, niewidocznych na pierwszy rzut oka aspektów wyścigu technologicznego.

Nikomu nie trzeba tłumaczyć korzyści, jakie daje integracja wielu elementów w jednym układzie scalonym. Im większą liczbę elementów da się upakować, tym lepiej - uzyska się większą wydajność oraz mniejszy koszt produkcji. Dlaczego wobec tego nie robi się układów scalonych, które zawierałyby np. całą jednostkę centralną: procesor, procesor graficzny i pamięć na jednym chipie?

Wielkość chipu krzemowego

Obróbka krzemowego wafla jest procesem kosztownym i długotrwałym. Nic więc dziwnego w tym, że im więcej sprawnych układów uzyskuje się z jednego wafla, tym bardziej opłacalna jest produkcja. Ale powierzchnia pojedynczego układu nie tylko przekłada się bezpośrednio na ilość uzyskiwanych układów - im większa jest powierzchnia, tym większe jest prawdopodobieństwo tego, że wewnątrz niej znajdzie się więcej defektów struktury krzemowej, uniemożliwiających poprawne działanie układu. Przyjęło się niezbyt precyzyjne określenie, że koszt produkcji chipu rośnie z kwadratem jego powierzchni. Praktyczną barierą opłacalności była od lat i pozostaje nadal powierzchnia około 300 milimetrów kwadratowych. Oczywiście w przypadku procesorów, kosztujących wiele tysięcy dolarów i produkowanych w niewielkiej skali, opłacalna może być produkcja jeszcze większych chipów. Jednak w praktyce 300 milimetrów kwadratowych to chip ogromny, 200 - bardzo duży, a poniżej 100 - niewielki.

Bariery wielkości chipu są szczególnie eksponowane przy wdrażaniu nowych architektur - na granicy opłacalności były pierwsze procesory Cyriksa, o powierzchni chipu 394 mm2. Również chip procesora Pentium mierzący 294 mm2 był ogromny, ale zanim po blisko sześciu latach architektura Pentium się przeżyła, chip Pentium zmalał do 90 mm2. Podobna jest sytuacja Pentium 4 - 217 mm2 (pierwsze wersje) tego układu to bardzo dużo, w porównaniu ze 106 mm2 Pentium III, jednak zanim architektura P4 się zestarzeje, chip stanie się niewielki.

Wymiar technologiczny

Kilka lat temu najpowszechniej stosowane były wymiary technologiczne 0,35 i 0,25 mikrometra, obecnie skończyła się technologia 0,18-mikronowa - króluje 0,13 mikrona, a Intel w lutym 2004r. wypuścił procesor w wymiarze 0,09 mikrona (czyli 90 nanometrów). Czym właściwie jest wymiar technologiczny? W uproszczeniu można powiedzieć, że jest to wymiar "kratki", na której rozmieszczono elementy układu scalonego. Im mniejszy wymiar technologiczny, tym więcej elementów daje się umieścić na tej samej powierzchni krzemowego chipu. Wymiar technologiczny jest definiowany jako liniowy, podczas gdy powierzchnia, zajmowana przez element, zależna jest od kwadratu tego wymiaru. Widać więc, że każdy kolejny krok w zmniejszaniu wymiaru odpowiada w przybliżeniu zmniejszeniu powierzchni "kratki" o połowę, a co za tym idzie - podwojeniu liczby elementów mieszczących się na danej powierzchni, czyli ich upakowania. Na tym właśnie polega podwajanie gęstości upakowania - tak, jak to przewidział Moore. Dlaczego kroki wymiaru technologicznego są tak drobne? Przecież im mniejsze elementy, tym szybszy zegar, mniejszy pobór energii, a przede wszystkim mniejszy jednostkowy koszt produkcji, bo z jednego krzemowego "wafla" uzyskuje się więcej układów. Jednak zmniejszanie wymiaru technologicznego nie jest sprawą prostą.

Jak produkuje się procesory

Procesor to układ scalony, w którym umieszczono pewną ilość tranzystorów, wytworzonych na powierzchni krzemowej płytki, potocznie zwanej chipem, połączonych ze sobą przy użyciu metalicznych, przewodzących ścieżek, naniesionych na powierzchnię chipu. Krzemowy chip, wraz z wytworzonymi na nim tranzystorami, staje się strukturą układu scalonego. Tranzystory, tworzące układ scalony, muszą być w jakiś sposób ze sobą połączone. W tym celu na powierzchnię struktury nakłada się, przez naparowywanie, metalowe ścieżki. Najwygodniejszym do tej technologii metalem jest aluminium - stosunkowo łatwo daje się doprowadzić do stanu lotnego, ma również dobrą przewodność elektryczną. Nic zatem dziwnego, że aluminiowe ścieżki przez długi czas były nieodzownym elementem technologii układów scalonych. Dopiero stosunkowo niedawno pojawiła się, opracowana przez IBM, rewolucyjna technologia miedzianych ścieżek. Ale, aby po powierzchni struktury poprowadzić metalowe ścieżki, należy najpierw tę powierzchnię odizolować. Pomocnicze elementy izolacyjne powstają stosunkowo prosto - bardzo łatwo wytworzyć warstwę izolacyjną na krzemowej powierzchni kanałów tranzystorów - dwutlenek krzemu to jeden z najlepszych znanych izolatorów. Oddzielenie powierzchni jest niezbędne zarówno po to, aby wytworzyć warstwę izolacyjną dla bramek tranzystorów, jak i po to, by umożliwić połączenie oddzielnych tranzystorów w układ logiczny za pomocą przebiegających po powierzchni metalowych ścieżek.

W związku z koniecznością wykonania połączeń, warstwą izolacyjną pokrywana jest jedynie część powierzchni struktury, natomiast elektrody tranzystorów pozostają nie utlenione. Aluminium, jako materiał ścieżek, ma jeszcze jedną niezaprzeczalną zaletę. Na jego powierzchni bardzo łatwo wytworzyć warstwę izolacyjną przez utlenienie - tlenek glinu (korund, szmaragd czy wreszcie, zależnie od domieszek, rubin) ma znakomite własność ci izolacyjne. Warstwa izolacyjna jest potrzebna przede wszystkim po to, by na jej powierzchni można było nałożyć następną warstwę ścieżek.

W technologii miedzianej konieczne są dodatkowe fazy produkcyjne, polegające na stworzeniu warstwy izolacyjnej. Przy złożoności współczesnych układów scalonych, w celu realizacji niezbędnych połączeń koniecznie jest wykonanie wielu warstw krzyżujących się ścieżek. We współczesnych procesorach stosuje się zwykle 5 do 7 warstw metalicznych ścieżek. Powszechnie przyjętą zasadą jest umieszczanie najgęściej rozmieszczonych i najbardziej precyzyjnych ścieżek najbliżej powierzchni struktury. W miarę pojawiania się kolejnych warstw, ścieżki mają coraz większą powierzchnię i jest ich coraz mniej.

Wytworzenie układu scalonego wymaga wykonania wielu operacji na powierzchni jednej struktury. W intelowskim procesie 0,18 mikrona, z pięcioma warstwami metalizacji, układ poddawany jest blisko 300 operacjom technologicznym. Sześciowarstwowy proces AMD to jeszcze sporo więcej operacji, nie tylko ze względu na liczbę warstw, lecz także nieco inną technikę izolacji miedzianych ścieżek. Układów scalonych nie produkuje się więc pojedynczo. W jednym procesie technologicznym układy wykonywane są na powierzchni krzemowej płytki o średnicy 8 (lub ostatnio 12) cali - równocześnie powstaje wiele jednakowych układów, tworzących charakterystyczny wzór. Właśnie ze względu na ten, złożony z prostokątów, wzór płytka nazywana jest potoczne waflem. Na jednym waflu wytwarzanych jest równocześnie kilkaset układów scalonych. Im większa średnica wafla, tym oczywiście może być ich więcej, jednak wytwarzanie monokryształów krzemowych o dużych średnicach jest trudne - obecnie jedynie nieliczni producenci używają wafli o średnicy 12 cali, większość wciąż pozostaje przy łatwiej dostępnych i tańszych waflach 8-calowych.

Monokryształy krzemowe pochodzą zwykle z innych firm. Niewielu producentów układów scalonych zajmuje się zagadnieniem produkcji od podstaw, zresztą jedynie kilka firm na świecie opanowało proces produkcji monokryształów o zadowalającej czystości i jednorodności. Cięcie monokryształów na wafle również odbywa się w wyspecjalizowanych firmach. Dopiero tak przygotowane płytki krzemowe trafiają do właściwych fabryk układów scalonych. Po dziesiątkach i setkach operacji wafel składa się już z kilkuset gotowych układów scalonych. Jednak to jeszcze nie koniec - na waflu przeprowadzane są testy poszczególnych struktur. Testy służą nie tylko sprawdzeniu, czy dany układ „się udał” - na ich podstawie szacowana jest maksymalna częstotliwość zegara, z jakim będzie mógł pracować. Po testach do odpowiedniego rejestru procesora zostaje trwale zapisana wartość mnożnika częstotliwości (oczywiście, jeśli producent stosuje stałe mnożniki).

Wafle zostają następnie pocięte na poszczególne chipy. Pozostaje jedynie drobiazg - umieszczenie chipu w odpowiedniej obudowie i wyprowadzenie końcówek. Przez wiele lat stosowano łączenie punktów wyprowadzeń na strukturze z nóżkami obudowy przy użyciu zgrzewanych złotych drucików. Obecnie stosuje się prostsze, tańsze i pewniejsze metody montażu - najbardziej zaawansowana jest intelowska techologia FC-PGA (Flip Chip Pin Grid Array), w której struktura układu scalonego zostaje po prostu powierzchniowo przylutowana do płytki ze ścieżkami drukowanymi, w której osadzone są nóżki układu.

Inni producenci stosują technikę Flip Chip, podobną do intelowskiej, ale równocześnie obudowy ich procesorów zawierają dużo innych elementów, podczas gdy w technologii Intela struktura procesora ma bezpośredni styk z odprowadzającym ciepło radiatorem. Po umieszczeniu w obudowie układ zostaje poddany finalnym testom, po czym na jego obudowie wykonywany jest odpowiedni nadruk.

Bariery fizyki

Układy scalone wytwarzane są na powierzchni krzemowej płytki techniką, zwaną fotolitografią. Wymaga ona nakładania na powierzchnię krzemu tzw. masek, czyli warstw przesłaniających niektóre fragmenty powierzchni podczas kolejnych operacji trawienia, dyfuzji, utleniania czy naparowywania warstw przewodzących. Maski wytwarzane są techniką fotograficzną - materiał światłoczuły, jakim pokryta jest płytka krzemowa, ulega utrwaleniu w obszarach naświetlonych, z pozostałych zaś jest zmywany przed następną operacją.

Właśnie w procesie naświetlania masek ujawnia się główny problem, przed jakim stawia chętnych do miniaturyzacji nieubłagana fizyka. Aby naświetlany obraz był ostry i wyraźny, jego najmniejszy wymiar powinien być znacznie większy od długości fali stosowanego światła. Tymczasem zakres długości fal światła widzialnego zawiera się w przedziale 0,7 do 1,3 mikrometra! Konieczne więc było skonstruowanie specjalnego lasera o odpowiedniej długości fali.

Konstrukcja odpowiedniego lasera i receptura materiału masek nie rozwiązują jeszcze w pełni problemu. Należy ponadto zapewnić odpowiednią precyzję działania urządzeń produkcyjnych - taką, by maski i wszystko inne było pozycjonowane na powierzchni "wafla" z dokładnością, w najgorszym przypadku, w granicach do 5 proc. wymiaru technologicznego. Ten aspekt okazuje się nie tylko trudny, ale i kosztowny. Linia produkcyjna musi być precyzyjna "sama w sobie", ale także zabezpieczona przed wpływem czynników zewnętrznych. Przejeżdżające po pobliskiej autostradzie ciężarówki, które w niczym nie przeszkadzały przy procesie 0,35 mikrometra, mogą powodować na tyle silne wstrząsy, że uniemożliwią produkcję w technologii 0,18 mikrometra.

Warto tu wspomnieć o pozornej nieścisłości - produkowane w tym samym wymiarze technologicznym układy, o tej samej konstrukcji logicznej, charakteryzują się różnym upakowaniem. Produkowane jeszcze w 0,35-mikronowej technologii Pentium P54 zmniejszono z 91 do 83 mm2, Pentium II ze 131 do 118 mm2. Przykładów można by znaleźć więcej. Przyczyną takich zmian jest usprawnianie technologii już w trakcie produkcji danego procesora. Nowsze procesy technologiczne i optymalizacja układu elementów na płytce pozwalają nawet na dość znaczne zmniejszenie zajmowanej powierzchni bez zmniejszania wymiaru technologicznego.

Upakowanie elementów zależy również bezpośrednio od konstrukcji samego procesora. Jeśli występują w nim duże regularne struktury logiczne, jak np. pamięci statyczne cache, gęstość upakowania jest znacząco większa, niż w przypadku dość nieregularnej struktury poszczególnych bloków funkcjonalnych. Widać to wyraźnie na przykładzie produkowanych w tym samym, 0,18-mikronowym procesie Athlonów i Thunderbirda - ten ostatni zawdzięcza 30-procentowy wzrost gęstości upakowania temu, że aż 16 mln spośród jego tranzystorów stanowi pamięć cache o bardzo wysokim poziomie upakowania (zajmującą niespełna 20 proc. powierzchni chipu). Nieregularność struktur jest przyczyną tego, że bardzo zaawansowane technologicznie Pentium 4 charakteryzuje się znacząco niższą gęstością upakowania elementów niż wcześniejsze Pentium III.

Czasami usprawnienia procesu technologicznego pozwalają na zmniejszenie wymiaru technologicznego bez poważniejszych inwestycji. Takie zmiany są zwykle niewielkie, o "pół kroku" w porównaniu z klasycznymi skokami wymiaru, podwajającymi upakowanie, jednak potrafią mieć istotne znaczenie. Na przykład AMD, wprowadzając do produkcji procesor K6, przeszło ze stosowanego przy K5 wymiaru 0,35 na wymiar 0,3 mikrometra, a dopiero w rok później na wymiar 0,25 mikrometra.

Według dotychczasowych teorii technologia krzemowa będzie wtedy miała przed sobą szanse na co najwyżej dwa kroki wymiaru - do 0,07, a później do 0,05 mikrona. Mniejsze elementy, o wymiarze kilkunastu atomów, według tych teorii nie mają prawa działać w taki sposób, jak dotychczas. Jednak w ostatnim okresie dokonano szeregu badań, które dowiodły, że możliwe jest wykonanie poprawnie działających ścieżek o szerokości 5 (pięciu!) atomów miedzi i kanału tranzystora o długości 10 atomów krzemu. Może więc technologia krzemowa zakończy swój żywot dopiero na wymiarze 0,025 mikrona lub jeszcze niższym.

Bariery rozwoju procesorów

Pierwsza bariera: Długość fal świetlnych

Omówiona po części powyżej

Druga bariera: Izolacja bramki

W dzisiejszych procesach technologicznych, w których stosowane są materiały o obniżonej stałej dielektrycznej, najczęściej stosowanym materiałem izolacyjnym jest dwutlenek krzemu domieszkowany fluorem. W 0,13-mikronowej technologii jego warstwa, izolująca bramkę tranzystora, ma grubość trzech warstw molekularnych. Bardzo cienkie warstwy izolacyjne z tego materiału przyniosłyby w końcowym efekcie zbyt duże pojemności bramek - zmniejszenie wymiarów okupione byłoby koniecznością obniżenia częstotliwości zegarów. Dlatego badane są obecnie, jako potencjalny materiał izolacyjny bramki, materiały o wyższej stałej dielektrycznej, pozwalające na stosowanie grubszych warstw izolacyjnych przy zachowaniu potrzebnych dla działania tranzystora natężeń pola elektrycznego bramki. Materiałem, z którym technolodzy wiążą największe nadzieje, jest dwutlenek cyrkonu.

Trzecia bariera: Połączenia elementów

Połączenia pomiędzy tworzącymi układ scalony tranzystorami wykonane są jako sieć metalowych ścieżek, łączących pomiędzy sobą elektrody poszczególnych tranzystorów. Wysoki poziom złożoności układów scalonych sprawia, że połączeń musi być bardzo dużo, znacznie więcej niż umożliwiałaby pojedyncza warstwa metalowych ścieżek naniesionych na powierzchnię krzemu. W najbardziej zaawansowanych procesach technologicznych liczba tak zwanych warstw metalizacji (tak określane są poszczególne warstwy połączeniowe układu) sięga obecnie dziewięciu, praktycznie jednak mamy do czynienia z sześcioma-siedmioma warstwami.

Wraz ze zmniejszaniem wymiarów tranzystorów zmniejszają się również szerokości ścieżek przewodzących, co prowadzi do zwiększenia ich rezystancji. Lekarstwem jest zwiększanie grubości ścieżek (warstw). O perspektywy miniaturyzacji ścieżek możemy być spokojni - obecnie ścieżki mają szerokość kilkudziesięciu nanometrów, ale wykonano już laboratoryjnie ścieżki o szerokości 1,2 nm.

Czwarta bariera: Zasilanie

Cienkie warstwy izolacyjne wymagają, co oczywiste, stosowania niewielkich napięć - zarówno napięć zasilających, jak i poziomów sygnałów. Jednak obniżanie wartości napięć zasilających ma swoje granice.

Trzeba bowiem pamiętać o tym, że obszary, wytworzone w krzemie drogą domieszkowania, oddzielone są od krzemowego podłoża jedynie przez bariery potencjału. Przy stosowanych obecnie technikach domieszkowania krzemu bariery te mają poziom około 0,6 V - poniżej tego napięcia całość krzemowej płytki staje się prawie jednorodnym przewodnikiem, nie najlepszym zresztą. Jednak do działania układu samo utrzymanie barier nie wystarczy - dla dwustanowej logiki 0/1 konieczne jest dodatkowe napięcie, pozwalające na rozróżnienie stanów logicznych, nazywane napięciem przełączania. Obecnie, w 0,13-mikronowym procesie technologicznym TSMC, w którym warstwa izolacyjna ma grubość około 0,15 nm, czyli średnio czterech warstw molekularnych, napięcie przełączania wynosi około 0,3 V, w związku z tym ich minimalne napięcie zasilania wynosi 0,9 V.

Okazuje się, że pod względem obniżania napięcia jesteśmy już chyba najbliżej ostatecznej granicy. Co prawda zmniejszenie grubości warstw izolacyjnych pozwoli jeszcze obniżyć napięcie przełączania, ale już chyba nieznacznie - dla monomolekularnej warstwy izolacyjnej będzie ono i tak przekraczać 0,1 V. Można więc przyjąć, że procesory przyszłości będą zasilane napięciem 0,7-0,8, chyba że zostaną odkryte takie techniki domieszkowania krzemu, które pozwolą na obniżenie bariery potencjału. Ale, jeśli chodzi o domieszkowanie krzemu, tablica Mendelejewa została już przetestowana chyba w całości.

Piąta bariera: Zegar

Im mniejsze wymiary elementów, tym mniejsze są pojemności bramek, a cieńsze ścieżki zapewniają obniżenie pojemności pasożytniczych. Końcowym efektem jest skrócenie czasu przełączania bramek, czyli wzrost maksymalnej częstotliwości taktowania układów.

Tu jednak pojawia się nieoczekiwane zagrożenie - miniaturyzacja niekoniecznie okazuje się drogą do przyspieszania. Rekordowy tranzystor Intela, z kanałem o długości 20 nm, jest zdolny do przełączania z częstotliwością ok. 1,5 THz (czyli 1500 GHz). W przypadku zastosowania go w procesorze, którego architektura zawiera 10 poziomów bramek w każdej z faz potoku wykonawczego, taki tranzystor pozwoliłby na pracę procesora z zegarem około 30 GHz. Jednak przy szybkich zegarach ograniczeniem stają się nie wymiary i czasy przełączania tranzystorów, ale... wymiary chipu. Warto przypomnieć sobie, z jaką prędkością przepływa impuls elektryczny w przewodniku - w przybliżeniu z tą samą, z jaką w otaczającym przewodnik dielektryku rozchodzi się fala elektromagnetyczna. Synchroniczna praca układu, złożonego z tranzystorów o czasie przełączania poniżej jednej pikosekundy, wymagać będzie tolerancji sygnałów na tym samym poziomie. Tymczasem w ciągu jednej pikosekundy sygnał elektryczny przebiega w ścieżce odległość zaledwie nieco ponad 0,1 mm! Problemy z właściwą dystrybucją sygnału zegarowego po powierzchni chipu już dziś dają znać o sobie w przypadku procesorów serwerowych, których chipy mają duże rozmiary - to właśnie one ograniczają częstotliwość zegara procesorów Alpha EV68 do 1 GHz, one też spowodowały niedawne problemy Intela z produkcją 900-megahercowego zaledwie procesora Pentium III Xeon wyposażonego w 2 MB pamięci cache L2. Wyraźnie widać, że barierą przyspieszania będzie jednak bariera zachowania synchroniczności zegara, a nie czasy przełączania bramek. Jest jednak wyjście - przejście do konstrukcji asynchronicznych. Od paru lat prowadzone są prace nad procesorem o architekturze asynchronicznej, bez zegara. Konstrukcje takie zostały już zrealizowane praktycznie.

Ostateczna bariera: Minimum wymiarów

Wymiary poszczególnych elementów układu scalonego można dziś odnosić do setek atomów. Rekordowy obecnie, wytworzony w laboratoriach Intela w Hillsboro tranzystor, ma kanał o długości 20 nm, co odpowiada w przybliżeniu 80 atomom krzemu. Tylko dwukrotne zmniejszenie jego liniowych wymiarów spowoduje, że liczba atomów spadnie do 1-4. Ten rząd wielkości wydaje się być minimalnym „ostatecznym wymiarem podstawowym”.

Poza granice

Czego możemy się spodziewać jako finału wielu lat rozwoju technologii krzemowej? O tym, wbrew pozorom, zadecyduje raczej nie fizyka, a ekonomia. Czy eksploracja granic możliwości technologii krzemowej będzie miała sens, zadecydują nie inżynierowie, wcielający fizykę w technologię, ale ekonomiści. Nastąpi to gdzieś na poziomie wymiaru technologicznego wynoszącego 20-30 nm, przy częstotliwościach zegarów przekraczających 30 GHz. Na razie najszybsze z dostępnych na rynku układów pracują dziesięciokrotnie wolniej.

Chociaż wizja końca krzemowej drogi jest jeszcze dość odległa, już od pewnego czasu trwają prace nad potencjalnymi technologiami przyszłości, jak np. logika kwantowa. Według dość optymistycznych ocen, jej stosowanie na skalę przemysłową zacznie być możliwe właśnie w tym samym czasie, kiedy zakończy się ewolucja krzemu.

AMD vs. Intel

Wybór wśród elementów kluczowych - procesorów, płyt głównych i pamięci - jest teraz tak duży, że laicy są po prostu przytłoczeni. Samych rodzin procesorów mamy sporo - Athlon XP, Athlon 64, Athlon 64 FX, Duron, Opteron, Pentium 4, Pentium M, Celeron, Xeon, Itanium. Do każdej platformy istnieją co najmniej trzy chipsety, nie wspominając nawet o modelach ze zintegrowaną grafiką.

Produkty te możemy pogrupować, zmniejszając mnogość do rozsądnej liczby. Do niskobudżetowych komputerów pasują Celerony Intela albo Durony AMD. Notebooki obejmą procesory Pentium M lub Mobile Athlon 64. Linie serwerowe natomiast będą wykorzystywać Opterony, Xeony, bądź procesory Itanium.

Najbardziej jednak istotnymi, z punktu widzenia nabywcy PC, są procesory Athlon XP, Athlon 64, Athlon 64 FX AMD oraz Pentium 4 Intela. Ceny sięgają od 110 USD / 100 € za Athlona XP 2600+ aż do 1200 USD / 1100 € za Pentium 4 Extreme Edition. Częstotliwości zegarów zawierają się w przedziale od poniżej 2 GHz do 3.2 [3.4] GHz.

Kupno procesora: Wydajność kontra spadające ceny

Patrząc z obiektywnego punktu widzenia, podczas wyboru nowego procesora należy zawsze uwzględnić wymaganą moc obliczeniową na dzisiaj plus rezerwy na przyszłe zadania. Takie procesory generalnie oferowane są w rozsądnych cenach.

Z ekonomicznego punktu widzenia, najszybsze i najdroższe procesory mają sens jedynie wówczas, jeżeli dodatkowa wydajność naprawdę przyniesie pożytek w postaci skrócenia czasu w intensywnie korzystających z zasobów zadaniach, jak przykładowo renderowanie dużych scen, mogące trwać nawet kilka godzin. Z powodu wysokich cen, procesory jak Athlon 64 FX-51 czy Pentium 4 Extreme Edition są przeznaczone głównie dla entuzjastów z grubymi portfelami.

Platforma: Socket A, Socket 478, Socket 754, Socket 940

W dzisiejszych czasach ogólny wybór platformy nie polega jedynie na rozgraniczeniu AMD - Intel, ponieważ aktualne procesory posiadają różne podstawki. W systemach Intela Socket 478 wciąż dominuje w komputerach desktop. Format ten pojawił się na początku 2002 roku i dalej będzie służył jako podstawa przyszłych procesorów Intela jeszcze przez kilka miesięcy.

AMD z drugiej strony, prezentując 64-bitowe Athlony, stworzyło dwa nowe gniazda: Socket 754 Athlonów 64 oraz Socket 940 Athlonów 64 FX i Opteronów - wariantu serwerowego. 462-kontaktowy format Socket A wciąż istnieje, współpracuje ze wszystkimi Athlonami XP do 3200+. Dlatego też na początku należy wybrać architekturę.

Platforma

Socket A

Socket 754

Socket 940

Socket 478

Procesory

AMD AthlonXP, Duron

AMD Athlon 64

AMD Athlon 64 FX, Opteron

Intel Pentium 4, Pentium 4 Extreme Edition, Celeron od 1.7 GHz

Cena procesora

Niska do średniej

Średnia do wysokiej

Wysoka do bardzo wysokiej

Niska do bardzo wysokiej

Cena płyty głównej

Niska do średniej

Średnia do wysokiej

Średnia do wysokiej

Niska do wysokiej

Wydajność na dzisiaj

Wystarczająca do dobrej*

Bardzo dobra

Bardzo dobra

Wystarczająca do bardzo dobrej*

Możliwości rozbudowy

Niskie

Dobre

Dobre

Dobre do satysfakcjonujących

Długoterminowa wartość

Dobra do satysfakcjonującej

Dobra

Dobra

Dobra

* w zależności od procesora

Zegary systemu i rdzenia

Każdy procesor pracuje z określoną częstotliwością zegara, zwaną zegarem układu lub rdzenia. W zależności od modelu, procesory Intela pracują z maksymalnym zegarem 3.2 GHz. Maksimum dla AMD wynosi 2.2 GHz. Należy zauważyć, że właściwa wydajność nie może być oszacowana jedynie na postawie częstotliwości zegara. Dlatego też AMD oznacza swoje procesory wartością benchmarkową w stosunku do Pentium 4 (czyli np. Athlon XP 3200+).

Poza wewnętrzną częstotliwością pracy, procesory muszą się również komunikować z zewnętrznym światem. Zajmuje się tym szyna systemowa (lub szyna frontowa - ang. front side bus (FSB)). Tylko 64-bitowe Athlony do tego celu stosują protokół HyperTransport, nie mają szyny frontowej jako takiej. Wysokie częstotliwości, mierzone w gigahercach, działają jedynie na krótkich dystansach - innymi słowy - wewnątrz procesora. Gdy zachodzi potrzeba przenoszenia sygnałów na dłuższe odległości, jak ścieżki sygnałowe do chipsetu, szybkość jest dużo mniejsza - normalnie nie więcej, jak 200 MHz. Ponieważ tworzy to znaczące ograniczenie, wszystkie dzisiejsze szyny systemowe stosują kilka sztuczek: tryby podwójnej lub poczwórnej przepływności. W Athlonach XP i wszystkich aktualnych układach pamięci DDR, dane są przesyłane zarówno podczas rosnącego, jak i opadającego zbocza sygnału zegara taktującego. W przypadku DDR (Double Data Rate - podwójnej przepływności) oznacza to, że fizyczna szybkość 200 MHz zapewnia taką samą przepustowość, jak 400 MHz w trybie pojedynczej przepływności. Dlatego też czasami mówi się, że Athlon XP ma "400-MHz" szynę FSB. Pentium 4 stosuje tryb poczwórnej przepływności, co wyjaśnia oznaczenie "800-MHz FSB" w ulotkach reklamowych.

Właściwa częstotliwość zegara rdzenia jest wynikiem mnożenia częstotliwości zegara systemowego. Przykładowo - 3.2-GHz Pentium 4 uzyskuje taki zegar z 200-MHz zegara systemowego i mnożnika 16.

0x08 graphic

Podstawową różnicę pomiędzy Bartonem a znanym już Athlonem Thoroughbredem stanowi powiększona do 512 kB pamięć podręczna drugiego poziomu. Jeśli porównamy (nawet tylko wizualnie) chipy Bartona i Thoroughbreda, poza większą pamięcią cache nie dopatrzymy się między nimi różnic. Barton okazuje się jedynie Thoroughbredem z powiększoną pamięcią cache. AMD stosuje w swoich procesorach system pamięci podręcznych zwany exclusive cache, w którym dane pobrane do cache L1 zostają usunięte z L2 i odwrotnie - przeniesienie danych do cache L2 zwalnia miejsce w L1. Dzięki takiemu rozwiązaniu system pamięci cache Athlonów z logicznego punktu widzenia stanowi jedną pamięć o sumarycznej pojemności 640 kB. Rozpatrując wyniki procesorów Athlon w testach wydajności powinniśmy, według AMD, kierować się nie częstotliwością ich zegarów, ale model numbers - liczbowymi oznaczeniami modeli według lansowanej przez AMD True Performance Initiative. Powiększenie pamięci cache zawsze powoduje znaczny wzrost wydajności, dlatego wyniki testów Athlona XP 3000+ Barton są dosyć zaskakujące - w niektórych zastosowaniach jest on wolniejszy niż poprzednik, oznaczony jako 2800+. Dzieje się tak dlatego, że 3000+ pracuje z zegarem o 66 MHz wolniejszym niż model 2800+.

Wraz z modelem XP 3000+ AMD wprowadziło na rynek także procesor oznaczony 2800+. Mamy więc obecnie dwa różne Athlony XP 2800+, pracujące z zegarami 2,083 i 2,26 GHz. Obecna sytuacja, w której niższy model wykazuje się w licznych testach większą wydajnością od modelu szybszego, całkowicie rujnuje wiarygodność systemu model numbers.

Standard: AMD Athlon XP

AMD największe sukcesy w swojej historii odniosło z Athlonem: pozwolił na przekroczenie bariery 1 GHz w formacie Slot A (rdzeń Orion K7) przed Intelem z jego Pentium III. Rok później Intel zagroził pozycji Athlona Thunderbird wypuszczając pierwsze Pentium 4. Częstotliwości zegara tego drugiego rosły za szybko jak na gust AMD. W wyniku tego AMD wprowadziło oznaczenie wydajności, mające na celu określenie wydajności procesorów następnej generacji, zwanych Athlon XP (rdzeń Palomino ze 133-MHz szyną DDR): Athlon XP 2000+ powinien dorównywać 2000-MHz Pentium 4, choć zegar tego pierwszego to jedynie 1.66 GHz. Praktyka pokazała, że twierdzenia te zasadniczo się sprawdzają, w zależności od modelu Athlona i konkretnego benchmarka. AMD wciąż utrzymuje swoje oznaczenie wydajnościowe, gdyż architektura zaczyna tak bardzo różnić się od technologii Intela, że konieczna jest jakaś podstawa do porównań. Weźmy dla przykładu Athlony XP z rdzeniami Thoroughbred i Barton - ten pierwszy osiąga maksymalnie 2800+ przy zegarze 2.2 GHz i 166-MHz szynie systemowej, drugi natomiast przy tym samym zegarze rdzenia i przy 200-MHz szynie systemowej oferuje już 3200+.

Biorąc pod uwagę premierę procesorów Athlon 64 i 64 FX, AMD raczej nie będzie poświęcać wielkich wysiłków na przedłużenie życia Athlonów XP, wypuszczając nowe modele. Niemniej jednak, Socket A wciąż pozostanie na rynku jeszcze przez kilka (kilkanaście?) miesięcy, skoro procesory z obszaru środka są bardzo rozsądnie wycenione, a platformy dojrzałe.

Za: Wystarczająca wydajność w najbliższym czasie, rozsądna cena procesora i platformy, sprawdzone komponenty; Przeciw: brak widoków na wyjście poza 3200+

AMD Athlon 64

0x08 graphic
0x08 graphic

Gniazdo Athlona 64 ma 754 kontakty. Sam procesor jest umieszczony w podstawce FC-BGA. Metaliczna powierzchnia stanowi rozpraszacz ciepła, pomagający w przenoszeniu ciepła z rdzenia do radiatora.

Zapewne Athlon 64 stanie się podstawowym i masowym produktem AMD. Podczas wrześniowej premiery (w Polsce w październiku 2003) dostępny był model 3200+, a ostatnio pokazał się również 3000+. Intrygujące, że oba procesory pracują z dokładnie 2.0-GHz zegarami - jedyną różnicą jest wielkość pamięci L2 cache: 1 MB w przypadku 3200+ oraz 512 KB w przypadku 3000+. Na 1 MB pamięci podręcznej drugiego poziomu składa się ponad połowa z niemalże 106 milionów tranzystorów Athlona 64.

Aktualna przewaga 64-bitowych Athlonów leży w wydajnym zarządzaniu pamięcią, na co składa się duża pamięć L2 Cache i zintegrowany kontroler pamięci. W przeciwieństwie do konwencjonalnych rozwiązań, w których kontroler pamięci umieszczony jest na płycie, tutaj omija się wolne ścieżki danych - procesor bezpośrednio komunikuje się z pamięcią główną, a kontroler pamięci pracuje z pełną częstotliwością zegara rdzenia.

Tego rodzaju stopień integracji powiększa strukturę Athlonów 64 i podnosi cenę w stosunku do Athlonów XP. To, czy 64-bitowy procesor (3200+) jest warty 400 USD / €, nie jest kwestią wsparcia 64 bitów w zastosowaniach domowych i biurowych. 64-bitowe adresowanie więcej niż 4 GB ma sens jedynie wówczas, jeżeli może być rozsądnie zrealizowane. W dzisiejszych czasach konieczne do tego celu byłyby 3 moduły DIMM (2x 2 GB plus trzeci), co stanowi problem dla Athlonów 64 i ich platform: im więcej zainstalowanych jest modułów pamięci, tym bardziej obniża się szybkość ich pracy. Zegar 200 MHz (DDR400) można uzyskać tylko z jednym obsadzonym modułem.

Najbliższe miesiące nie przyniosą 64-bitowego oprogramowania, co pozostawia te zastosowania w domenie profesjonalnej (Windows 2003 Server 64-Bit Edition). Nam zostaje wysoka wydajność w normalnych warunkach (Windows 2000 lub Windows XP i 32-bitowe oprogramowanie). W zależności od obciążenia, zegar procesora jest wyznaczany na jednym z kilku poziomów, od 800 MHz do 2.0 GHz. Pozwala to na obniżenie poboru energii w okresach nieaktywności i znaczące zmniejszenie wymagań chłodzenia.

Za: szybki, nowoczesna architektura, zarządzanie energią; przeciw: brak 64-bitowego oprogramowania, wysoka cena.

Athlon 64 FX

Athlon 64 FX jest flagowym procesorem biurkowym AMD. Technicznie rdzeń procesora jest niczym więcej, jak Opteronem z dwukrotnie mniejszą pamięcią L2 cache i pozbawionym obsługi pracy wieloprocesorowej. Takiej obsługi pozbawiony jest również Athlon 64. Takie bliskie związki skutkują równowagą punktów za i przeciw. Kluczowe cechy można szybko podsumować: Athlon 64 FX-51 pracuje z zegarem 2.2 GHz, przez co jest o 200 MHz szybszy od Athlona 64 3200+. Potrzebuje innej podstawki (940 kontaktów zamiast 754). Posiada dwukanałowy interfejs pamięci, obsługujący moduły DDR400. Ze względu na konieczność utrzymania stabilności i bliski związek z Opteronem, FX współpracuje jedynie z rejestrowymi modułami DIMM. Taka decyzja została podjęta aby utrzymać sygnały na stale wysokim poziomie i aby odciążyć elektrycznie kontroler pamięci.

Wyniki wydajnościowe są imponujące: system z Athlonem 64 FX pozostawia hiperwątkowe Pentium 4 3.2 GHz w tyle praktycznie w każdym benchmarku. Ma to swoją cenę: kosztując około 750 USD / 780 €, FX jest jednym z najdroższych procesorów x86 na ryku - wyłączywszy serwerowe procesory Itanium i Opteron.

Intel Pentium 4

Niezależnie od stosunku wielu posiadaczu komputerów do P4 Intela, w wielu przypadkach ten lider rynkowy utrzymuje dominację. Modele P4 z 800-MHz szyną systemową (200 MHz w trybie poczwórnej przepływności), z dualną pamięcią DDR400 i hiperwątkowością kończą wszystkie benchmarki na bardzo wysokich miejscach.

Hiperwątkowość (ang. HyperThreading) tworzy szybsze środowisko systemowe dla tych, którzy przełączają się między kilkoma aplikacjami. W Windows HT symuluje system dwuprocesorowy i w idealnych sytuacjach rzeczywiście pozwala na jednoczesne przetwarzanie dwóch wątków. W wyniku tego mocno obciążony system charakteryzuje się lepszym czasem odpowiedzi. Choć pod Windows 2000 hiperwątkowość niewiele pomaga (najlepiej pozostawić ją wyłączoną), pod Windows XP rozwija skrzydła. Aplikacje mogą jednak w niektórych wypadkach pracować wolniej. Zaawansowani użytkownicy pewnie o wiele bardziej będą woleli dwuprocesorowy system od paru punktów procentowych maksymalnej wydajności. Optymalny wybór podczas zakupu Pentium 4 to model z 800-MHz szyną systemową (tylko te modele i model 3.06 GHz mają hiperwątkowość), a także dwa moduły DDR400, każdy o pojemności 256 MB lub więcej. Jeżeli chodzi o platformy, zalecane są chipsety i865PE czy i875P Intela albo nowe 655TX SIS lub PT880 VIA. Wykorzystanie starszych chipsetów albo jednokanałowej pamięci stanowiłoby przykład fałszywej oszczędności.

Intel sprzedaje wszystkie swoje procesory Pentium 4 w wersjach "pudełkowych" wraz z wiatraczkiem. Wiatraczki te są wystarczające we wszystkich przypadkach, a wentylatory są stosunkowo ciche. Ukoronowaniem linii Pentium 4 jest model Extreme Edition, kosztujący astronomiczną sumę 1000 USD, oferujący w zamian 3.2 GHz i 2-MB pamięć podręczną.

Za: szybki, sprawdzona platforma, wiele chipsetów, duży wybór procesorów; przeciw: wysoka cena (zwłaszcza modelu EE, Socket478 prawdopodobnie zniknie w połowie 2004r.)


Możliwości przetaktowywania

Dla wielu użytkowników ważnym kryterium podczas wyboru procesora jest możliwość pracy z wyższym, aniżeli zaleca to producent, zegarem. Mówimy tutaj oczywiście o przetaktowywaniu (overclocking). Do osiągnięcia wyższej częstotliwości zegara prowadzą trzy drogi, które ostatecznie wiążą się ze zmianą dwóch czynników: zegar systemowy, mnożnik, albo oba naraz.

Wybór wyższego mnożnika w przypadku wielu procesorów nie jest możliwy, ponieważ producenci blokują tego rodzaju rodzaj przetaktowywania - w końcu, ich zdaniem, jeżeli użytkownik chce osiągnąć wyższą wydajność, powinien kupić droższy model procesora. Pozostaje więc podniesienie częstotliwości zegara systemowego, co również przyspieszy pracę pozostałych komponentów (AGP, PCI, kontroler IDE, kontroler pamięci). Wiele nowoczesnych płyt głównych daje teraz możliwość elastycznego taktowania różnych komponentów niezależnie od zegara systemowego. Przetaktowywanie nie powinno być postrzegane jako dowiedziona metoda podnoszenia wydajności, jako że nikt nie może zagwarantować stabilnej pracy przetaktowanego systemu.

Nadchodzi Prescott Intela

0x08 graphic
Drugi lutego 2004r.: Intel wypuszcza trzy nowe procesory biurkowe. Pentium 4 z zegarem 3.4 GHz, wersję ekstremalną Pentium 4 Extreme Edition również z zegarem 3.4 GHz oraz mocno wyczekiwany procesor Prescott, od kilku miesięcy będący źródłem przeróżnych plotek.

Gdy nazwa Prescott po raz pierwszy ujrzała światło dzienne, ludzie zaczęli zakładać nadejście procesora Pentium 5, skoro nowy rdzeń odróżnia się od poprzednika - rdzenia Northwood - wieloma rzeczami: 90-nm proces, 1 MB pamięci podręcznej L2 w miejsce 512 KB, podwojenie pamięci podręcznej L1 do 16 KB, 13 nowych instrukcji oznaczanych SSE3 oraz wydłużenie potoku z 20 do 31 etapów, co stanowi część architektury NetBurst. Pomysł brzmi znajomo, jednak ma swoje wady.

Powodem, dla którego Prescott nie otrzymał miana nowej generacji Pentium, mogą być znaczące zmiany architekturalne, mające nadejść w bliskiej przyszłości i to one raczej będą stanowić podstawę nowych Pentium 5. Po targach CeBIT gniazdo Socket 478 zostanie zastąpione gniazdem Socket 775, pojawią się również nowe chipsety obsługujące pamięć DDR II i szynę PCI Express.

Linia chronologiczna procesorów: Od Athlona 1000 do Prescotta

Data

Intel

AMD

02.02.2004

Pentium 4 3.4 GHz, Pentium 4 3.4E GHz
Pentium 4 Extreme Edition 3.4 GHz

06.01.2004

Athlon 64 3400+

24.09.2003

Pentium 4 EE 3.2 GHz

Athlon 64 FX-51 Athlon 64 3200+

23.06.2003

Pentium 4 3.2 GHz

13.05.2003

Athlon XP 3200+

14.04.2003

Pentium 4 3.0 GHz (800 MHz)

10.02.2003

Athlon XP 3000+

14.11.2002

Pentium 4 HT 3.06 GHz

30.09.2002

Athlon XP 2800+

26.08.2002

Pentium 4 2.8 GHz

21.08.2002

Athlon XP 2600+

10.06.2002

Athlon XP 2200+ (0.13 µm)

06.05.2002

Pentium 4 2.53 GHz

02.04.2002

Pentium 4 2.4 GHz

13.03.2002

Athlon XP 2100+

07.01.2002

Pentium 4 2.2 GHz (0.13µm)

Athlon XP 2000+

05.11.2001

Athlon XP 1900+

09.10.2001

Athlon XP 1800+

27.08.2001

Pentium 4 2.0 GHz

04.07.2001

Athlon 1400

30.05.2001

Pentium 4 1.7 GHz

22.03.2001

Athlon 1333

21.11.2000

Pentium 4 1.5 GHz (0.18 µm)

18.10.2000

Athlon 1200

05.06.2000

Athlon 1000 (0.18 µm)

Platforma

Socket A

Socket 754

Socket 940

Socket 478

Procesory

AMD AthlonXP, Duron

AMD Athlon 64

AMD Athlon 64 FX, Opteron

Intel Pentium 4, Pentium 4 Extreme Edition, Celeron od 1.7 GHz

Cena procesora

Niska do średniej

Średnia do wysokiej

Wysoka do bardzo wysokiej

Niska do bardzo wysokiej

Cena płyty głównej

Niska do średniej

Średnia do wysokiej

Średnia do wysokiej

Niska do wysokiej

Wydajność na dzisiaj

Wystarczająca do dobrej*

Bardzo dobra

Bardzo dobra

Wystarczająca do bardzo dobrej*

Możliwości rozbudowy

Niskie

Dobre

Dobre

Dobre do satysfakcjonujących

Długoterminowa wartość

Dobra do satysfakcjonującej

Dobra

Dobra

Dobra

* w zależności od procesora

Październik 2003

Celeron 1,7 GHz 128KB 400MHz FSB Socket 478 IBP

304

Celeron 2,0 GHz 128KB 400MHz FSB Socket 478 IBP

335

Celeron 2,2 GHz 128KB 400MHz FSB Socket 478 IBP

361

Celeron 2,4 GHz 128KB 400MHz FSB Socket 478 IBP

422

Celeron 2,5 GHz 128KB 400MHz FSB Socket 478 IBP

441

Celeron 2,6 GHz 128KB 400MHz FSB Socket 478 IBP

471

Pentium 4 1.8A GHz 512KB 0.13 (Northwood) Socket 478 IBP

664

Pentium 4 2.4GHz 512KB 0.13 (Northwood) Socket 478 IBP

844

Pentium 4 2.4GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

945

Pentium 4 2.66GHz 512KB 0.13 (Northwood) Socket 478 IBP

999

Pentium 4 2.6C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

1148

Pentium 4 2.8GHz 512KB 0.13 (Northwood) Socket 478 IBP

1340

Pentium 4 2.8C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

1432

Pentium 4 3.06GHz 512KB 0.13 (Northwood) Socket 478 IBP

2029

Pentium 4 3.0C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

2099

0x08 graphic
Pentium 4 3.2C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

3169

Duron 1,4GHz

198

Duron 1,6GHz

229

ATHLON XP 2000+ 266MHz FSB

316

ATHLON XP 2000+ 266MHz FSB BOX

381

ATHLON XP 2200+ 266MHz FSB

355

ATHLON XP 2200+ 266MHz FSB BOX

404

ATHLON XP 2400+ 266MHz FSB

405

ATHLON XP 2400+ 266MHz FSB BOX

464

ATHLON XP 2500+ 333MHz FSB

442

ATHLON XP 2500+ 333MHz FSB BOX

509

ATHLON XP 2600+ 333MHz FSB

512

ATHLON XP 2600+ 333MHz FSB BOX

598

ATHLON XP 2800+ 333MHz FSB

889

ATHLON XP 2800+ 333MHz FSB BOX

1045

ATHLON XP 3000+ 333MHz FSB BOX

1469

Marzec 2004

AMD

 

INTEL ®

 

Duron 1,6GHz

184

Celeron 2,0 GHz 128KB 400MHz FSB Socket 478 IBP

318

Duron 1,8GHz

214

Celeron 2,4 GHz 128KB 400MHz FSB Socket 478 IBP

344

ATHLON XP 2000+ 266MHz FSB

281

Celeron 2,6 GHz 128KB 400MHz FSB Socket 478 IBP

439

ATHLON XP 2000+ 266MHz FSB BOX

308

Celeron 2,7 GHz 128KB 400MHz FSB Socket 478 IBP

515

ATHLON XP 2200+ 266MHz FSB

319

Celeron 2,8 GHz 128KB 400MHz FSB Socket 478 IBP

579

ATHLON XP 2200+ 266MHz FSB BOX

359

Pentium 4 2.4C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

795

ATHLON XP 2400+ 266MHz FSB

349

Pentium 4 2.8E GHz 1MB Cache 0.09 HT FSB800 (Prescott) Socket 478 OEM

859

ATHLON XP 2400+ 266MHz FSB BOX

385

Pentium 4 2.8C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

885

ATHLON XP 2500+ 333MHz FSB

398

Pentium 4 2.8E GHz 1MB Cache 0.09 HT FSB800 (Prescott) Socket 478 IBP

945

ATHLON XP 2500+ 333MHz FSB BOX

439

Pentium 4 3.0C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

1079

ATHLON XP 2600+ 333MHz FSB

468

Pentium 4 3.2C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

1359

ATHLON XP 2600+ 333MHz FSB BOX

489

Pentium 4 3.4C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP

1999

ATHLON XP 2700+ 333MHz FSB

499

Athlon XP 3000+ (Barton) 2,167

Athlon XP 2800+ (Barton) 2,083

Athlon XP 2800+ (333 MHz FSB) 2,253

Athlon XP 2700+ (333 MHz FSB) 2,167

Athlon XP 2600+ (333 MHz FSB) 2,083

Athlon XP 2600+ 2,133

Athlon XP 2500+ (Barton) 1,833

Athlon XP 2400+ 2,000

ATHLON XP 2700+ 333MHz FSB BOX

569

ATHLON XP 2800+ 333MHz FSB

598

ATHLON XP 2800+ 333MHz FSB BOX

659

ATHLON XP 3000+ 333MHz FSB BOX

919

ATHLON XP 3200+ 333MHz FSB BOX

1197

ATHLON 64 3000+ HyperTransport BOX

1229

ATHLON 64 3200+ HyperTransport BOX

1549

Procesor AMD Athlon™ 64 Porównanie z konkurencją

Charakterystyka

AMD Athlon™ 64

Pentium® 4

Rok wprowadzenia architektury

2003

2000

Infrastruktura

Socket 754

Socket 478

Technologia wytwarzania

0.13 Mikrona, SOI

0.13 Mikrona

Liczba tranzystorów

105.9 mln

55 mln

Obsługa 64-bitowego zestawu instrukcji

Tak,
technologia AMD64

Nie

Obsługa 32-bitowego zestawu instrukcji

Tak

Tak

Magistrala systemowa

Technologia HyperTransport™, maks. 1600 MHz Pełny dupleks

Magistrala FSB, 800 MHz Półdupleks

Wbudowany kontroler pamięci DDR (MCT)

Tak,
64-bitowy + 8-bitowa korekcja ECC
Moduły PC3200, PC2700, PC2100 lub PC1600

Nie,
odrębne urządzenie logiczne na płycie głównej

Przepustowość komunikacji procesor-system

HyperTransport: maks. 6,4 GB/s
Pamięć: maks. 3,2 GB/s
Łącznie: maks. 9,8 GB/s

Łącznie: maks. 6,4 GB/s

Zintegrowany mostek północny

Tak,
128-bitowa ścieżka danych o częstotliwości rdzenia

Nie,
odrębne urządzenie logiczne na płycie głównej,
64-bitowa ścieżka danych 200 MHz

Wydajna, wbudowana pamięć podręczna

Poziom 1: 128 KB
Poziom 2: 1024 KB (exclusive)
Całkowita pamięć podręczna: 1152 KB

Poziom 1: 12 KB śledzenie mikrooperacji + 8 KB dane
Poziom 2: 512 KB (inclusive)
Całkowita pamięć podręczna: 512 KB

Instrukcje przetwarzania grafiki trójwymiarowej
i multimediów

3DNow!™ Professional, SSE2

SSE, SSE2

0x08 graphic
0x08 graphic


Gniazdo Athlona 64 ma 754 kontakty. Sam procesor jest umieszczony w podstawce FC-BGA. Metaliczna powierzchnia stanowi rozpraszacz ciepła, pomagający w przenoszeniu ciepła z rdzenia do radiatora.

0x08 graphic
Prescott Intela

0x08 graphic
0x08 graphic

0x08 graphic

0x08 graphic
0x08 graphic


Procesory 2005/2006

Źródło numer 1

Źródło: www.tomshardware.pl 1 sierpnia 2005

Istnieją dwie strony rynku procesorów. Pierwsza z nich to ta z high-endowymi komputerami PC wyposażonymi w potężne i prestiżowe układy firm AMD i Intel, które na przemian obejmują prymat. Druga strona to ta, na którą składają się masowo produkowane komputery, uproszczone do minimum. Takie komputery, kosztem obniżonej wydajności i możliwości, mają być dostępna po niskiej cenie. Aby zagospodarować tę właśnie, niemniej istotną sferę biznesową, której zarówno media, jak i wielu użytkowników nie dostrzega, Intel oraz AMD stworzyły swoje tanie marki. W przypadku AMD najpierw miał to być Duron, a teraz jest to Sempron. U Intela rolę tę pełnią niezbyt atrakcyjne procesory Celeron. Obie rodziny układów są porównywalne ze swoim rodzeństwem z wyższej półki, czyli Athlonem 64 i Pentium 4, jednak odznaczają się znacznie niższą szybkością i ograniczonymi możliwościami. I tak na przykład - procesory Athlon 64 mają od 512 KB do 1 MB pamięci podręcznej L2 i są taktowane z częstotliwością do 2,8 GHz (FX-57). Z kolei dla Sempronów przewidziano od 128 do 256 pamięci cache L2 i taktowanie od 1,6 do 2,0 GHz. Podobnie sprawa wygląda w przypadku Intela. Najszybsze Celerony mają zegar 3,06 GHz, 256 KB pamięci cache L2 oraz magistralę systemową 133 MHz, podczas gdy P4 osiąga szybkość 3,8 GHz, 2 MB cache L2, a kilka modeli ma magistralę 266 MHz. Tanie procesory można produkować na dwa sposoby. Albo można stworzyć nowy układ z małą pamięcią cache L2, bazowany na starej architekturze, tak by wycisnąć jak najwięcej układów z płytki krzemowej. Można też posługując się tym samym krzemem z którego tworzy się drogie procesory, obniżyć ilość pamięci cache L2 i wyłączyć niektóre możliwości. Wydajność procesu produkcyjnego w tym przypadku nie jest dużym problemem, ponieważ szybkości zegara i tak są stosunkowo niskie.

Procesory Sempron dostępne są w wersjach dla podstawek Socket A (462) i 754, przy czym wersja Socket A to nic innego jak uproszczony układ Athlon XP Thoroughbred-B, którego przechrzczono na Semprona. Dlatego Semprony w wersji dla gniazda Socket A działają na każdej płycie głównej z podstawką Socket A, która obsługuje FSB333, czasem nawet niepotrzebna jest aktualizacja BIOS-u.

Przebiegłość tego posunięcia można zrozumieć, przyglądając się rynkowi komputerowemu w Chinach, czy w innych krajach rozwijających się ekonomicznie, np. w Ameryce Południowej. Tutaj właśnie dominują tanie systemy, które zapewniają duży popyt na tanie procesory AMD. Dużą rolę odgrywają tu płyty główne z gniazdem Socket A, których niskie ceny, spowodowane nieuchronnym przejściem tej platformy do lamusa, są nie do przebicia.

Równolegle, procesory Sempron w wersji Socket 754 czerpią z kapitału rodziny procesorów AMD64. Po pierwsze są wyposażone w zintegrowany kontroler pamięci DDR400, który działa z pełną szybkością zegara i pozwala podnieść wydajność systemu. W dodatku Semprony w wersji Socket 754, w przeciwieństwie do modeli Socket A, obsługują również rozszerzenia SSE2. No i wreszcie kusząca jest możliwość wymiany taniego Semprona 754 na Athlona 64, i zwiększenia szybkości taktowania nawet do 3700+.

Jednak dalsze losy gniazda Socket 754 są przesądzone - zostanie ono wyparte przez Socket 939 oraz Socket M2, które mają pojawić się na początku przyszłego roku. W rezultacie, nowa generacja Sempronów obsługiwała będzie pamięci dwukanałowe. Patrząc z tej perspektywy, zakup systemu z podstawką Socket 754 nie pozwoli wam w przyszłości na stosowanie układów dwurdzeniowych.

Ten nowy układ bazuje na wykonanym w procesie 90 nm rdzeniu Palermo firmy AMD i posiada 256 kB pamięci cache L2. Jak wykazały nasze testy, wielkość pamięci podręcznej L2 nie ma większego znaczenia, ale to właśnie jej pojemność decyduje o przynależności układu do danej rodziny procesorów. Największą różnicę w wydajności daje częstotliwość zegara.

Współczynnik TDP (Thermal Design Power) nie uległ zmianie - wciąż wynosi 66 watów. Zauważyliśmy jednak, że temperatura rdzenia jest trochę niższa w porównaniu do Sempronów bazujących na 130-nametrowym rdzeniu Paris. W porównaniu do Oakville'a różnice są, zgodnie z oczekiwaniami, minimalne.

Prawdziwą nowością, poza przywróceniem większej ilości pamięci cache L2, jest wprowadzenie 64-bitowych rozszerzeń AMD 64. Przypuszczamy, że były one integralną częścią tych procesorów AMD, jednak, aż do teraz, były dezaktywowane. Tak więc właściciele Semprona 64 (ale tylko w wersji 3400+) mogą zainstalować Windows XP x64, podobnie jak właściciele procesorów Athlon 64 i Pentium 4 600. Niestety, platformy Socket 754 obsługiwać będą nie więcej niż kilka gigabajtów pamięci RAM.

Najnowszy Sempron, sprzedawany hurtowo po 1000 sztuk, będzie kosztował 134 dolary za sztukę, co czyni go najdroższym z tanich procesorów w ofercie firmy AMD. Dzięki szybkości 2 GHz powinien być on porównywalny z Athlonem 64 3000+ dla gniazda Socket 939, którego szybkość wynosi 1,8 GHz i który obsługuje dwukanałową pamięć DDR400. To rodzi się tu ciekawe pytanie - czy tani układ dla gniazda Socket 939 nie byłby lepszym rozwiązaniem?

Istnieje znacznie większa różnorodność procesorów i płyt głównych na platformę Socket 939, ma ona również większe możliwości i, o czym już mówiliśmy, lepsze możliwości rozbudowy. Jedyną wadą są wyższe koszty tej platformy, które mają decydujące znaczenie dla wielu klientów. Przecież, jeśli maszyną będzie przeznaczona głównie do aplikacji biurowych, to nieważne jakiego systemu użyjemy, praktycznie wszystkie zestawy będą wystarczająco szybkie.

W przeciwieństwie do Athlonów 64, linia układów Sempron dla gniazda Socket 754 jest wciąż na tyle nieskomplikowana, że można ją łatwo prześledzić:

CPU

Rdzeń/Proces

Cache

Funkcjonalności

Częstotliwość taktowania zegara/TDP

Sempron 2500+

Palermo / 90 nm

128 kB

NX, SSE, SSE2, SSE3

1,4 GHz / 62 W

Sempron 2600+

Oakville / 90 nm

128 kB

NX, SSE, SSE2

1,6 GHz / 62 W

Sempron 2600+

Palermo / 90 nm

128 kB

NX, SSE, SSE2, SSE3

1,6 GHz / 62 W

Sempron 2800+

Oakville / 90 nm

256 kB

NX, SSE, SSE2

1,6 GHz / 62 W

Sempron 2800+

Palermo / 90 nm

256 kB

NX, SSE, SSE2, SSE3

1,6 GHz / 62 W

Sempron 3000+

Oakville / 90nm

128 kB

NX, SSE, SSE2, Cool & Quiet

1,8 GHz / 62 W

Sempron 3000+

Palermo / 90nm

128 kB

NX, SSE, SSE2, SSE3, Cool & Quiet

1,8 GHz / 62 W

Sempron 3100+

Paris / 130 nm

256 kB

NX, SSE, SSE2, Cool & Quiet

1,8 GHz / 62 W

Sempron 3100+

Oakville / 90 nm

256 kB

NX, SSE, SSE2, SSE3, Cool & Quiet

1,8 GHz / 62 W

Sempron 3100+

Palermo / 90 nm

256 kB

NX, SSE, SSE2, SSE3, Cool & Quiet

1,8 GHz / 62 W

Sempron 3300+

Oakville / 90 nm

128 kB

NX, SSE, SSE2, Cool & Quiet

2,0 GHz / 62 W

Sempron 3300+

Palermo / 90 nm

128 kB

NX, SSE, SSE2, Cool & Quiet

2,0 GHz / 62 W

Sempron 3400+

Palermo / 90 nm

256 kB

NX, SSE, SSE2, SSE3, Cool & Quiet, AMD64

2,0 GHz / 62 W

Pierwszym dostępnym procesorem z rodziny Sempron był układ 3100+, bazujący na rdzeniu Paris 130 nm (CG). Ten układ był pierwszym krokiem AMD przy wprowadzaniu nowej rodziny tanich procesorów. Rdzeń Oakville (stepping D0), wprowadzony w kwietniu 2005, był pierwszym układem wykonanym w technologii 90 nm. Wszystkie Rdzenie Oakvlle posiadają 256 kB pamięci cache L2 i obsługują rozszerzenia SSE3, ale tylko część modeli używa całej pamięci L2 - układy Sempron 2600+, 3000+ i 3300+ korzystają jedynie ze 128 kB.

Nowy Sempron 3400+ to kolejny rdzeń, który, chociaż wciąż bazuje na technologii 90 nm, wprowadza poprawiony kontroler pamięci, czyli rozwiązanie znane z rdzeni Venice i San Diego stosowanych w Athlonach 64. Rdzeń został rozszerzony również o zestaw instrukcji SSE3 (rewizja E3 i E)  wprowadzonych przez Intela na początku 2004 roku. Rdzeń Palermo dostępny będzie we wszystkich wolniejszych procesorach, ale architektura AMD64 jeszcze przez jakiś czas nie będzie dostępna.

Jeszcze słówko o technologii Cool & Quiet. Firma AMD udostępnia tę cechę tylko dla procesorów 3000+ wzwyż. Wymaga ona odpowiedniego sterownika procesora (do ściągnięcia ze strony AMD), a po włączeniu daje systemowi operacyjnemu możliwość zmniejszenia częstotliwości taktowania zegara, co zmniejsza zużycie energii oraz wydzielanie ciepła. Rozwiązanie to różni się całkowicie od strategii Intela, ponieważ zarówno stacjonarne, jak i mobilne Celerony D nie są w stanie dynamicznie zmieniać częstotliwości taktowania zegara. Tylko procesory Pentium 4 600 powyżej 3 Ghz oraz układy Pentium M są wyposażone w technologię SpeedStep.

0x01 graphic

0x01 graphic

Info o artykule 

0x01 graphic

Kiepski kompromis - 64 bitowy Sempron 3400+ AMD

0x01 graphic

Stworzono:
1 sierpnia 2005

0x01 graphic

Autor:
Patrick Schmid
Achim Roos

0x01 graphic

Tłumacz:
Izabela Jędrasiak

0x01 graphic

Kategoria:
Procesory

0x01 graphic

Podsumowanie:
Najnowszy Sempron 3400+ będący odpowiedzią na Celerona D 351 Intela, został wyposażony w większą pamięć podręczną i architekturę AMD64. Brzmi to wszystko bardzo pięknie, ale czy nie lepiej wybrać najtańszego Athlona 64?

Sempron 3400+

0x01 graphic

Oto i on. Oczywiście wyglądem nie różni się zbytnio od swoich poprzedników, ponieważ wszystkie procesory AMD wyposażone są w metalową płytkę przykrywającą rdzeń, o nazwie heat spreader (radiator), która uniemożliwia nam obejrzenie układu. Płytka jest przymocowana do struktury za pomocą nakładki żelowej lub pasty termoprzewodzącej, które pomagają rozpraszać ciepło na większą powierzchnię. Pełni również rolę doskonałego zabezpieczenia, gdyż już nie jeden Athlon XP czy Duron padł ofiarą nieumiejętnych prób montażu coolera. Intel wprowadził podobne radiatory dopiero w momencie premiery układów Pentium 4.

Zdecydowaliśmy się dołączyć wyniki testów trzech Athlonów 64, celem porównania z Sempronami 3300+ i 3400+. Oba modele najtańszych Athlonów 64 na platformę Socket 939 są niewiele droższe od Semprona 3400+, a posiadają całe 512 kB pamięci cache L2 i dwukanałowy interfejs pamięci DDR400. Różnice w kosztach między platformi zaczynają się od 15 dolarów i rosną do znacznych sum, w zależności od opcji jakich sobie zażyczycie.

Zdecydowaliśmy się też na porównanie nowego Semprona z Athlonem 64 3200+ w wersji Socket 754 bazującym na architekturze Newcastle, ponieważ ten Athlon jest odpowiednikiem Semprona o tej samej częstotliwości taktowania zegara. Wprawdzie Newcastle to technologia 130 nm i bez SSE3, ale nie widzieliśmy jeszcze Athlona 64 w technologii 90 nm w wersji Socket 754.

Wprowadzenie 64-bitowego Semprona jest odpowiedzią na 64-bitowy układ Celeron Intela, a wszystko po to, by spełnić wymagania użytkowników o mniej pojemnych kieszeniach. Wydaje nam się jednak, że korzyści z niego wyniesie, przynajmniej na dłuższą metę niewielu nabywców. Mimo, że 64-bitowy Windows XP x64 Edition jest już dostępny, to jednak wciąż brakuje 64-bitowego oprogramowania i sterowników, szczególnie dla urządzeń peryferyjnych. Przejście na nową technologię właśnie teraz, ot tak dla zasady, ma sens jedynie w przypadku branży IT, ale nie dla indywidualnego użytkownika. Poza tym, większość użytkowników korporacyjnych nie zaczęło jeszcze nawet sprawdzać możliwości wykorzystania przez użytkowników końcowych 64-bitowych Windowsów.

Poza czarnym koniem tego układu, czyli 64-bitowej architektury, nowy procesor ma niewiele nowego do zaoferowania. Ulepszenie Semprona 3300+ do 3400+ sprowadziło się głównie do podwojenia pojemności pamięci cache L2 ze 128 do 256 kB, co jak można się było spodziewać, niewiele zmieniło.

Jeśli jesteście zdecydowani na procesor Sempron, to polecamy wam najnowszy rdzeń Palermo, głównie z uwagi na to, że obsługuje rozszerzenia SSE3. Dopóki architektura 64-bitowa nie będzie wam potrzebna, nie ma sensu przerzucać się na model 3400+. Jednak, z punktu widzenia wydajności i stosunku możliwości do ceny, dobrym wyborem jest wciąż tani Athlon 64 razem z rozsądnie dobraną platformą Socket 939.

czerwiec 2005

Pojawienie się nowego Athlona idzie w parze z pierwszą modernizacją technologiczną, jaka ma miejsce od momentu pojawienia się procesorów z serii FX, przeznaczonych dla segmentu high-end. Poprzednie procesory z tej serii bazowały na rdzeniu Clawhammer, wykonanym w procesie 130 nm, natomiast model FX-57 jest wyposażony w rdzeń o nazwie kodowej San Diego i powstał w oparciu o technologię 90 nm. Dzięki temu zabiegowi, możemy spodziewać się, że nowy produkt zaoferuje większą wydajność, przy zachowaniu niezmienionej charakterystyki cieplnej.

W chwili obecnej dostępne są trzy różne rdzenie, wyprodukowane w procesie 90 nm. Pierwszą konstrukcją, w której zastosowanie nowej technologii pozwoliło obniżyć ilość wydzielanego ciepła przy niskich i średnich częstotliwościach taktowania, był układ o nazwie Winchester (512 kB pamięci podręcznej L2, rozpraszanie cieplne na poziomie 67 W przy częstotliwości taktowania 2,2 GHz). Obecnie jednak nasza uwaga skupia się na dwóch pozostałych rdzeniach, a mianowicie Venice (512 kB pamięci cache L2) oraz San Diego (1 MB). To właśnie one mają zastąpić podstarzałe technologicznie konstrukcje Clawhammer oraz Newcastle. Kwestią wartą wspomnienia jest także fakt, że nowe rdzenie zostały wyposażone w zestaw rozszerzonych instrukcji SSE3, przydatnych w przypadku niektórych aplikacji profesjonalnych. AMD zamierza zastosować dwa powyżej wymienione układy w nowych procesorach z serii Athlon 64 i 64 FX.

Rdzeń o nazwie San Diego jest najbardziej złożoną konstrukcją, spośród układów wykonanych w technologii 90 nm. Jest on oparty o najnowszy stepping E4, obsługuje rozszerzone instrukcje SSE3 i posiada 1 MB pamięci cache L2. W nowych rdzeniach San Diego oraz Venice zmodyfikowano nieco kontroler pamięci, co wpłynęło korzystnie na wydajność. Dodatkową zaletą, wynikającą z wprowadzonych zmian jest możliwość zastosowania w systemie czterech dwustronnych modułów pamięci DIMM DDR400, co do tej pory zwykło sprawiać problemy.

Zmianie nie uległa podstawka procesora Socket 939 oraz magistrala Hyper Transport, odpowiadająca za komunikację procesora z chipsetem, która działa z częstotliwością 1 GHz w trybie dwukierunkowym (full-duplex). Nowy procesor oferuje wsparcie dla instrukcji 3DNow! Professional, MMX, SSE oraz SSE3. Nie należy także zapominać o ochronie antywirusowej (NX bit) oraz technologii Cool'n'Quiet, pozwalającej modyfikować w locie częstotliwość taktowania procesora. Monitorowaniem obciążenia CPU zajmuje się system operacyjny, wykorzystując do tego celu specjalny, dedykowany sterownik. Procesory Athlon 64 mogą pracować na dwóch, trzech, bądź czterech poziomach wydajności (tzw. P-states). Najniższe taktowanie wynosi 800 lub 1000 MHz, w zależności od modelu. Działając na najniższym poziomie wydajności, ilość wydzielanej przez procesor energii cieplnej zostaje zredukowana niemal o połowę. Dzięki zmniejszeniu poboru mocy, a co za tym idzie - ilości generowanego ciepła, nie trzeba stosować bardzo wydajnych i drogich systemów chłodzenia.

Z punktu widzenia architektury układu, nic się nie zmieniło. Wszystkie niezbędne szczegóły możecie znaleźć w naszym pierwszym artykule, poświęconym procesorom Athlon 64 oraz Athlon 64 FX.

Procesory AMD 64 zestawienie właściwości i cen

Procesor

Model

Zegar

Pamięć cache

Rdzeń, TDP

Cena

Athlon 64

3000+

1,8 GHz

512 kB

90 nm Venice
67 W

149 USD

Athlon 64

3000+

1,8 GHz

512 kB

90 nm Winchester
67 W

149 USD

Athlon 64

3000+

1,8 GHz

512 kB

130 nm Newcastle
89 W

149 USD

Athlon 64

3200+

2,0 GHz

512 kB

90 nm Venice
67 W

194 USD

Athlon 64

3200+

2,0 GHz

512 kB

90 nm Winchester
67 W

194 USD

Athlon 64

3200+

2,0 GHz

512 kB

90 nm Newcastle
89 W

194 USD

Athlon 64

3500+

2,2 GHz

512 kB

90 nm Venice
67 W

272 USD

Athlon 64

3500+

2,2 GHz

512 kB

90 nm Winchester
67 W

272 USD

Athlon 64

3500+

2,2 GHz

512 kB

130 nm Newcastle
89 W

272 USD

Athlon 64

3700+

2,2 GHz

1 MB

90 nm San Diego
104 W

329 USD

Athlon 64

3800+

2,4 GHz

512 kB

90 nm Venice
85 W

373 USD

Athlon 64

3800+

2,4 GHz

512 kB

130 nm Newcastle
89 W

373 USD

Athlon 64

4000+

2,4 GHz

1 MB

130 nm Clawhammer
89 W

482 USD

Athlon 64

4000+

2,4 GHz

1 MB

90 nm San Diego
104 W

582 USD

Athlon 64 X2

4200+

2,2 GHz

2x 512 kB

90 nm Manchester
110 W

537 USD

Athlon 64 X2

4400+

2,2 GHz

2x 1 MB

90 nm Toledo
110 W

581 USD

Athlon 64 X2

4600+

2,4 GHz

2x 512 kB

90 nm Manchester
110 W

803 USD

Athlon 64 X2

4800+

2,4 GHz

2x 1 MB

90 nm Toledo
110 W

1001 USD

Athlon 64

FX-55

2,6 GHz

1 MB

90 nm San Diego
104 W

1031 USD

Athlon 64

FX-55

2,6 GHz

1 MB

130 nm Clawhammer
89 W

827 USD

Athlon 64

FX-57

2,8 GHz

1 MB

90 nm San Diego
104 W

1031 USD

Powyżej zamieszczone zostało pełne zestawienie procesorów Athlon 64, dostępnych dla podstawki Socket 939. (Aby zachować rozsądne rozmiary tabeli, zdecydowaliśmy się pominąć procesory oparte o Socket 754, jak również Semprony.) Jeśli planujecie zakup procesora Athlon 64, zdecydowanie polecamy skupić się na modelach wyposażonych w nowe rdzenie - Venice (512 kB cache L2) oraz San Diego (1 MB). Dzięki zastosowaniu procesu 90 nm, obie konstrukcje gospodarują oszczędniej energią, a więc są znacznie chłodniejsze od wersji 130 nm oraz bardziej podatne na przetaktowanie. Zaletą jest także zaimplementowana obsługa instrukcji SSE3.

W obecnej chwili Intel nie posiada w swoim arsenale konstrukcji jednordzeniowych niczego, czym mógłby się rzeczywiście przeciwstawić AMD. Można oczywiście przyśpieszyć procesor Pentium 4 Prescott do 4 GHz, jednak będzie to oznaczało zaledwie 5-procentowy wzrost szybkości zegara, w porównaniu do modeli 570 i 670 (taktowanie 3,8 GHz). Tak niewielka zmiana nie będzie miała w zasadzie żadnego znaczenia dla wydajności procesora.

Właśnie dlatego zainteresowanie Intela skupia się w chwili obecnej na układach dwurdzeniowych Pentium D i na procesorach Pentium Extreme Edition. Procesory Pentium D, oparte na rdzeniu Smithfield, łączą w sobie dwie struktury typu Pentium 4 Prescott, natomiast w układach EE dodano obsługę Hyper Threading. Tradycyjnie, cena modeli z serii Extreme Edition utrzymuje się na poziomie 999 USD, a grupę docelową tych układów stanowią gracze oraz entuzjaści, nie przejmujący się wydatkami.

Z technicznego punktu widzenia, dwurdzeniowy układ Pentium Extreme Edition zapowiada się całkiem interesująco. Procesor ten, wyposażony w dwa rdzenie oraz technologię Hyper Threading, daje nam do dyspozycji do czterech logicznych jednostek obliczeniowych. Zalety HT stają się tym widoczniejsze, im więcej aplikacji zdecydujemy się jednocześnie uruchomić. Szkoda tylko, że rozwiązanie takie nie przyniesie praktycznie żadnej korzyści graczom, do których zasadniczo skierowany jest ten procesor.

W przypadku Pentium D, sytuacja wygląda inaczej. Seria ta obejmuje trzy modele oznaczone odpowiednio 820, 830 i 840, których częstotliwość taktowania zawiera się w przedziale od 2,8 do 3,2 GHz. Cenowo wypadają one bardzo korzystnie na tle szybkich układów jednordzeniowych, deklasując również w tym względzie dwurdzeniowe Athlony 64 X2. W związku z tym, że spora część dostępnego obecnie oprogramowania jest już zoptymalizowana pod kątem wielowątkowości, celem Intela stało się teraz zajęcie dużej części rynku systemów dwurdzeniowych, w czym znaczącą rolę ma odegrać atrakcyjny cenowo procesor Pentium D.

Wprowadzenie dwurdzeniowych procesorów przeznaczonych dla komputerów stacjonarnych, planowane na 31 maja, sprawia, że końcówka tego miesiąca zapowiada się bardzo interesująco. Oczywiście już w dniu dzisiejszym dostępny jest w niewielkich ilościach wielowątkowy model Pentium Extreme Edition 840, czego przykładem może być chociażby oferta firmy Dell, jednak najbardziej oczekiwany - Pentium D, ujrzy światło dzienne nie wcześniej niż w czerwcu. Tymczasem AMD pokonało Intela w zyskownym segmencie stacji roboczych oraz serwerów wprowadzając swoje dwurdzeniowe procesory Opteron z serii x65/x70/x75. Kolejny element strategii AMD na rok 2005, obejmuje wprowadzenie dwurdzeniowego produktu, przeznaczonego dla komputerów stacjonarnych. Temu właśnie tematowi poświęciliśmy ten artykuł.

Pierwsza niespodzianka, jaka nas spotkała, dotyczy kwestii związanych z odprowadzaniem ciepła, generowanego przez dwa rdzenie tworzące jeden fizyczny układ scalony. Otóż w przeciwieństwie do Intela, AMD nie obniżyło taktowania. Oznacza to, że dwurdzeniowe procesory AMD powinny pracować z taką samą częstotliwością taktowania zegara jak wersje jednordzeniowe. W przypadku Intela sprawa wygląda inaczej. Producent zdecydował, że najszybszy dwurdzeniowy model pracować będzie z zegarem 3,2 GHz, natomiast jednordzeniowy - 3,8 GHz.

Przejście z procesu technologicznego 130 nm do procesu 90 nm wykorzystującego technologię SOI (krzem-na-izolatorze) pozwoliło AMD obniżyć poziom rozpraszania cieplnego (TDP) z 89 W (wartość maksymalna) do 67 W, przy częstotliwości 2,2 GHz (Winchester 3500+). Jednocześnie, charakterystyka cieplna układu Athlon 64 FX 55, taktowanego zegarem 2,6 GHz, jest na tyle elastyczna, że pozwala na zastosowanie procesorów dwurdzeniowych na większości obecnych na rynku płyt głównych z gniazdem socket 939. Inaczej jest w przypadku procesora Pentium D, który mimo, że konstrukcja samej podstawki nie uległa zmianie, wymaga zastosowania zupełnie nowych płyt głównych.

Rodzina procesorów dwurdzeniowych, przeznaczonych dla komputerów stacjonarnych obejmuje cztery produkty, występujące pod wspólną nazwą Athlon 64 X2 (W przypadku Intela będą to trzy procesory z serii Pentium D oraz model Extreme Edition.). Oficjalną datę premiery AMD ustaliło na dzień 31 maja. Dwa modele z serii X2 będą oparte na dwurdzeniowym układzie o nazwie kodowej Manchester, wyposażonym w 512 kB pamięci cache L2 dla każdego rdzenia. W dwóch pozostałych układach wykorzystano konstrukcję Toledo, z 1 MB pamięci podręcznej L2 dla każdej jednostki logicznej.

W przypadku modeli przeznaczonych na rynek masowy, opartych na rdzeniu Manchester, ilość wydzielanego ciepła utrzyma się na poziomie 95 W, natomiast dla bardziej wydajnych wersji, wartością maksymalną będzie 110 W. Wymaganiom tym z łatwością sprostają wszystkie płyty główne, będące w stanie obsłużyć Athlona 64 FX 55. Choć liczby te uzmysławiają nam, że wymagania procesora są dość pokaźne, to nie powinniśmy zapominać, że najmocniejszy model Intela, działający z częstotliwością 3,2 GHz, osiąga niebotyczny poziom poboru mocy dochodzący do 130 W, a także przeciętny pobór jest nieco wyższy. Ciekawy jest natomiast fakt, że obie firmy idą "łeb w łeb", w przypadku modeli przeznaczonych dla zastosowań masowych, dla których pobór mocy utrzymuje się na poziomie 95 W.

Każdy współczesny system operacyjny potrafi wykonać wiele operacji w jednym czasie, rozdzielając obciążenie związane z wykonaniem zadań, pomiędzy wszystkie dostępne procesory logiczne (tzw. multi-tasking czyli wielozadaniowość). Jeśli istnieje taka możliwość, system operacyjny dokonuje podziału obciążenia na dużo niższym poziomie, bazując na wątkach (tzw. multi-threading czyli wielowątkowość). Dzięki temu, że współczesne komputery są w stanie działać wielozadaniowo, użytkownicy mogą uruchamiać wiele aplikacji jednocześnie oraz rozmaite usługi systemowe, bez zauważalnych strat w wydajności pracy komputera. Od kiedy tylko AMD i Intel zaczęły ze sobą konkurować, zwiększały częstotliwość taktowania swoich układów. Jednak żaden z uzyskanych w ten sposób przyrostów wydajności nie był tak wysoki, jak ten który można będzie osiągnąć stosując przetwarzanie wielowątkowe (multi-threading).

Przez pewien czas mogliśmy być świadkami szumu, jaki powstał wokół układów dwurdzeniowych. Ich pojawienie się możemy jednak uznać za najbardziej znaczący krok w rozwoju procesorów, w perspektywie wielu kolejnych lat i to niezależnie od tego czy waszym faworytem jest AMD czy Intel. Komputer, wyposażony w jedną z tych dwugłowych bestii, będzie w stanie osiągnąć wydajność zbliżoną do możliwości systemu z dwoma osobnymi procesorami.

Wprowadzając w 2002 roku technologię Hyper Threading (HT), Intel starał się wykorzystać korzyści płynące z posiadania dwóch w pełni funkcjonalnych procesorów, umieszczonych w jednym układzie. Najważniejszym powodem, dla wprowadzenia technologii HT do architektury Pentium 4, był postępujący wyścig częstotliwości taktowania. Osiągnięty już został oszałamiający pułap 3,06 GHz, a potok wykonawczy, liczący 20 etapów, zrobił się nieco przydługawy. Z kolei, potok wykonawczy procesora AMD Athlona XP składał się z 10-ciu etapów dla jednostki arytmetyczno-logicznej (ALU), oraz 15-stu etapów dla jednostki zmiennoprzecinkowej (FPU). Pentium III pokonywało 10 etapów, a wersje oparte na rdzeniu Tualatin oraz modele Pentium M - 12. Athlon 64 również cechował się 12-etapowym potokiem.

Z jednej strony, procesor posiadający długi potok wykonawczy, jest w stanie wykonać wiele czynności w ramach jednego cyklu przetwarzania. Jest to szczególnie pożądane, gdy w grę wchodzi wykorzystanie rozszerzonych instrukcji SSE2 i SSE3. Z drugiej strony jednak, każda operacja oznacza dla procesora konieczność przejścia przez większość z tych etapów, co może niewątpliwie skutkować stratą cennych cykli zegara. Aby częściowo zrekompensować ten efekt, Intel zaimplementował strukturę logiczną, która umożliwia procesorowi Pentium 4 osiągnięcie wyższego, przeciętnego poziomu wykorzystania potoku wykonawczego - którego długość w architekturze Prescott wzrosła do 31 etapów - przez symulowanie obecności dwóch logicznych jednostek obliczeniowych.

Procesor wyposażony w technologię Hyper Threading nie jest w stanie osiągnąć wydajności zbliżonej do systemu dwuprocesorowego, ale pozwala uniknąć sytuacji, w której jakaś aplikacja obciążając w bardzo dużym stopniu procesor, powoduje paraliż całego systemu (co prowadzi do pojawienia się irytującego komunikatu "Program nie odpowiada"). Jeśli zdarzyło Wam się pracować na komputerze wyposażonym w dwa procesory, z procesorem wyposażonym w technologię HT, to pewnie zauważyliście, że system utrzymuje stałą gotowość do reagowania na działania użytkownika - właśnie na to pozwala Hyper Threading. W niektórych aplikacjach zastosowanie HT pozwoli zaobserwować wzrost szybkości działania, podczas gdy w innych wręcz spowolnienie. Zasadniczo jednak nie zauważycie większej różnicy w działaniu pomiędzy procesorem wyposażonym w tę technologię, a zwykłym procesorem.

Intel jest dumny ze technologii Hyper Threading i traktuje ją jako istotny etap pośredni pomiędzy układami jedno- i wielordzeniowymi. Technologia ta, jak twierdzi firma, utorowała drogę do rozwoju aplikacji opartych na wątkach, których uruchomienie na maszynach wyposażonych w HT, umożliwia osiągnięcie znacznego przyrostu wydajności pracy komputera. Faktem jest, że Intel zrobił wiele, aby spopularyzować programowanie ukierunkowane na wielowątkowość. Z kolei AMD zawsze twierdziło, że Hyper Threading to rozwiązanie tymczasowe i w przyszłości nie będzie już ono potrzebne i właśnie dlatego żaden z procesorów AMD nie został wyposażony w tą technologię.

Prawda, jak zwykle, leży pośrodku. W przypadku wykorzystania komputera do gier, użytkownik zwykle nie uruchamia kilku aplikacji w tym samym czasie, pozwalając procesorowi skoncentrować się na tej jednej, najważniejszej. Z kolei osoby używające komputera do zastosowań profesjonalnych najprawdopodobniej będą chciały mieć możliwość skorzystania z kilku działających jednocześnie programów. W tej sytuacji pomocny okaże się Hyper Threading. Co więcej, któż z nas nie korzysta obecnie z programu antywirusowego oraz/lub zapory ogniowej (firewalla). Jak długo liczba działających w tle usług, i poziom ich aktywności, nie przekracza pewnej wartości granicznej, tak długo jednordzeniowy procesor, pozbawiony HT, poradzi sobie z nimi bez większych problemów, a użytkownik nawet tego nie zauważy. Jednakże, im bardziej wzrasta ilość zadań, które system musi wykonywać w tym samym czasie, tym bardziej obecność Hyper Threading jest pożądana. Te same spostrzeżenia odnoszą się do sytuacji, w której mamy do czynienia z dwoma rdzeniami. Wróćmy zatem do głównego tematu, któremu poświęcony jest ten artykuł.

Źródło numer 2

Przegląd procesorów - maj 2005 - http://www.benchmark.pl/r.php?file=http://www.benchmark.pl/artykuly/testy/przeglad_procesorow2005/slowniczek.html

Wstęp

Niniejszy przegląd skupia się na współcześnie oferowanych procesorach i nie próbuje w żadnym razie być źródłem historycznym. Dlatego nie znajdziecie w nim charakterystyk serii procesorów, które nie są już rozwijane. Pozwoliliśmy więc sobie pominąć takie platformy, jak Socket A, 64-bitowe Athlony dla Socket 754 oraz starsze modele Celeronów i Pentium 4.

Tabelka segmentacji procesorów

model

segment odbiorców

częstotliwość
taktowania

liczba
rdzeni

data
premiery

Intel

 

 

 

Celeron D

budżetowy

2.2 - 3.0 GHz

1

czerwiec 2004

Pentium 4 500

masowy

2.8 - 3.8 GHz

1

luty 2004

Pentium 4 600

masowy

3,0 - 3.6 GHz

1

luty 2005

Pentium D

wydajnościowy

2.8 - 3.2 GHz

2

maj 2005

Pentium 4 EE

dla entuzjastów

3.7 GHz

1

luty 2005

Pentium EE

dla entuzjastów

3.2 GHz

2

maj 2005

 

 

 

 

model

segment odbiorców

częstotliwość
taktowania

liczba
rdzeni

data
premiery

AMD

 

 

 

 

Sempron (754)

budżetowy

1.6 - 1.8 GHz

1

lipiec 2004

Athlon 64 (939)

masowy

1.8 - 2.4 GHz

1

czerwiec 2004

Athlon X2

wydajnościowy

2.2 - 2.4 GHz

2

maj 2005

Athlon FX

dla entuzjastów

2.2 - 2.6 GHz

1

wrzesień 2003

UWAGA: Nie należy porównywać wydajności różnych modeli procesorów wyłącznie na podstawie częstotliwości taktowania!

Gdyby ktoś chciał ogólnie porównać ich prędkości, podajemy pewną wskazówkę - w uproszczeniu można powiedzieć, że procesor AMD z danego segmentu jest około 50% szybszy od analogicznego Intela o tym samym zegarze.Przykładowo więc, prędkość Athlon 64 z zegarem 2 GHz odpowiada w przybliżeniu 3 GHz procesorowi Pentium 4 Intela (oba znajdują się w segmencie masowym).

Słowniczek skrótów

Ostatnio panuje swoista moda na skróty. Każdy producent pragnie wymyślić swoją nazwę (a najlepiej kilka) na określenie danej technologii. Ponieważ przekroczyło to już zdroworozsądkowe granice, poniżej przedstawiamy tabelkę, która pomaga odnaleźć właściwą drogę w gąszczu najróżniejszych skrótów.

AMD Sempron (Socket 754)