Procesory 2003/2004 i wcześniej
Prawo Moore'a
Dawno, dawno temu - w 1972 roku - Gordon Moore, jeden z założycieli firmy Intel, stwierdził, że gęstość upakowania układów scalonych podwaja się średnio co 18 miesięcy. Ten żart stał się obecnie prawem obowiązującym w technologii komputerowej - w 18-miesięcznym rytmie nie tylko podwaja się gęstość upakowania, lecz także wiele innych parametrów. Warto przyjrzeć się bliżej temu zjawisku. Jego zrozumienie pozwala nie tylko na spoglądanie z dystansu na kolejne, chwilowe rekordy technologiczne, ale także na przewidywanie tych nowości, które dopiero mają nadejść. A przy okazji pozwala na docenienie różnych, niewidocznych na pierwszy rzut oka aspektów wyścigu technologicznego.
Nikomu nie trzeba tłumaczyć korzyści, jakie daje integracja wielu elementów w jednym układzie scalonym. Im większą liczbę elementów da się upakować, tym lepiej - uzyska się większą wydajność oraz mniejszy koszt produkcji. Dlaczego wobec tego nie robi się układów scalonych, które zawierałyby np. całą jednostkę centralną: procesor, procesor graficzny i pamięć na jednym chipie?
Wielkość chipu krzemowego
Obróbka krzemowego wafla jest procesem kosztownym i długotrwałym. Nic więc dziwnego w tym, że im więcej sprawnych układów uzyskuje się z jednego wafla, tym bardziej opłacalna jest produkcja. Ale powierzchnia pojedynczego układu nie tylko przekłada się bezpośrednio na ilość uzyskiwanych układów - im większa jest powierzchnia, tym większe jest prawdopodobieństwo tego, że wewnątrz niej znajdzie się więcej defektów struktury krzemowej, uniemożliwiających poprawne działanie układu. Przyjęło się niezbyt precyzyjne określenie, że koszt produkcji chipu rośnie z kwadratem jego powierzchni. Praktyczną barierą opłacalności była od lat i pozostaje nadal powierzchnia około 300 milimetrów kwadratowych. Oczywiście w przypadku procesorów, kosztujących wiele tysięcy dolarów i produkowanych w niewielkiej skali, opłacalna może być produkcja jeszcze większych chipów. Jednak w praktyce 300 milimetrów kwadratowych to chip ogromny, 200 - bardzo duży, a poniżej 100 - niewielki.
Bariery wielkości chipu są szczególnie eksponowane przy wdrażaniu nowych architektur - na granicy opłacalności były pierwsze procesory Cyriksa, o powierzchni chipu 394 mm2. Również chip procesora Pentium mierzący 294 mm2 był ogromny, ale zanim po blisko sześciu latach architektura Pentium się przeżyła, chip Pentium zmalał do 90 mm2. Podobna jest sytuacja Pentium 4 - 217 mm2 (pierwsze wersje) tego układu to bardzo dużo, w porównaniu ze 106 mm2 Pentium III, jednak zanim architektura P4 się zestarzeje, chip stanie się niewielki.
Wymiar technologiczny
Kilka lat temu najpowszechniej stosowane były wymiary technologiczne 0,35 i 0,25 mikrometra, obecnie skończyła się technologia 0,18-mikronowa - króluje 0,13 mikrona, a Intel w lutym 2004r. wypuścił procesor w wymiarze 0,09 mikrona (czyli 90 nanometrów). Czym właściwie jest wymiar technologiczny? W uproszczeniu można powiedzieć, że jest to wymiar "kratki", na której rozmieszczono elementy układu scalonego. Im mniejszy wymiar technologiczny, tym więcej elementów daje się umieścić na tej samej powierzchni krzemowego chipu. Wymiar technologiczny jest definiowany jako liniowy, podczas gdy powierzchnia, zajmowana przez element, zależna jest od kwadratu tego wymiaru. Widać więc, że każdy kolejny krok w zmniejszaniu wymiaru odpowiada w przybliżeniu zmniejszeniu powierzchni "kratki" o połowę, a co za tym idzie - podwojeniu liczby elementów mieszczących się na danej powierzchni, czyli ich upakowania. Na tym właśnie polega podwajanie gęstości upakowania - tak, jak to przewidział Moore. Dlaczego kroki wymiaru technologicznego są tak drobne? Przecież im mniejsze elementy, tym szybszy zegar, mniejszy pobór energii, a przede wszystkim mniejszy jednostkowy koszt produkcji, bo z jednego krzemowego "wafla" uzyskuje się więcej układów. Jednak zmniejszanie wymiaru technologicznego nie jest sprawą prostą.
Jak produkuje się procesory
Procesor to układ scalony, w którym umieszczono pewną ilość tranzystorów, wytworzonych na powierzchni krzemowej płytki, potocznie zwanej chipem, połączonych ze sobą przy użyciu metalicznych, przewodzących ścieżek, naniesionych na powierzchnię chipu. Krzemowy chip, wraz z wytworzonymi na nim tranzystorami, staje się strukturą układu scalonego. Tranzystory, tworzące układ scalony, muszą być w jakiś sposób ze sobą połączone. W tym celu na powierzchnię struktury nakłada się, przez naparowywanie, metalowe ścieżki. Najwygodniejszym do tej technologii metalem jest aluminium - stosunkowo łatwo daje się doprowadzić do stanu lotnego, ma również dobrą przewodność elektryczną. Nic zatem dziwnego, że aluminiowe ścieżki przez długi czas były nieodzownym elementem technologii układów scalonych. Dopiero stosunkowo niedawno pojawiła się, opracowana przez IBM, rewolucyjna technologia miedzianych ścieżek. Ale, aby po powierzchni struktury poprowadzić metalowe ścieżki, należy najpierw tę powierzchnię odizolować. Pomocnicze elementy izolacyjne powstają stosunkowo prosto - bardzo łatwo wytworzyć warstwę izolacyjną na krzemowej powierzchni kanałów tranzystorów - dwutlenek krzemu to jeden z najlepszych znanych izolatorów. Oddzielenie powierzchni jest niezbędne zarówno po to, aby wytworzyć warstwę izolacyjną dla bramek tranzystorów, jak i po to, by umożliwić połączenie oddzielnych tranzystorów w układ logiczny za pomocą przebiegających po powierzchni metalowych ścieżek.
W związku z koniecznością wykonania połączeń, warstwą izolacyjną pokrywana jest jedynie część powierzchni struktury, natomiast elektrody tranzystorów pozostają nie utlenione. Aluminium, jako materiał ścieżek, ma jeszcze jedną niezaprzeczalną zaletę. Na jego powierzchni bardzo łatwo wytworzyć warstwę izolacyjną przez utlenienie - tlenek glinu (korund, szmaragd czy wreszcie, zależnie od domieszek, rubin) ma znakomite własność ci izolacyjne. Warstwa izolacyjna jest potrzebna przede wszystkim po to, by na jej powierzchni można było nałożyć następną warstwę ścieżek.
W technologii miedzianej konieczne są dodatkowe fazy produkcyjne, polegające na stworzeniu warstwy izolacyjnej. Przy złożoności współczesnych układów scalonych, w celu realizacji niezbędnych połączeń koniecznie jest wykonanie wielu warstw krzyżujących się ścieżek. We współczesnych procesorach stosuje się zwykle 5 do 7 warstw metalicznych ścieżek. Powszechnie przyjętą zasadą jest umieszczanie najgęściej rozmieszczonych i najbardziej precyzyjnych ścieżek najbliżej powierzchni struktury. W miarę pojawiania się kolejnych warstw, ścieżki mają coraz większą powierzchnię i jest ich coraz mniej.
Wytworzenie układu scalonego wymaga wykonania wielu operacji na powierzchni jednej struktury. W intelowskim procesie 0,18 mikrona, z pięcioma warstwami metalizacji, układ poddawany jest blisko 300 operacjom technologicznym. Sześciowarstwowy proces AMD to jeszcze sporo więcej operacji, nie tylko ze względu na liczbę warstw, lecz także nieco inną technikę izolacji miedzianych ścieżek. Układów scalonych nie produkuje się więc pojedynczo. W jednym procesie technologicznym układy wykonywane są na powierzchni krzemowej płytki o średnicy 8 (lub ostatnio 12) cali - równocześnie powstaje wiele jednakowych układów, tworzących charakterystyczny wzór. Właśnie ze względu na ten, złożony z prostokątów, wzór płytka nazywana jest potoczne waflem. Na jednym waflu wytwarzanych jest równocześnie kilkaset układów scalonych. Im większa średnica wafla, tym oczywiście może być ich więcej, jednak wytwarzanie monokryształów krzemowych o dużych średnicach jest trudne - obecnie jedynie nieliczni producenci używają wafli o średnicy 12 cali, większość wciąż pozostaje przy łatwiej dostępnych i tańszych waflach 8-calowych.
Monokryształy krzemowe pochodzą zwykle z innych firm. Niewielu producentów układów scalonych zajmuje się zagadnieniem produkcji od podstaw, zresztą jedynie kilka firm na świecie opanowało proces produkcji monokryształów o zadowalającej czystości i jednorodności. Cięcie monokryształów na wafle również odbywa się w wyspecjalizowanych firmach. Dopiero tak przygotowane płytki krzemowe trafiają do właściwych fabryk układów scalonych. Po dziesiątkach i setkach operacji wafel składa się już z kilkuset gotowych układów scalonych. Jednak to jeszcze nie koniec - na waflu przeprowadzane są testy poszczególnych struktur. Testy służą nie tylko sprawdzeniu, czy dany układ „się udał” - na ich podstawie szacowana jest maksymalna częstotliwość zegara, z jakim będzie mógł pracować. Po testach do odpowiedniego rejestru procesora zostaje trwale zapisana wartość mnożnika częstotliwości (oczywiście, jeśli producent stosuje stałe mnożniki).
Wafle zostają następnie pocięte na poszczególne chipy. Pozostaje jedynie drobiazg - umieszczenie chipu w odpowiedniej obudowie i wyprowadzenie końcówek. Przez wiele lat stosowano łączenie punktów wyprowadzeń na strukturze z nóżkami obudowy przy użyciu zgrzewanych złotych drucików. Obecnie stosuje się prostsze, tańsze i pewniejsze metody montażu - najbardziej zaawansowana jest intelowska techologia FC-PGA (Flip Chip Pin Grid Array), w której struktura układu scalonego zostaje po prostu powierzchniowo przylutowana do płytki ze ścieżkami drukowanymi, w której osadzone są nóżki układu.
Inni producenci stosują technikę Flip Chip, podobną do intelowskiej, ale równocześnie obudowy ich procesorów zawierają dużo innych elementów, podczas gdy w technologii Intela struktura procesora ma bezpośredni styk z odprowadzającym ciepło radiatorem. Po umieszczeniu w obudowie układ zostaje poddany finalnym testom, po czym na jego obudowie wykonywany jest odpowiedni nadruk.
Bariery fizyki
Układy scalone wytwarzane są na powierzchni krzemowej płytki techniką, zwaną fotolitografią. Wymaga ona nakładania na powierzchnię krzemu tzw. masek, czyli warstw przesłaniających niektóre fragmenty powierzchni podczas kolejnych operacji trawienia, dyfuzji, utleniania czy naparowywania warstw przewodzących. Maski wytwarzane są techniką fotograficzną - materiał światłoczuły, jakim pokryta jest płytka krzemowa, ulega utrwaleniu w obszarach naświetlonych, z pozostałych zaś jest zmywany przed następną operacją.
Właśnie w procesie naświetlania masek ujawnia się główny problem, przed jakim stawia chętnych do miniaturyzacji nieubłagana fizyka. Aby naświetlany obraz był ostry i wyraźny, jego najmniejszy wymiar powinien być znacznie większy od długości fali stosowanego światła. Tymczasem zakres długości fal światła widzialnego zawiera się w przedziale 0,7 do 1,3 mikrometra! Konieczne więc było skonstruowanie specjalnego lasera o odpowiedniej długości fali.
Konstrukcja odpowiedniego lasera i receptura materiału masek nie rozwiązują jeszcze w pełni problemu. Należy ponadto zapewnić odpowiednią precyzję działania urządzeń produkcyjnych - taką, by maski i wszystko inne było pozycjonowane na powierzchni "wafla" z dokładnością, w najgorszym przypadku, w granicach do 5 proc. wymiaru technologicznego. Ten aspekt okazuje się nie tylko trudny, ale i kosztowny. Linia produkcyjna musi być precyzyjna "sama w sobie", ale także zabezpieczona przed wpływem czynników zewnętrznych. Przejeżdżające po pobliskiej autostradzie ciężarówki, które w niczym nie przeszkadzały przy procesie 0,35 mikrometra, mogą powodować na tyle silne wstrząsy, że uniemożliwią produkcję w technologii 0,18 mikrometra.
Warto tu wspomnieć o pozornej nieścisłości - produkowane w tym samym wymiarze technologicznym układy, o tej samej konstrukcji logicznej, charakteryzują się różnym upakowaniem. Produkowane jeszcze w 0,35-mikronowej technologii Pentium P54 zmniejszono z 91 do 83 mm2, Pentium II ze 131 do 118 mm2. Przykładów można by znaleźć więcej. Przyczyną takich zmian jest usprawnianie technologii już w trakcie produkcji danego procesora. Nowsze procesy technologiczne i optymalizacja układu elementów na płytce pozwalają nawet na dość znaczne zmniejszenie zajmowanej powierzchni bez zmniejszania wymiaru technologicznego.
Upakowanie elementów zależy również bezpośrednio od konstrukcji samego procesora. Jeśli występują w nim duże regularne struktury logiczne, jak np. pamięci statyczne cache, gęstość upakowania jest znacząco większa, niż w przypadku dość nieregularnej struktury poszczególnych bloków funkcjonalnych. Widać to wyraźnie na przykładzie produkowanych w tym samym, 0,18-mikronowym procesie Athlonów i Thunderbirda - ten ostatni zawdzięcza 30-procentowy wzrost gęstości upakowania temu, że aż 16 mln spośród jego tranzystorów stanowi pamięć cache o bardzo wysokim poziomie upakowania (zajmującą niespełna 20 proc. powierzchni chipu). Nieregularność struktur jest przyczyną tego, że bardzo zaawansowane technologicznie Pentium 4 charakteryzuje się znacząco niższą gęstością upakowania elementów niż wcześniejsze Pentium III.
Czasami usprawnienia procesu technologicznego pozwalają na zmniejszenie wymiaru technologicznego bez poważniejszych inwestycji. Takie zmiany są zwykle niewielkie, o "pół kroku" w porównaniu z klasycznymi skokami wymiaru, podwajającymi upakowanie, jednak potrafią mieć istotne znaczenie. Na przykład AMD, wprowadzając do produkcji procesor K6, przeszło ze stosowanego przy K5 wymiaru 0,35 na wymiar 0,3 mikrometra, a dopiero w rok później na wymiar 0,25 mikrometra.
Według dotychczasowych teorii technologia krzemowa będzie wtedy miała przed sobą szanse na co najwyżej dwa kroki wymiaru - do 0,07, a później do 0,05 mikrona. Mniejsze elementy, o wymiarze kilkunastu atomów, według tych teorii nie mają prawa działać w taki sposób, jak dotychczas. Jednak w ostatnim okresie dokonano szeregu badań, które dowiodły, że możliwe jest wykonanie poprawnie działających ścieżek o szerokości 5 (pięciu!) atomów miedzi i kanału tranzystora o długości 10 atomów krzemu. Może więc technologia krzemowa zakończy swój żywot dopiero na wymiarze 0,025 mikrona lub jeszcze niższym.
Bariery rozwoju procesorów
Pierwsza bariera: Długość fal świetlnych
Omówiona po części powyżej
Druga bariera: Izolacja bramki
W dzisiejszych procesach technologicznych, w których stosowane są materiały o obniżonej stałej dielektrycznej, najczęściej stosowanym materiałem izolacyjnym jest dwutlenek krzemu domieszkowany fluorem. W 0,13-mikronowej technologii jego warstwa, izolująca bramkę tranzystora, ma grubość trzech warstw molekularnych. Bardzo cienkie warstwy izolacyjne z tego materiału przyniosłyby w końcowym efekcie zbyt duże pojemności bramek - zmniejszenie wymiarów okupione byłoby koniecznością obniżenia częstotliwości zegarów. Dlatego badane są obecnie, jako potencjalny materiał izolacyjny bramki, materiały o wyższej stałej dielektrycznej, pozwalające na stosowanie grubszych warstw izolacyjnych przy zachowaniu potrzebnych dla działania tranzystora natężeń pola elektrycznego bramki. Materiałem, z którym technolodzy wiążą największe nadzieje, jest dwutlenek cyrkonu.
Trzecia bariera: Połączenia elementów
Połączenia pomiędzy tworzącymi układ scalony tranzystorami wykonane są jako sieć metalowych ścieżek, łączących pomiędzy sobą elektrody poszczególnych tranzystorów. Wysoki poziom złożoności układów scalonych sprawia, że połączeń musi być bardzo dużo, znacznie więcej niż umożliwiałaby pojedyncza warstwa metalowych ścieżek naniesionych na powierzchnię krzemu. W najbardziej zaawansowanych procesach technologicznych liczba tak zwanych warstw metalizacji (tak określane są poszczególne warstwy połączeniowe układu) sięga obecnie dziewięciu, praktycznie jednak mamy do czynienia z sześcioma-siedmioma warstwami.
Wraz ze zmniejszaniem wymiarów tranzystorów zmniejszają się również szerokości ścieżek przewodzących, co prowadzi do zwiększenia ich rezystancji. Lekarstwem jest zwiększanie grubości ścieżek (warstw). O perspektywy miniaturyzacji ścieżek możemy być spokojni - obecnie ścieżki mają szerokość kilkudziesięciu nanometrów, ale wykonano już laboratoryjnie ścieżki o szerokości 1,2 nm.
Czwarta bariera: Zasilanie
Cienkie warstwy izolacyjne wymagają, co oczywiste, stosowania niewielkich napięć - zarówno napięć zasilających, jak i poziomów sygnałów. Jednak obniżanie wartości napięć zasilających ma swoje granice.
Trzeba bowiem pamiętać o tym, że obszary, wytworzone w krzemie drogą domieszkowania, oddzielone są od krzemowego podłoża jedynie przez bariery potencjału. Przy stosowanych obecnie technikach domieszkowania krzemu bariery te mają poziom około 0,6 V - poniżej tego napięcia całość krzemowej płytki staje się prawie jednorodnym przewodnikiem, nie najlepszym zresztą. Jednak do działania układu samo utrzymanie barier nie wystarczy - dla dwustanowej logiki 0/1 konieczne jest dodatkowe napięcie, pozwalające na rozróżnienie stanów logicznych, nazywane napięciem przełączania. Obecnie, w 0,13-mikronowym procesie technologicznym TSMC, w którym warstwa izolacyjna ma grubość około 0,15 nm, czyli średnio czterech warstw molekularnych, napięcie przełączania wynosi około 0,3 V, w związku z tym ich minimalne napięcie zasilania wynosi 0,9 V.
Okazuje się, że pod względem obniżania napięcia jesteśmy już chyba najbliżej ostatecznej granicy. Co prawda zmniejszenie grubości warstw izolacyjnych pozwoli jeszcze obniżyć napięcie przełączania, ale już chyba nieznacznie - dla monomolekularnej warstwy izolacyjnej będzie ono i tak przekraczać 0,1 V. Można więc przyjąć, że procesory przyszłości będą zasilane napięciem 0,7-0,8, chyba że zostaną odkryte takie techniki domieszkowania krzemu, które pozwolą na obniżenie bariery potencjału. Ale, jeśli chodzi o domieszkowanie krzemu, tablica Mendelejewa została już przetestowana chyba w całości.
Piąta bariera: Zegar
Im mniejsze wymiary elementów, tym mniejsze są pojemności bramek, a cieńsze ścieżki zapewniają obniżenie pojemności pasożytniczych. Końcowym efektem jest skrócenie czasu przełączania bramek, czyli wzrost maksymalnej częstotliwości taktowania układów.
Tu jednak pojawia się nieoczekiwane zagrożenie - miniaturyzacja niekoniecznie okazuje się drogą do przyspieszania. Rekordowy tranzystor Intela, z kanałem o długości 20 nm, jest zdolny do przełączania z częstotliwością ok. 1,5 THz (czyli 1500 GHz). W przypadku zastosowania go w procesorze, którego architektura zawiera 10 poziomów bramek w każdej z faz potoku wykonawczego, taki tranzystor pozwoliłby na pracę procesora z zegarem około 30 GHz. Jednak przy szybkich zegarach ograniczeniem stają się nie wymiary i czasy przełączania tranzystorów, ale... wymiary chipu. Warto przypomnieć sobie, z jaką prędkością przepływa impuls elektryczny w przewodniku - w przybliżeniu z tą samą, z jaką w otaczającym przewodnik dielektryku rozchodzi się fala elektromagnetyczna. Synchroniczna praca układu, złożonego z tranzystorów o czasie przełączania poniżej jednej pikosekundy, wymagać będzie tolerancji sygnałów na tym samym poziomie. Tymczasem w ciągu jednej pikosekundy sygnał elektryczny przebiega w ścieżce odległość zaledwie nieco ponad 0,1 mm! Problemy z właściwą dystrybucją sygnału zegarowego po powierzchni chipu już dziś dają znać o sobie w przypadku procesorów serwerowych, których chipy mają duże rozmiary - to właśnie one ograniczają częstotliwość zegara procesorów Alpha EV68 do 1 GHz, one też spowodowały niedawne problemy Intela z produkcją 900-megahercowego zaledwie procesora Pentium III Xeon wyposażonego w 2 MB pamięci cache L2. Wyraźnie widać, że barierą przyspieszania będzie jednak bariera zachowania synchroniczności zegara, a nie czasy przełączania bramek. Jest jednak wyjście - przejście do konstrukcji asynchronicznych. Od paru lat prowadzone są prace nad procesorem o architekturze asynchronicznej, bez zegara. Konstrukcje takie zostały już zrealizowane praktycznie.
Ostateczna bariera: Minimum wymiarów
Wymiary poszczególnych elementów układu scalonego można dziś odnosić do setek atomów. Rekordowy obecnie, wytworzony w laboratoriach Intela w Hillsboro tranzystor, ma kanał o długości 20 nm, co odpowiada w przybliżeniu 80 atomom krzemu. Tylko dwukrotne zmniejszenie jego liniowych wymiarów spowoduje, że liczba atomów spadnie do 1-4. Ten rząd wielkości wydaje się być minimalnym „ostatecznym wymiarem podstawowym”.
Poza granice
Czego możemy się spodziewać jako finału wielu lat rozwoju technologii krzemowej? O tym, wbrew pozorom, zadecyduje raczej nie fizyka, a ekonomia. Czy eksploracja granic możliwości technologii krzemowej będzie miała sens, zadecydują nie inżynierowie, wcielający fizykę w technologię, ale ekonomiści. Nastąpi to gdzieś na poziomie wymiaru technologicznego wynoszącego 20-30 nm, przy częstotliwościach zegarów przekraczających 30 GHz. Na razie najszybsze z dostępnych na rynku układów pracują dziesięciokrotnie wolniej.
Chociaż wizja końca krzemowej drogi jest jeszcze dość odległa, już od pewnego czasu trwają prace nad potencjalnymi technologiami przyszłości, jak np. logika kwantowa. Według dość optymistycznych ocen, jej stosowanie na skalę przemysłową zacznie być możliwe właśnie w tym samym czasie, kiedy zakończy się ewolucja krzemu.
AMD vs. Intel
Wybór wśród elementów kluczowych - procesorów, płyt głównych i pamięci - jest teraz tak duży, że laicy są po prostu przytłoczeni. Samych rodzin procesorów mamy sporo - Athlon XP, Athlon 64, Athlon 64 FX, Duron, Opteron, Pentium 4, Pentium M, Celeron, Xeon, Itanium. Do każdej platformy istnieją co najmniej trzy chipsety, nie wspominając nawet o modelach ze zintegrowaną grafiką.
Produkty te możemy pogrupować, zmniejszając mnogość do rozsądnej liczby. Do niskobudżetowych komputerów pasują Celerony Intela albo Durony AMD. Notebooki obejmą procesory Pentium M lub Mobile Athlon 64. Linie serwerowe natomiast będą wykorzystywać Opterony, Xeony, bądź procesory Itanium.
Najbardziej jednak istotnymi, z punktu widzenia nabywcy PC, są procesory Athlon XP, Athlon 64, Athlon 64 FX AMD oraz Pentium 4 Intela. Ceny sięgają od 110 USD / 100 € za Athlona XP 2600+ aż do 1200 USD / 1100 € za Pentium 4 Extreme Edition. Częstotliwości zegarów zawierają się w przedziale od poniżej 2 GHz do 3.2 [3.4] GHz.
Kupno procesora: Wydajność kontra spadające ceny
Patrząc z obiektywnego punktu widzenia, podczas wyboru nowego procesora należy zawsze uwzględnić wymaganą moc obliczeniową na dzisiaj plus rezerwy na przyszłe zadania. Takie procesory generalnie oferowane są w rozsądnych cenach.
Z ekonomicznego punktu widzenia, najszybsze i najdroższe procesory mają sens jedynie wówczas, jeżeli dodatkowa wydajność naprawdę przyniesie pożytek w postaci skrócenia czasu w intensywnie korzystających z zasobów zadaniach, jak przykładowo renderowanie dużych scen, mogące trwać nawet kilka godzin. Z powodu wysokich cen, procesory jak Athlon 64 FX-51 czy Pentium 4 Extreme Edition są przeznaczone głównie dla entuzjastów z grubymi portfelami.
Platforma: Socket A, Socket 478, Socket 754, Socket 940
W dzisiejszych czasach ogólny wybór platformy nie polega jedynie na rozgraniczeniu AMD - Intel, ponieważ aktualne procesory posiadają różne podstawki. W systemach Intela Socket 478 wciąż dominuje w komputerach desktop. Format ten pojawił się na początku 2002 roku i dalej będzie służył jako podstawa przyszłych procesorów Intela jeszcze przez kilka miesięcy.
AMD z drugiej strony, prezentując 64-bitowe Athlony, stworzyło dwa nowe gniazda: Socket 754 Athlonów 64 oraz Socket 940 Athlonów 64 FX i Opteronów - wariantu serwerowego. 462-kontaktowy format Socket A wciąż istnieje, współpracuje ze wszystkimi Athlonami XP do 3200+. Dlatego też na początku należy wybrać architekturę.
Platforma |
Socket A |
Socket 754 |
Socket 940 |
Socket 478 |
Procesory |
AMD AthlonXP, Duron |
AMD Athlon 64 |
AMD Athlon 64 FX, Opteron |
Intel Pentium 4, Pentium 4 Extreme Edition, Celeron od 1.7 GHz |
Cena procesora |
Niska do średniej |
Średnia do wysokiej |
Wysoka do bardzo wysokiej |
Niska do bardzo wysokiej |
Cena płyty głównej |
Niska do średniej |
Średnia do wysokiej |
Średnia do wysokiej |
Niska do wysokiej |
Wydajność na dzisiaj |
Wystarczająca do dobrej* |
Bardzo dobra |
Bardzo dobra |
Wystarczająca do bardzo dobrej* |
Możliwości rozbudowy |
Niskie |
Dobre |
Dobre |
Dobre do satysfakcjonujących |
Długoterminowa wartość |
Dobra do satysfakcjonującej |
Dobra |
Dobra |
Dobra |
* w zależności od procesora |
Zegary systemu i rdzenia
Każdy procesor pracuje z określoną częstotliwością zegara, zwaną zegarem układu lub rdzenia. W zależności od modelu, procesory Intela pracują z maksymalnym zegarem 3.2 GHz. Maksimum dla AMD wynosi 2.2 GHz. Należy zauważyć, że właściwa wydajność nie może być oszacowana jedynie na postawie częstotliwości zegara. Dlatego też AMD oznacza swoje procesory wartością benchmarkową w stosunku do Pentium 4 (czyli np. Athlon XP 3200+).
Poza wewnętrzną częstotliwością pracy, procesory muszą się również komunikować z zewnętrznym światem. Zajmuje się tym szyna systemowa (lub szyna frontowa - ang. front side bus (FSB)). Tylko 64-bitowe Athlony do tego celu stosują protokół HyperTransport, nie mają szyny frontowej jako takiej. Wysokie częstotliwości, mierzone w gigahercach, działają jedynie na krótkich dystansach - innymi słowy - wewnątrz procesora. Gdy zachodzi potrzeba przenoszenia sygnałów na dłuższe odległości, jak ścieżki sygnałowe do chipsetu, szybkość jest dużo mniejsza - normalnie nie więcej, jak 200 MHz. Ponieważ tworzy to znaczące ograniczenie, wszystkie dzisiejsze szyny systemowe stosują kilka sztuczek: tryby podwójnej lub poczwórnej przepływności. W Athlonach XP i wszystkich aktualnych układach pamięci DDR, dane są przesyłane zarówno podczas rosnącego, jak i opadającego zbocza sygnału zegara taktującego. W przypadku DDR (Double Data Rate - podwójnej przepływności) oznacza to, że fizyczna szybkość 200 MHz zapewnia taką samą przepustowość, jak 400 MHz w trybie pojedynczej przepływności. Dlatego też czasami mówi się, że Athlon XP ma "400-MHz" szynę FSB. Pentium 4 stosuje tryb poczwórnej przepływności, co wyjaśnia oznaczenie "800-MHz FSB" w ulotkach reklamowych.
Właściwa częstotliwość zegara rdzenia jest wynikiem mnożenia częstotliwości zegara systemowego. Przykładowo - 3.2-GHz Pentium 4 uzyskuje taki zegar z 200-MHz zegara systemowego i mnożnika 16.
Podstawową różnicę pomiędzy Bartonem a znanym już Athlonem Thoroughbredem stanowi powiększona do 512 kB pamięć podręczna drugiego poziomu. Jeśli porównamy (nawet tylko wizualnie) chipy Bartona i Thoroughbreda, poza większą pamięcią cache nie dopatrzymy się między nimi różnic. Barton okazuje się jedynie Thoroughbredem z powiększoną pamięcią cache. AMD stosuje w swoich procesorach system pamięci podręcznych zwany exclusive cache, w którym dane pobrane do cache L1 zostają usunięte z L2 i odwrotnie - przeniesienie danych do cache L2 zwalnia miejsce w L1. Dzięki takiemu rozwiązaniu system pamięci cache Athlonów z logicznego punktu widzenia stanowi jedną pamięć o sumarycznej pojemności 640 kB. Rozpatrując wyniki procesorów Athlon w testach wydajności powinniśmy, według AMD, kierować się nie częstotliwością ich zegarów, ale model numbers - liczbowymi oznaczeniami modeli według lansowanej przez AMD True Performance Initiative. Powiększenie pamięci cache zawsze powoduje znaczny wzrost wydajności, dlatego wyniki testów Athlona XP 3000+ Barton są dosyć zaskakujące - w niektórych zastosowaniach jest on wolniejszy niż poprzednik, oznaczony jako 2800+. Dzieje się tak dlatego, że 3000+ pracuje z zegarem o 66 MHz wolniejszym niż model 2800+.
Wraz z modelem XP 3000+ AMD wprowadziło na rynek także procesor oznaczony 2800+. Mamy więc obecnie dwa różne Athlony XP 2800+, pracujące z zegarami 2,083 i 2,26 GHz. Obecna sytuacja, w której niższy model wykazuje się w licznych testach większą wydajnością od modelu szybszego, całkowicie rujnuje wiarygodność systemu model numbers.
Standard: AMD Athlon XP
AMD największe sukcesy w swojej historii odniosło z Athlonem: pozwolił na przekroczenie bariery 1 GHz w formacie Slot A (rdzeń Orion K7) przed Intelem z jego Pentium III. Rok później Intel zagroził pozycji Athlona Thunderbird wypuszczając pierwsze Pentium 4. Częstotliwości zegara tego drugiego rosły za szybko jak na gust AMD. W wyniku tego AMD wprowadziło oznaczenie wydajności, mające na celu określenie wydajności procesorów następnej generacji, zwanych Athlon XP (rdzeń Palomino ze 133-MHz szyną DDR): Athlon XP 2000+ powinien dorównywać 2000-MHz Pentium 4, choć zegar tego pierwszego to jedynie 1.66 GHz. Praktyka pokazała, że twierdzenia te zasadniczo się sprawdzają, w zależności od modelu Athlona i konkretnego benchmarka. AMD wciąż utrzymuje swoje oznaczenie wydajnościowe, gdyż architektura zaczyna tak bardzo różnić się od technologii Intela, że konieczna jest jakaś podstawa do porównań. Weźmy dla przykładu Athlony XP z rdzeniami Thoroughbred i Barton - ten pierwszy osiąga maksymalnie 2800+ przy zegarze 2.2 GHz i 166-MHz szynie systemowej, drugi natomiast przy tym samym zegarze rdzenia i przy 200-MHz szynie systemowej oferuje już 3200+.
Biorąc pod uwagę premierę procesorów Athlon 64 i 64 FX, AMD raczej nie będzie poświęcać wielkich wysiłków na przedłużenie życia Athlonów XP, wypuszczając nowe modele. Niemniej jednak, Socket A wciąż pozostanie na rynku jeszcze przez kilka (kilkanaście?) miesięcy, skoro procesory z obszaru środka są bardzo rozsądnie wycenione, a platformy dojrzałe.
Za: Wystarczająca wydajność w najbliższym czasie, rozsądna cena procesora i platformy, sprawdzone komponenty; Przeciw: brak widoków na wyjście poza 3200+
AMD Athlon 64
Gniazdo Athlona 64 ma 754 kontakty. Sam procesor jest umieszczony w podstawce FC-BGA. Metaliczna powierzchnia stanowi rozpraszacz ciepła, pomagający w przenoszeniu ciepła z rdzenia do radiatora.
Zapewne Athlon 64 stanie się podstawowym i masowym produktem AMD. Podczas wrześniowej premiery (w Polsce w październiku 2003) dostępny był model 3200+, a ostatnio pokazał się również 3000+. Intrygujące, że oba procesory pracują z dokładnie 2.0-GHz zegarami - jedyną różnicą jest wielkość pamięci L2 cache: 1 MB w przypadku 3200+ oraz 512 KB w przypadku 3000+. Na 1 MB pamięci podręcznej drugiego poziomu składa się ponad połowa z niemalże 106 milionów tranzystorów Athlona 64.
Aktualna przewaga 64-bitowych Athlonów leży w wydajnym zarządzaniu pamięcią, na co składa się duża pamięć L2 Cache i zintegrowany kontroler pamięci. W przeciwieństwie do konwencjonalnych rozwiązań, w których kontroler pamięci umieszczony jest na płycie, tutaj omija się wolne ścieżki danych - procesor bezpośrednio komunikuje się z pamięcią główną, a kontroler pamięci pracuje z pełną częstotliwością zegara rdzenia.
Tego rodzaju stopień integracji powiększa strukturę Athlonów 64 i podnosi cenę w stosunku do Athlonów XP. To, czy 64-bitowy procesor (3200+) jest warty 400 USD / €, nie jest kwestią wsparcia 64 bitów w zastosowaniach domowych i biurowych. 64-bitowe adresowanie więcej niż 4 GB ma sens jedynie wówczas, jeżeli może być rozsądnie zrealizowane. W dzisiejszych czasach konieczne do tego celu byłyby 3 moduły DIMM (2x 2 GB plus trzeci), co stanowi problem dla Athlonów 64 i ich platform: im więcej zainstalowanych jest modułów pamięci, tym bardziej obniża się szybkość ich pracy. Zegar 200 MHz (DDR400) można uzyskać tylko z jednym obsadzonym modułem.
Najbliższe miesiące nie przyniosą 64-bitowego oprogramowania, co pozostawia te zastosowania w domenie profesjonalnej (Windows 2003 Server 64-Bit Edition). Nam zostaje wysoka wydajność w normalnych warunkach (Windows 2000 lub Windows XP i 32-bitowe oprogramowanie). W zależności od obciążenia, zegar procesora jest wyznaczany na jednym z kilku poziomów, od 800 MHz do 2.0 GHz. Pozwala to na obniżenie poboru energii w okresach nieaktywności i znaczące zmniejszenie wymagań chłodzenia.
Za: szybki, nowoczesna architektura, zarządzanie energią; przeciw: brak 64-bitowego oprogramowania, wysoka cena.
Athlon 64 FX
Athlon 64 FX jest flagowym procesorem biurkowym AMD. Technicznie rdzeń procesora jest niczym więcej, jak Opteronem z dwukrotnie mniejszą pamięcią L2 cache i pozbawionym obsługi pracy wieloprocesorowej. Takiej obsługi pozbawiony jest również Athlon 64. Takie bliskie związki skutkują równowagą punktów za i przeciw. Kluczowe cechy można szybko podsumować: Athlon 64 FX-51 pracuje z zegarem 2.2 GHz, przez co jest o 200 MHz szybszy od Athlona 64 3200+. Potrzebuje innej podstawki (940 kontaktów zamiast 754). Posiada dwukanałowy interfejs pamięci, obsługujący moduły DDR400. Ze względu na konieczność utrzymania stabilności i bliski związek z Opteronem, FX współpracuje jedynie z rejestrowymi modułami DIMM. Taka decyzja została podjęta aby utrzymać sygnały na stale wysokim poziomie i aby odciążyć elektrycznie kontroler pamięci.
Wyniki wydajnościowe są imponujące: system z Athlonem 64 FX pozostawia hiperwątkowe Pentium 4 3.2 GHz w tyle praktycznie w każdym benchmarku. Ma to swoją cenę: kosztując około 750 USD / 780 €, FX jest jednym z najdroższych procesorów x86 na ryku - wyłączywszy serwerowe procesory Itanium i Opteron.
Intel Pentium 4
Niezależnie od stosunku wielu posiadaczu komputerów do P4 Intela, w wielu przypadkach ten lider rynkowy utrzymuje dominację. Modele P4 z 800-MHz szyną systemową (200 MHz w trybie poczwórnej przepływności), z dualną pamięcią DDR400 i hiperwątkowością kończą wszystkie benchmarki na bardzo wysokich miejscach.
Hiperwątkowość (ang. HyperThreading) tworzy szybsze środowisko systemowe dla tych, którzy przełączają się między kilkoma aplikacjami. W Windows HT symuluje system dwuprocesorowy i w idealnych sytuacjach rzeczywiście pozwala na jednoczesne przetwarzanie dwóch wątków. W wyniku tego mocno obciążony system charakteryzuje się lepszym czasem odpowiedzi. Choć pod Windows 2000 hiperwątkowość niewiele pomaga (najlepiej pozostawić ją wyłączoną), pod Windows XP rozwija skrzydła. Aplikacje mogą jednak w niektórych wypadkach pracować wolniej. Zaawansowani użytkownicy pewnie o wiele bardziej będą woleli dwuprocesorowy system od paru punktów procentowych maksymalnej wydajności. Optymalny wybór podczas zakupu Pentium 4 to model z 800-MHz szyną systemową (tylko te modele i model 3.06 GHz mają hiperwątkowość), a także dwa moduły DDR400, każdy o pojemności 256 MB lub więcej. Jeżeli chodzi o platformy, zalecane są chipsety i865PE czy i875P Intela albo nowe 655TX SIS lub PT880 VIA. Wykorzystanie starszych chipsetów albo jednokanałowej pamięci stanowiłoby przykład fałszywej oszczędności.
Intel sprzedaje wszystkie swoje procesory Pentium 4 w wersjach "pudełkowych" wraz z wiatraczkiem. Wiatraczki te są wystarczające we wszystkich przypadkach, a wentylatory są stosunkowo ciche. Ukoronowaniem linii Pentium 4 jest model Extreme Edition, kosztujący astronomiczną sumę 1000 USD, oferujący w zamian 3.2 GHz i 2-MB pamięć podręczną.
Za: szybki, sprawdzona platforma, wiele chipsetów, duży wybór procesorów; przeciw: wysoka cena (zwłaszcza modelu EE, Socket478 prawdopodobnie zniknie w połowie 2004r.)
Możliwości przetaktowywania
Dla wielu użytkowników ważnym kryterium podczas wyboru procesora jest możliwość pracy z wyższym, aniżeli zaleca to producent, zegarem. Mówimy tutaj oczywiście o przetaktowywaniu (overclocking). Do osiągnięcia wyższej częstotliwości zegara prowadzą trzy drogi, które ostatecznie wiążą się ze zmianą dwóch czynników: zegar systemowy, mnożnik, albo oba naraz.
Wybór wyższego mnożnika w przypadku wielu procesorów nie jest możliwy, ponieważ producenci blokują tego rodzaju rodzaj przetaktowywania - w końcu, ich zdaniem, jeżeli użytkownik chce osiągnąć wyższą wydajność, powinien kupić droższy model procesora. Pozostaje więc podniesienie częstotliwości zegara systemowego, co również przyspieszy pracę pozostałych komponentów (AGP, PCI, kontroler IDE, kontroler pamięci). Wiele nowoczesnych płyt głównych daje teraz możliwość elastycznego taktowania różnych komponentów niezależnie od zegara systemowego. Przetaktowywanie nie powinno być postrzegane jako dowiedziona metoda podnoszenia wydajności, jako że nikt nie może zagwarantować stabilnej pracy przetaktowanego systemu.
Nadchodzi Prescott Intela
Drugi lutego 2004r.: Intel wypuszcza trzy nowe procesory biurkowe. Pentium 4 z zegarem 3.4 GHz, wersję ekstremalną Pentium 4 Extreme Edition również z zegarem 3.4 GHz oraz mocno wyczekiwany procesor Prescott, od kilku miesięcy będący źródłem przeróżnych plotek.
Gdy nazwa Prescott po raz pierwszy ujrzała światło dzienne, ludzie zaczęli zakładać nadejście procesora Pentium 5, skoro nowy rdzeń odróżnia się od poprzednika - rdzenia Northwood - wieloma rzeczami: 90-nm proces, 1 MB pamięci podręcznej L2 w miejsce 512 KB, podwojenie pamięci podręcznej L1 do 16 KB, 13 nowych instrukcji oznaczanych SSE3 oraz wydłużenie potoku z 20 do 31 etapów, co stanowi część architektury NetBurst. Pomysł brzmi znajomo, jednak ma swoje wady.
Powodem, dla którego Prescott nie otrzymał miana nowej generacji Pentium, mogą być znaczące zmiany architekturalne, mające nadejść w bliskiej przyszłości i to one raczej będą stanowić podstawę nowych Pentium 5. Po targach CeBIT gniazdo Socket 478 zostanie zastąpione gniazdem Socket 775, pojawią się również nowe chipsety obsługujące pamięć DDR II i szynę PCI Express.
Linia chronologiczna procesorów: Od Athlona 1000 do Prescotta
Data |
Intel |
AMD |
02.02.2004 |
Pentium 4 3.4 GHz, Pentium 4 3.4E GHz |
|
06.01.2004 |
|
Athlon 64 3400+ |
24.09.2003 |
Pentium 4 EE 3.2 GHz |
Athlon 64 FX-51 Athlon 64 3200+ |
23.06.2003 |
Pentium 4 3.2 GHz |
|
13.05.2003 |
|
Athlon XP 3200+ |
14.04.2003 |
Pentium 4 3.0 GHz (800 MHz) |
|
10.02.2003 |
|
Athlon XP 3000+ |
14.11.2002 |
Pentium 4 HT 3.06 GHz |
|
30.09.2002 |
|
Athlon XP 2800+ |
26.08.2002 |
Pentium 4 2.8 GHz |
|
21.08.2002 |
|
Athlon XP 2600+ |
10.06.2002 |
|
Athlon XP 2200+ (0.13 µm) |
06.05.2002 |
Pentium 4 2.53 GHz |
|
02.04.2002 |
Pentium 4 2.4 GHz |
|
13.03.2002 |
|
Athlon XP 2100+ |
07.01.2002 |
Pentium 4 2.2 GHz (0.13µm) |
Athlon XP 2000+ |
05.11.2001 |
|
Athlon XP 1900+ |
09.10.2001 |
|
Athlon XP 1800+ |
27.08.2001 |
Pentium 4 2.0 GHz |
|
04.07.2001 |
|
Athlon 1400 |
30.05.2001 |
Pentium 4 1.7 GHz |
|
22.03.2001 |
|
Athlon 1333 |
21.11.2000 |
Pentium 4 1.5 GHz (0.18 µm) |
|
18.10.2000 |
|
Athlon 1200 |
05.06.2000 |
|
Athlon 1000 (0.18 µm) |
Platforma |
Socket A |
Socket 754 |
Socket 940 |
Socket 478 |
Procesory |
AMD AthlonXP, Duron |
AMD Athlon 64 |
AMD Athlon 64 FX, Opteron |
Intel Pentium 4, Pentium 4 Extreme Edition, Celeron od 1.7 GHz |
Cena procesora |
Niska do średniej |
Średnia do wysokiej |
Wysoka do bardzo wysokiej |
Niska do bardzo wysokiej |
Cena płyty głównej |
Niska do średniej |
Średnia do wysokiej |
Średnia do wysokiej |
Niska do wysokiej |
Wydajność na dzisiaj |
Wystarczająca do dobrej* |
Bardzo dobra |
Bardzo dobra |
Wystarczająca do bardzo dobrej* |
Możliwości rozbudowy |
Niskie |
Dobre |
Dobre |
Dobre do satysfakcjonujących |
Długoterminowa wartość |
Dobra do satysfakcjonującej |
Dobra |
Dobra |
Dobra |
* w zależności od procesora |
Październik 2003
Celeron 1,7 GHz 128KB 400MHz FSB Socket 478 IBP |
304 |
|
Celeron 2,0 GHz 128KB 400MHz FSB Socket 478 IBP |
335 |
|
Celeron 2,2 GHz 128KB 400MHz FSB Socket 478 IBP |
361 |
|
Celeron 2,4 GHz 128KB 400MHz FSB Socket 478 IBP |
422 |
|
Celeron 2,5 GHz 128KB 400MHz FSB Socket 478 IBP |
441 |
|
Celeron 2,6 GHz 128KB 400MHz FSB Socket 478 IBP |
471 |
|
Pentium 4 1.8A GHz 512KB 0.13 (Northwood) Socket 478 IBP |
664 |
|
Pentium 4 2.4GHz 512KB 0.13 (Northwood) Socket 478 IBP |
844 |
|
Pentium 4 2.4GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
945 |
|
Pentium 4 2.66GHz 512KB 0.13 (Northwood) Socket 478 IBP |
999 |
|
Pentium 4 2.6C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
1148 |
|
Pentium 4 2.8GHz 512KB 0.13 (Northwood) Socket 478 IBP |
1340 |
|
Pentium 4 2.8C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
1432 |
|
Pentium 4 3.06GHz 512KB 0.13 (Northwood) Socket 478 IBP |
2029 |
|
Pentium 4 3.0C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
2099 |
|
|
3169 |
|
Duron 1,4GHz |
198 |
|
Duron 1,6GHz |
229 |
|
ATHLON XP 2000+ 266MHz FSB |
316 |
|
ATHLON XP 2000+ 266MHz FSB BOX |
381 |
|
ATHLON XP 2200+ 266MHz FSB |
355 |
|
ATHLON XP 2200+ 266MHz FSB BOX |
404 |
|
ATHLON XP 2400+ 266MHz FSB |
405 |
|
ATHLON XP 2400+ 266MHz FSB BOX |
464 |
|
ATHLON XP 2500+ 333MHz FSB |
442 |
|
ATHLON XP 2500+ 333MHz FSB BOX |
509 |
|
ATHLON XP 2600+ 333MHz FSB |
512 |
|
ATHLON XP 2600+ 333MHz FSB BOX |
598 |
|
ATHLON XP 2800+ 333MHz FSB |
889 |
|
ATHLON XP 2800+ 333MHz FSB BOX |
1045 |
|
ATHLON XP 3000+ 333MHz FSB BOX |
1469 |
Marzec 2004
AMD |
|
INTEL ® |
|
|
Duron 1,6GHz |
184 |
Celeron 2,0 GHz 128KB 400MHz FSB Socket 478 IBP |
318 |
|
Duron 1,8GHz |
214 |
Celeron 2,4 GHz 128KB 400MHz FSB Socket 478 IBP |
344 |
|
ATHLON XP 2000+ 266MHz FSB |
281 |
Celeron 2,6 GHz 128KB 400MHz FSB Socket 478 IBP |
439 |
|
ATHLON XP 2000+ 266MHz FSB BOX |
308 |
Celeron 2,7 GHz 128KB 400MHz FSB Socket 478 IBP |
515 |
|
ATHLON XP 2200+ 266MHz FSB |
319 |
Celeron 2,8 GHz 128KB 400MHz FSB Socket 478 IBP |
579 |
|
ATHLON XP 2200+ 266MHz FSB BOX |
359 |
Pentium 4 2.4C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
795 |
|
ATHLON XP 2400+ 266MHz FSB |
349 |
Pentium 4 2.8E GHz 1MB Cache 0.09 HT FSB800 (Prescott) Socket 478 OEM |
859 |
|
ATHLON XP 2400+ 266MHz FSB BOX |
385 |
Pentium 4 2.8C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
885 |
|
ATHLON XP 2500+ 333MHz FSB |
398 |
Pentium 4 2.8E GHz 1MB Cache 0.09 HT FSB800 (Prescott) Socket 478 IBP |
945 |
|
ATHLON XP 2500+ 333MHz FSB BOX |
439 |
Pentium 4 3.0C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
1079 |
|
ATHLON XP 2600+ 333MHz FSB |
468 |
Pentium 4 3.2C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
1359 |
|
ATHLON XP 2600+ 333MHz FSB BOX |
489 |
Pentium 4 3.4C GHz 512KB 0.13 HT FSB800 (Northwood) Socket 478 IBP |
1999 |
|
ATHLON XP 2700+ 333MHz FSB |
499 |
Athlon XP 3000+ (Barton) 2,167 Athlon XP 2800+ (Barton) 2,083 Athlon XP 2800+ (333 MHz FSB) 2,253 Athlon XP 2700+ (333 MHz FSB) 2,167 Athlon XP 2600+ (333 MHz FSB) 2,083 Athlon XP 2600+ 2,133 Athlon XP 2500+ (Barton) 1,833 Athlon XP 2400+ 2,000
|
||
ATHLON XP 2700+ 333MHz FSB BOX |
569 |
|
||
ATHLON XP 2800+ 333MHz FSB |
598 |
|
||
ATHLON XP 2800+ 333MHz FSB BOX |
659 |
|
||
ATHLON XP 3000+ 333MHz FSB BOX |
919 |
|
||
ATHLON XP 3200+ 333MHz FSB BOX |
1197 |
|
||
ATHLON 64 3000+ HyperTransport BOX |
1229 |
|
||
ATHLON 64 3200+ HyperTransport BOX |
1549 |
|
Procesor AMD Athlon™ 64 Porównanie z konkurencją
Charakterystyka |
AMD Athlon™ 64 |
Pentium® 4 |
Rok wprowadzenia architektury |
2003 |
2000 |
Infrastruktura |
Socket 754 |
Socket 478 |
Technologia wytwarzania |
0.13 Mikrona, SOI |
0.13 Mikrona |
Liczba tranzystorów |
105.9 mln |
55 mln |
Obsługa 64-bitowego zestawu instrukcji |
Tak, |
Nie |
Obsługa 32-bitowego zestawu instrukcji |
Tak |
Tak |
Magistrala systemowa |
Technologia HyperTransport™, maks. 1600 MHz Pełny dupleks |
Magistrala FSB, 800 MHz Półdupleks |
Wbudowany kontroler pamięci DDR (MCT) |
Tak, |
Nie, |
Przepustowość komunikacji procesor-system |
HyperTransport: maks. 6,4 GB/s |
Łącznie: maks. 6,4 GB/s |
Zintegrowany mostek północny |
Tak, |
Nie, |
Wydajna, wbudowana pamięć podręczna |
Poziom 1: 128 KB |
Poziom 1: 12 KB śledzenie mikrooperacji + 8 KB dane |
Instrukcje przetwarzania grafiki trójwymiarowej |
3DNow!™ Professional, SSE2 |
SSE, SSE2 |
Gniazdo Athlona 64 ma 754 kontakty. Sam procesor jest umieszczony w podstawce FC-BGA. Metaliczna powierzchnia stanowi rozpraszacz ciepła, pomagający w przenoszeniu ciepła z rdzenia do radiatora.
Prescott Intela
Procesory 2005/2006
Źródło numer 1
Źródło: www.tomshardware.pl 1 sierpnia 2005
Istnieją dwie strony rynku procesorów. Pierwsza z nich to ta z high-endowymi komputerami PC wyposażonymi w potężne i prestiżowe układy firm AMD i Intel, które na przemian obejmują prymat. Druga strona to ta, na którą składają się masowo produkowane komputery, uproszczone do minimum. Takie komputery, kosztem obniżonej wydajności i możliwości, mają być dostępna po niskiej cenie. Aby zagospodarować tę właśnie, niemniej istotną sferę biznesową, której zarówno media, jak i wielu użytkowników nie dostrzega, Intel oraz AMD stworzyły swoje tanie marki. W przypadku AMD najpierw miał to być Duron, a teraz jest to Sempron. U Intela rolę tę pełnią niezbyt atrakcyjne procesory Celeron. Obie rodziny układów są porównywalne ze swoim rodzeństwem z wyższej półki, czyli Athlonem 64 i Pentium 4, jednak odznaczają się znacznie niższą szybkością i ograniczonymi możliwościami. I tak na przykład - procesory Athlon 64 mają od 512 KB do 1 MB pamięci podręcznej L2 i są taktowane z częstotliwością do 2,8 GHz (FX-57). Z kolei dla Sempronów przewidziano od 128 do 256 pamięci cache L2 i taktowanie od 1,6 do 2,0 GHz. Podobnie sprawa wygląda w przypadku Intela. Najszybsze Celerony mają zegar 3,06 GHz, 256 KB pamięci cache L2 oraz magistralę systemową 133 MHz, podczas gdy P4 osiąga szybkość 3,8 GHz, 2 MB cache L2, a kilka modeli ma magistralę 266 MHz. Tanie procesory można produkować na dwa sposoby. Albo można stworzyć nowy układ z małą pamięcią cache L2, bazowany na starej architekturze, tak by wycisnąć jak najwięcej układów z płytki krzemowej. Można też posługując się tym samym krzemem z którego tworzy się drogie procesory, obniżyć ilość pamięci cache L2 i wyłączyć niektóre możliwości. Wydajność procesu produkcyjnego w tym przypadku nie jest dużym problemem, ponieważ szybkości zegara i tak są stosunkowo niskie.
Procesory Sempron dostępne są w wersjach dla podstawek Socket A (462) i 754, przy czym wersja Socket A to nic innego jak uproszczony układ Athlon XP Thoroughbred-B, którego przechrzczono na Semprona. Dlatego Semprony w wersji dla gniazda Socket A działają na każdej płycie głównej z podstawką Socket A, która obsługuje FSB333, czasem nawet niepotrzebna jest aktualizacja BIOS-u.
Przebiegłość tego posunięcia można zrozumieć, przyglądając się rynkowi komputerowemu w Chinach, czy w innych krajach rozwijających się ekonomicznie, np. w Ameryce Południowej. Tutaj właśnie dominują tanie systemy, które zapewniają duży popyt na tanie procesory AMD. Dużą rolę odgrywają tu płyty główne z gniazdem Socket A, których niskie ceny, spowodowane nieuchronnym przejściem tej platformy do lamusa, są nie do przebicia.
Równolegle, procesory Sempron w wersji Socket 754 czerpią z kapitału rodziny procesorów AMD64. Po pierwsze są wyposażone w zintegrowany kontroler pamięci DDR400, który działa z pełną szybkością zegara i pozwala podnieść wydajność systemu. W dodatku Semprony w wersji Socket 754, w przeciwieństwie do modeli Socket A, obsługują również rozszerzenia SSE2. No i wreszcie kusząca jest możliwość wymiany taniego Semprona 754 na Athlona 64, i zwiększenia szybkości taktowania nawet do 3700+.
Jednak dalsze losy gniazda Socket 754 są przesądzone - zostanie ono wyparte przez Socket 939 oraz Socket M2, które mają pojawić się na początku przyszłego roku. W rezultacie, nowa generacja Sempronów obsługiwała będzie pamięci dwukanałowe. Patrząc z tej perspektywy, zakup systemu z podstawką Socket 754 nie pozwoli wam w przyszłości na stosowanie układów dwurdzeniowych.
Ten nowy układ bazuje na wykonanym w procesie 90 nm rdzeniu Palermo firmy AMD i posiada 256 kB pamięci cache L2. Jak wykazały nasze testy, wielkość pamięci podręcznej L2 nie ma większego znaczenia, ale to właśnie jej pojemność decyduje o przynależności układu do danej rodziny procesorów. Największą różnicę w wydajności daje częstotliwość zegara.
Współczynnik TDP (Thermal Design Power) nie uległ zmianie - wciąż wynosi 66 watów. Zauważyliśmy jednak, że temperatura rdzenia jest trochę niższa w porównaniu do Sempronów bazujących na 130-nametrowym rdzeniu Paris. W porównaniu do Oakville'a różnice są, zgodnie z oczekiwaniami, minimalne.
Prawdziwą nowością, poza przywróceniem większej ilości pamięci cache L2, jest wprowadzenie 64-bitowych rozszerzeń AMD 64. Przypuszczamy, że były one integralną częścią tych procesorów AMD, jednak, aż do teraz, były dezaktywowane. Tak więc właściciele Semprona 64 (ale tylko w wersji 3400+) mogą zainstalować Windows XP x64, podobnie jak właściciele procesorów Athlon 64 i Pentium 4 600. Niestety, platformy Socket 754 obsługiwać będą nie więcej niż kilka gigabajtów pamięci RAM.
Najnowszy Sempron, sprzedawany hurtowo po 1000 sztuk, będzie kosztował 134 dolary za sztukę, co czyni go najdroższym z tanich procesorów w ofercie firmy AMD. Dzięki szybkości 2 GHz powinien być on porównywalny z Athlonem 64 3000+ dla gniazda Socket 939, którego szybkość wynosi 1,8 GHz i który obsługuje dwukanałową pamięć DDR400. To rodzi się tu ciekawe pytanie - czy tani układ dla gniazda Socket 939 nie byłby lepszym rozwiązaniem?
Istnieje znacznie większa różnorodność procesorów i płyt głównych na platformę Socket 939, ma ona również większe możliwości i, o czym już mówiliśmy, lepsze możliwości rozbudowy. Jedyną wadą są wyższe koszty tej platformy, które mają decydujące znaczenie dla wielu klientów. Przecież, jeśli maszyną będzie przeznaczona głównie do aplikacji biurowych, to nieważne jakiego systemu użyjemy, praktycznie wszystkie zestawy będą wystarczająco szybkie.
W przeciwieństwie do Athlonów 64, linia układów Sempron dla gniazda Socket 754 jest wciąż na tyle nieskomplikowana, że można ją łatwo prześledzić:
CPU |
Rdzeń/Proces |
Cache |
Funkcjonalności |
Częstotliwość taktowania zegara/TDP |
Sempron 2500+ |
Palermo / 90 nm |
128 kB |
NX, SSE, SSE2, SSE3 |
1,4 GHz / 62 W |
Sempron 2600+ |
Oakville / 90 nm |
128 kB |
NX, SSE, SSE2 |
1,6 GHz / 62 W |
Sempron 2600+ |
Palermo / 90 nm |
128 kB |
NX, SSE, SSE2, SSE3 |
1,6 GHz / 62 W |
Sempron 2800+ |
Oakville / 90 nm |
256 kB |
NX, SSE, SSE2 |
1,6 GHz / 62 W |
Sempron 2800+ |
Palermo / 90 nm |
256 kB |
NX, SSE, SSE2, SSE3 |
1,6 GHz / 62 W |
Sempron 3000+ |
Oakville / 90nm |
128 kB |
NX, SSE, SSE2, Cool & Quiet |
1,8 GHz / 62 W |
Sempron 3000+ |
Palermo / 90nm |
128 kB |
NX, SSE, SSE2, SSE3, Cool & Quiet |
1,8 GHz / 62 W |
Sempron 3100+ |
Paris / 130 nm |
256 kB |
NX, SSE, SSE2, Cool & Quiet |
1,8 GHz / 62 W |
Sempron 3100+ |
Oakville / 90 nm |
256 kB |
NX, SSE, SSE2, SSE3, Cool & Quiet |
1,8 GHz / 62 W |
Sempron 3100+ |
Palermo / 90 nm |
256 kB |
NX, SSE, SSE2, SSE3, Cool & Quiet |
1,8 GHz / 62 W |
Sempron 3300+ |
Oakville / 90 nm |
128 kB |
NX, SSE, SSE2, Cool & Quiet |
2,0 GHz / 62 W |
Sempron 3300+ |
Palermo / 90 nm |
128 kB |
NX, SSE, SSE2, Cool & Quiet |
2,0 GHz / 62 W |
Sempron 3400+ |
Palermo / 90 nm |
256 kB |
NX, SSE, SSE2, SSE3, Cool & Quiet, AMD64 |
2,0 GHz / 62 W |
Pierwszym dostępnym procesorem z rodziny Sempron był układ 3100+, bazujący na rdzeniu Paris 130 nm (CG). Ten układ był pierwszym krokiem AMD przy wprowadzaniu nowej rodziny tanich procesorów. Rdzeń Oakville (stepping D0), wprowadzony w kwietniu 2005, był pierwszym układem wykonanym w technologii 90 nm. Wszystkie Rdzenie Oakvlle posiadają 256 kB pamięci cache L2 i obsługują rozszerzenia SSE3, ale tylko część modeli używa całej pamięci L2 - układy Sempron 2600+, 3000+ i 3300+ korzystają jedynie ze 128 kB.
Nowy Sempron 3400+ to kolejny rdzeń, który, chociaż wciąż bazuje na technologii 90 nm, wprowadza poprawiony kontroler pamięci, czyli rozwiązanie znane z rdzeni Venice i San Diego stosowanych w Athlonach 64. Rdzeń został rozszerzony również o zestaw instrukcji SSE3 (rewizja E3 i E) wprowadzonych przez Intela na początku 2004 roku. Rdzeń Palermo dostępny będzie we wszystkich wolniejszych procesorach, ale architektura AMD64 jeszcze przez jakiś czas nie będzie dostępna.
Jeszcze słówko o technologii Cool & Quiet. Firma AMD udostępnia tę cechę tylko dla procesorów 3000+ wzwyż. Wymaga ona odpowiedniego sterownika procesora (do ściągnięcia ze strony AMD), a po włączeniu daje systemowi operacyjnemu możliwość zmniejszenia częstotliwości taktowania zegara, co zmniejsza zużycie energii oraz wydzielanie ciepła. Rozwiązanie to różni się całkowicie od strategii Intela, ponieważ zarówno stacjonarne, jak i mobilne Celerony D nie są w stanie dynamicznie zmieniać częstotliwości taktowania zegara. Tylko procesory Pentium 4 600 powyżej 3 Ghz oraz układy Pentium M są wyposażone w technologię SpeedStep.
Sempron 3400+
Oto i on. Oczywiście wyglądem nie różni się zbytnio od swoich poprzedników, ponieważ wszystkie procesory AMD wyposażone są w metalową płytkę przykrywającą rdzeń, o nazwie heat spreader (radiator), która uniemożliwia nam obejrzenie układu. Płytka jest przymocowana do struktury za pomocą nakładki żelowej lub pasty termoprzewodzącej, które pomagają rozpraszać ciepło na większą powierzchnię. Pełni również rolę doskonałego zabezpieczenia, gdyż już nie jeden Athlon XP czy Duron padł ofiarą nieumiejętnych prób montażu coolera. Intel wprowadził podobne radiatory dopiero w momencie premiery układów Pentium 4. |
Zdecydowaliśmy się dołączyć wyniki testów trzech Athlonów 64, celem porównania z Sempronami 3300+ i 3400+. Oba modele najtańszych Athlonów 64 na platformę Socket 939 są niewiele droższe od Semprona 3400+, a posiadają całe 512 kB pamięci cache L2 i dwukanałowy interfejs pamięci DDR400. Różnice w kosztach między platformi zaczynają się od 15 dolarów i rosną do znacznych sum, w zależności od opcji jakich sobie zażyczycie.
Zdecydowaliśmy się też na porównanie nowego Semprona z Athlonem 64 3200+ w wersji Socket 754 bazującym na architekturze Newcastle, ponieważ ten Athlon jest odpowiednikiem Semprona o tej samej częstotliwości taktowania zegara. Wprawdzie Newcastle to technologia 130 nm i bez SSE3, ale nie widzieliśmy jeszcze Athlona 64 w technologii 90 nm w wersji Socket 754.
Wprowadzenie 64-bitowego Semprona jest odpowiedzią na 64-bitowy układ Celeron Intela, a wszystko po to, by spełnić wymagania użytkowników o mniej pojemnych kieszeniach. Wydaje nam się jednak, że korzyści z niego wyniesie, przynajmniej na dłuższą metę niewielu nabywców. Mimo, że 64-bitowy Windows XP x64 Edition jest już dostępny, to jednak wciąż brakuje 64-bitowego oprogramowania i sterowników, szczególnie dla urządzeń peryferyjnych. Przejście na nową technologię właśnie teraz, ot tak dla zasady, ma sens jedynie w przypadku branży IT, ale nie dla indywidualnego użytkownika. Poza tym, większość użytkowników korporacyjnych nie zaczęło jeszcze nawet sprawdzać możliwości wykorzystania przez użytkowników końcowych 64-bitowych Windowsów.
Poza czarnym koniem tego układu, czyli 64-bitowej architektury, nowy procesor ma niewiele nowego do zaoferowania. Ulepszenie Semprona 3300+ do 3400+ sprowadziło się głównie do podwojenia pojemności pamięci cache L2 ze 128 do 256 kB, co jak można się było spodziewać, niewiele zmieniło.
Jeśli jesteście zdecydowani na procesor Sempron, to polecamy wam najnowszy rdzeń Palermo, głównie z uwagi na to, że obsługuje rozszerzenia SSE3. Dopóki architektura 64-bitowa nie będzie wam potrzebna, nie ma sensu przerzucać się na model 3400+. Jednak, z punktu widzenia wydajności i stosunku możliwości do ceny, dobrym wyborem jest wciąż tani Athlon 64 razem z rozsądnie dobraną platformą Socket 939.
czerwiec 2005
Pojawienie się nowego Athlona idzie w parze z pierwszą modernizacją technologiczną, jaka ma miejsce od momentu pojawienia się procesorów z serii FX, przeznaczonych dla segmentu high-end. Poprzednie procesory z tej serii bazowały na rdzeniu Clawhammer, wykonanym w procesie 130 nm, natomiast model FX-57 jest wyposażony w rdzeń o nazwie kodowej San Diego i powstał w oparciu o technologię 90 nm. Dzięki temu zabiegowi, możemy spodziewać się, że nowy produkt zaoferuje większą wydajność, przy zachowaniu niezmienionej charakterystyki cieplnej.
W chwili obecnej dostępne są trzy różne rdzenie, wyprodukowane w procesie 90 nm. Pierwszą konstrukcją, w której zastosowanie nowej technologii pozwoliło obniżyć ilość wydzielanego ciepła przy niskich i średnich częstotliwościach taktowania, był układ o nazwie Winchester (512 kB pamięci podręcznej L2, rozpraszanie cieplne na poziomie 67 W przy częstotliwości taktowania 2,2 GHz). Obecnie jednak nasza uwaga skupia się na dwóch pozostałych rdzeniach, a mianowicie Venice (512 kB pamięci cache L2) oraz San Diego (1 MB). To właśnie one mają zastąpić podstarzałe technologicznie konstrukcje Clawhammer oraz Newcastle. Kwestią wartą wspomnienia jest także fakt, że nowe rdzenie zostały wyposażone w zestaw rozszerzonych instrukcji SSE3, przydatnych w przypadku niektórych aplikacji profesjonalnych. AMD zamierza zastosować dwa powyżej wymienione układy w nowych procesorach z serii Athlon 64 i 64 FX.
Rdzeń o nazwie San Diego jest najbardziej złożoną konstrukcją, spośród układów wykonanych w technologii 90 nm. Jest on oparty o najnowszy stepping E4, obsługuje rozszerzone instrukcje SSE3 i posiada 1 MB pamięci cache L2. W nowych rdzeniach San Diego oraz Venice zmodyfikowano nieco kontroler pamięci, co wpłynęło korzystnie na wydajność. Dodatkową zaletą, wynikającą z wprowadzonych zmian jest możliwość zastosowania w systemie czterech dwustronnych modułów pamięci DIMM DDR400, co do tej pory zwykło sprawiać problemy.
Zmianie nie uległa podstawka procesora Socket 939 oraz magistrala Hyper Transport, odpowiadająca za komunikację procesora z chipsetem, która działa z częstotliwością 1 GHz w trybie dwukierunkowym (full-duplex). Nowy procesor oferuje wsparcie dla instrukcji 3DNow! Professional, MMX, SSE oraz SSE3. Nie należy także zapominać o ochronie antywirusowej (NX bit) oraz technologii Cool'n'Quiet, pozwalającej modyfikować w locie częstotliwość taktowania procesora. Monitorowaniem obciążenia CPU zajmuje się system operacyjny, wykorzystując do tego celu specjalny, dedykowany sterownik. Procesory Athlon 64 mogą pracować na dwóch, trzech, bądź czterech poziomach wydajności (tzw. P-states). Najniższe taktowanie wynosi 800 lub 1000 MHz, w zależności od modelu. Działając na najniższym poziomie wydajności, ilość wydzielanej przez procesor energii cieplnej zostaje zredukowana niemal o połowę. Dzięki zmniejszeniu poboru mocy, a co za tym idzie - ilości generowanego ciepła, nie trzeba stosować bardzo wydajnych i drogich systemów chłodzenia.
Z punktu widzenia architektury układu, nic się nie zmieniło. Wszystkie niezbędne szczegóły możecie znaleźć w naszym pierwszym artykule, poświęconym procesorom Athlon 64 oraz Athlon 64 FX.
Procesory AMD 64 zestawienie właściwości i cen
Procesor |
Model |
Zegar |
Pamięć cache |
Rdzeń, TDP |
Cena |
Athlon 64 |
3000+ |
1,8 GHz |
512 kB |
90 nm Venice |
149 USD |
Athlon 64 |
3000+ |
1,8 GHz |
512 kB |
90 nm Winchester |
149 USD |
Athlon 64 |
3000+ |
1,8 GHz |
512 kB |
130 nm Newcastle |
149 USD |
Athlon 64 |
3200+ |
2,0 GHz |
512 kB |
90 nm Venice |
194 USD |
Athlon 64 |
3200+ |
2,0 GHz |
512 kB |
90 nm Winchester |
194 USD |
Athlon 64 |
3200+ |
2,0 GHz |
512 kB |
90 nm Newcastle |
194 USD |
Athlon 64 |
3500+ |
2,2 GHz |
512 kB |
90 nm Venice |
272 USD |
Athlon 64 |
3500+ |
2,2 GHz |
512 kB |
90 nm Winchester |
272 USD |
Athlon 64 |
3500+ |
2,2 GHz |
512 kB |
130 nm Newcastle |
272 USD |
Athlon 64 |
3700+ |
2,2 GHz |
1 MB |
90 nm San Diego |
329 USD |
Athlon 64 |
3800+ |
2,4 GHz |
512 kB |
90 nm Venice |
373 USD |
Athlon 64 |
3800+ |
2,4 GHz |
512 kB |
130 nm Newcastle |
373 USD |
Athlon 64 |
4000+ |
2,4 GHz |
1 MB |
130 nm Clawhammer |
482 USD |
Athlon 64 |
4000+ |
2,4 GHz |
1 MB |
90 nm San Diego |
582 USD |
Athlon 64 X2 |
4200+ |
2,2 GHz |
2x 512 kB |
90 nm Manchester |
537 USD |
Athlon 64 X2 |
4400+ |
2,2 GHz |
2x 1 MB |
90 nm Toledo |
581 USD |
Athlon 64 X2 |
4600+ |
2,4 GHz |
2x 512 kB |
90 nm Manchester |
803 USD |
Athlon 64 X2 |
4800+ |
2,4 GHz |
2x 1 MB |
90 nm Toledo |
1001 USD |
Athlon 64 |
FX-55 |
2,6 GHz |
1 MB |
90 nm San Diego |
1031 USD |
Athlon 64 |
FX-55 |
2,6 GHz |
1 MB |
130 nm Clawhammer |
827 USD |
Athlon 64 |
FX-57 |
2,8 GHz |
1 MB |
90 nm San Diego |
1031 USD |
Powyżej zamieszczone zostało pełne zestawienie procesorów Athlon 64, dostępnych dla podstawki Socket 939. (Aby zachować rozsądne rozmiary tabeli, zdecydowaliśmy się pominąć procesory oparte o Socket 754, jak również Semprony.) Jeśli planujecie zakup procesora Athlon 64, zdecydowanie polecamy skupić się na modelach wyposażonych w nowe rdzenie - Venice (512 kB cache L2) oraz San Diego (1 MB). Dzięki zastosowaniu procesu 90 nm, obie konstrukcje gospodarują oszczędniej energią, a więc są znacznie chłodniejsze od wersji 130 nm oraz bardziej podatne na przetaktowanie. Zaletą jest także zaimplementowana obsługa instrukcji SSE3.
W obecnej chwili Intel nie posiada w swoim arsenale konstrukcji jednordzeniowych niczego, czym mógłby się rzeczywiście przeciwstawić AMD. Można oczywiście przyśpieszyć procesor Pentium 4 Prescott do 4 GHz, jednak będzie to oznaczało zaledwie 5-procentowy wzrost szybkości zegara, w porównaniu do modeli 570 i 670 (taktowanie 3,8 GHz). Tak niewielka zmiana nie będzie miała w zasadzie żadnego znaczenia dla wydajności procesora.
Właśnie dlatego zainteresowanie Intela skupia się w chwili obecnej na układach dwurdzeniowych Pentium D i na procesorach Pentium Extreme Edition. Procesory Pentium D, oparte na rdzeniu Smithfield, łączą w sobie dwie struktury typu Pentium 4 Prescott, natomiast w układach EE dodano obsługę Hyper Threading. Tradycyjnie, cena modeli z serii Extreme Edition utrzymuje się na poziomie 999 USD, a grupę docelową tych układów stanowią gracze oraz entuzjaści, nie przejmujący się wydatkami.
Z technicznego punktu widzenia, dwurdzeniowy układ Pentium Extreme Edition zapowiada się całkiem interesująco. Procesor ten, wyposażony w dwa rdzenie oraz technologię Hyper Threading, daje nam do dyspozycji do czterech logicznych jednostek obliczeniowych. Zalety HT stają się tym widoczniejsze, im więcej aplikacji zdecydujemy się jednocześnie uruchomić. Szkoda tylko, że rozwiązanie takie nie przyniesie praktycznie żadnej korzyści graczom, do których zasadniczo skierowany jest ten procesor.
W przypadku Pentium D, sytuacja wygląda inaczej. Seria ta obejmuje trzy modele oznaczone odpowiednio 820, 830 i 840, których częstotliwość taktowania zawiera się w przedziale od 2,8 do 3,2 GHz. Cenowo wypadają one bardzo korzystnie na tle szybkich układów jednordzeniowych, deklasując również w tym względzie dwurdzeniowe Athlony 64 X2. W związku z tym, że spora część dostępnego obecnie oprogramowania jest już zoptymalizowana pod kątem wielowątkowości, celem Intela stało się teraz zajęcie dużej części rynku systemów dwurdzeniowych, w czym znaczącą rolę ma odegrać atrakcyjny cenowo procesor Pentium D.
Wprowadzenie dwurdzeniowych procesorów przeznaczonych dla komputerów stacjonarnych, planowane na 31 maja, sprawia, że końcówka tego miesiąca zapowiada się bardzo interesująco. Oczywiście już w dniu dzisiejszym dostępny jest w niewielkich ilościach wielowątkowy model Pentium Extreme Edition 840, czego przykładem może być chociażby oferta firmy Dell, jednak najbardziej oczekiwany - Pentium D, ujrzy światło dzienne nie wcześniej niż w czerwcu. Tymczasem AMD pokonało Intela w zyskownym segmencie stacji roboczych oraz serwerów wprowadzając swoje dwurdzeniowe procesory Opteron z serii x65/x70/x75. Kolejny element strategii AMD na rok 2005, obejmuje wprowadzenie dwurdzeniowego produktu, przeznaczonego dla komputerów stacjonarnych. Temu właśnie tematowi poświęciliśmy ten artykuł.
Pierwsza niespodzianka, jaka nas spotkała, dotyczy kwestii związanych z odprowadzaniem ciepła, generowanego przez dwa rdzenie tworzące jeden fizyczny układ scalony. Otóż w przeciwieństwie do Intela, AMD nie obniżyło taktowania. Oznacza to, że dwurdzeniowe procesory AMD powinny pracować z taką samą częstotliwością taktowania zegara jak wersje jednordzeniowe. W przypadku Intela sprawa wygląda inaczej. Producent zdecydował, że najszybszy dwurdzeniowy model pracować będzie z zegarem 3,2 GHz, natomiast jednordzeniowy - 3,8 GHz.
Przejście z procesu technologicznego 130 nm do procesu 90 nm wykorzystującego technologię SOI (krzem-na-izolatorze) pozwoliło AMD obniżyć poziom rozpraszania cieplnego (TDP) z 89 W (wartość maksymalna) do 67 W, przy częstotliwości 2,2 GHz (Winchester 3500+). Jednocześnie, charakterystyka cieplna układu Athlon 64 FX 55, taktowanego zegarem 2,6 GHz, jest na tyle elastyczna, że pozwala na zastosowanie procesorów dwurdzeniowych na większości obecnych na rynku płyt głównych z gniazdem socket 939. Inaczej jest w przypadku procesora Pentium D, który mimo, że konstrukcja samej podstawki nie uległa zmianie, wymaga zastosowania zupełnie nowych płyt głównych.
Rodzina procesorów dwurdzeniowych, przeznaczonych dla komputerów stacjonarnych obejmuje cztery produkty, występujące pod wspólną nazwą Athlon 64 X2 (W przypadku Intela będą to trzy procesory z serii Pentium D oraz model Extreme Edition.). Oficjalną datę premiery AMD ustaliło na dzień 31 maja. Dwa modele z serii X2 będą oparte na dwurdzeniowym układzie o nazwie kodowej Manchester, wyposażonym w 512 kB pamięci cache L2 dla każdego rdzenia. W dwóch pozostałych układach wykorzystano konstrukcję Toledo, z 1 MB pamięci podręcznej L2 dla każdej jednostki logicznej.
W przypadku modeli przeznaczonych na rynek masowy, opartych na rdzeniu Manchester, ilość wydzielanego ciepła utrzyma się na poziomie 95 W, natomiast dla bardziej wydajnych wersji, wartością maksymalną będzie 110 W. Wymaganiom tym z łatwością sprostają wszystkie płyty główne, będące w stanie obsłużyć Athlona 64 FX 55. Choć liczby te uzmysławiają nam, że wymagania procesora są dość pokaźne, to nie powinniśmy zapominać, że najmocniejszy model Intela, działający z częstotliwością 3,2 GHz, osiąga niebotyczny poziom poboru mocy dochodzący do 130 W, a także przeciętny pobór jest nieco wyższy. Ciekawy jest natomiast fakt, że obie firmy idą "łeb w łeb", w przypadku modeli przeznaczonych dla zastosowań masowych, dla których pobór mocy utrzymuje się na poziomie 95 W.
Każdy współczesny system operacyjny potrafi wykonać wiele operacji w jednym czasie, rozdzielając obciążenie związane z wykonaniem zadań, pomiędzy wszystkie dostępne procesory logiczne (tzw. multi-tasking czyli wielozadaniowość). Jeśli istnieje taka możliwość, system operacyjny dokonuje podziału obciążenia na dużo niższym poziomie, bazując na wątkach (tzw. multi-threading czyli wielowątkowość). Dzięki temu, że współczesne komputery są w stanie działać wielozadaniowo, użytkownicy mogą uruchamiać wiele aplikacji jednocześnie oraz rozmaite usługi systemowe, bez zauważalnych strat w wydajności pracy komputera. Od kiedy tylko AMD i Intel zaczęły ze sobą konkurować, zwiększały częstotliwość taktowania swoich układów. Jednak żaden z uzyskanych w ten sposób przyrostów wydajności nie był tak wysoki, jak ten który można będzie osiągnąć stosując przetwarzanie wielowątkowe (multi-threading).
Przez pewien czas mogliśmy być świadkami szumu, jaki powstał wokół układów dwurdzeniowych. Ich pojawienie się możemy jednak uznać za najbardziej znaczący krok w rozwoju procesorów, w perspektywie wielu kolejnych lat i to niezależnie od tego czy waszym faworytem jest AMD czy Intel. Komputer, wyposażony w jedną z tych dwugłowych bestii, będzie w stanie osiągnąć wydajność zbliżoną do możliwości systemu z dwoma osobnymi procesorami.
Wprowadzając w 2002 roku technologię Hyper Threading (HT), Intel starał się wykorzystać korzyści płynące z posiadania dwóch w pełni funkcjonalnych procesorów, umieszczonych w jednym układzie. Najważniejszym powodem, dla wprowadzenia technologii HT do architektury Pentium 4, był postępujący wyścig częstotliwości taktowania. Osiągnięty już został oszałamiający pułap 3,06 GHz, a potok wykonawczy, liczący 20 etapów, zrobił się nieco przydługawy. Z kolei, potok wykonawczy procesora AMD Athlona XP składał się z 10-ciu etapów dla jednostki arytmetyczno-logicznej (ALU), oraz 15-stu etapów dla jednostki zmiennoprzecinkowej (FPU). Pentium III pokonywało 10 etapów, a wersje oparte na rdzeniu Tualatin oraz modele Pentium M - 12. Athlon 64 również cechował się 12-etapowym potokiem.
Z jednej strony, procesor posiadający długi potok wykonawczy, jest w stanie wykonać wiele czynności w ramach jednego cyklu przetwarzania. Jest to szczególnie pożądane, gdy w grę wchodzi wykorzystanie rozszerzonych instrukcji SSE2 i SSE3. Z drugiej strony jednak, każda operacja oznacza dla procesora konieczność przejścia przez większość z tych etapów, co może niewątpliwie skutkować stratą cennych cykli zegara. Aby częściowo zrekompensować ten efekt, Intel zaimplementował strukturę logiczną, która umożliwia procesorowi Pentium 4 osiągnięcie wyższego, przeciętnego poziomu wykorzystania potoku wykonawczego - którego długość w architekturze Prescott wzrosła do 31 etapów - przez symulowanie obecności dwóch logicznych jednostek obliczeniowych.
Procesor wyposażony w technologię Hyper Threading nie jest w stanie osiągnąć wydajności zbliżonej do systemu dwuprocesorowego, ale pozwala uniknąć sytuacji, w której jakaś aplikacja obciążając w bardzo dużym stopniu procesor, powoduje paraliż całego systemu (co prowadzi do pojawienia się irytującego komunikatu "Program nie odpowiada"). Jeśli zdarzyło Wam się pracować na komputerze wyposażonym w dwa procesory, z procesorem wyposażonym w technologię HT, to pewnie zauważyliście, że system utrzymuje stałą gotowość do reagowania na działania użytkownika - właśnie na to pozwala Hyper Threading. W niektórych aplikacjach zastosowanie HT pozwoli zaobserwować wzrost szybkości działania, podczas gdy w innych wręcz spowolnienie. Zasadniczo jednak nie zauważycie większej różnicy w działaniu pomiędzy procesorem wyposażonym w tę technologię, a zwykłym procesorem.
Intel jest dumny ze technologii Hyper Threading i traktuje ją jako istotny etap pośredni pomiędzy układami jedno- i wielordzeniowymi. Technologia ta, jak twierdzi firma, utorowała drogę do rozwoju aplikacji opartych na wątkach, których uruchomienie na maszynach wyposażonych w HT, umożliwia osiągnięcie znacznego przyrostu wydajności pracy komputera. Faktem jest, że Intel zrobił wiele, aby spopularyzować programowanie ukierunkowane na wielowątkowość. Z kolei AMD zawsze twierdziło, że Hyper Threading to rozwiązanie tymczasowe i w przyszłości nie będzie już ono potrzebne i właśnie dlatego żaden z procesorów AMD nie został wyposażony w tą technologię.
Prawda, jak zwykle, leży pośrodku. W przypadku wykorzystania komputera do gier, użytkownik zwykle nie uruchamia kilku aplikacji w tym samym czasie, pozwalając procesorowi skoncentrować się na tej jednej, najważniejszej. Z kolei osoby używające komputera do zastosowań profesjonalnych najprawdopodobniej będą chciały mieć możliwość skorzystania z kilku działających jednocześnie programów. W tej sytuacji pomocny okaże się Hyper Threading. Co więcej, któż z nas nie korzysta obecnie z programu antywirusowego oraz/lub zapory ogniowej (firewalla). Jak długo liczba działających w tle usług, i poziom ich aktywności, nie przekracza pewnej wartości granicznej, tak długo jednordzeniowy procesor, pozbawiony HT, poradzi sobie z nimi bez większych problemów, a użytkownik nawet tego nie zauważy. Jednakże, im bardziej wzrasta ilość zadań, które system musi wykonywać w tym samym czasie, tym bardziej obecność Hyper Threading jest pożądana. Te same spostrzeżenia odnoszą się do sytuacji, w której mamy do czynienia z dwoma rdzeniami. Wróćmy zatem do głównego tematu, któremu poświęcony jest ten artykuł.
Źródło numer 2
Przegląd procesorów - maj 2005 - http://www.benchmark.pl/r.php?file=http://www.benchmark.pl/artykuly/testy/przeglad_procesorow2005/slowniczek.html
Wstęp
Niniejszy przegląd skupia się na współcześnie oferowanych procesorach i nie próbuje w żadnym razie być źródłem historycznym. Dlatego nie znajdziecie w nim charakterystyk serii procesorów, które nie są już rozwijane. Pozwoliliśmy więc sobie pominąć takie platformy, jak Socket A, 64-bitowe Athlony dla Socket 754 oraz starsze modele Celeronów i Pentium 4.
Tabelka segmentacji procesorów
model |
segment odbiorców |
częstotliwość |
liczba |
data |
Intel |
|
|
|
|
Celeron D |
budżetowy |
2.2 - 3.0 GHz |
1 |
czerwiec 2004 |
Pentium 4 500 |
masowy |
2.8 - 3.8 GHz |
1 |
luty 2004 |
Pentium 4 600 |
masowy |
3,0 - 3.6 GHz |
1 |
luty 2005 |
Pentium D |
wydajnościowy |
2.8 - 3.2 GHz |
2 |
maj 2005 |
Pentium 4 EE |
dla entuzjastów |
3.7 GHz |
1 |
luty 2005 |
Pentium EE |
dla entuzjastów |
3.2 GHz |
2 |
maj 2005 |
|
|
|
|
|
model |
segment odbiorców |
częstotliwość |
liczba |
data |
AMD |
|
|
|
|
Sempron (754) |
budżetowy |
1.6 - 1.8 GHz |
1 |
lipiec 2004 |
Athlon 64 (939) |
masowy |
1.8 - 2.4 GHz |
1 |
czerwiec 2004 |
Athlon X2 |
wydajnościowy |
2.2 - 2.4 GHz |
2 |
maj 2005 |
Athlon FX |
dla entuzjastów |
2.2 - 2.6 GHz |
1 |
wrzesień 2003 |
UWAGA: Nie należy porównywać wydajności różnych modeli procesorów wyłącznie na podstawie częstotliwości taktowania!
Gdyby ktoś chciał ogólnie porównać ich prędkości, podajemy pewną wskazówkę - w uproszczeniu można powiedzieć, że procesor AMD z danego segmentu jest około 50% szybszy od analogicznego Intela o tym samym zegarze.Przykładowo więc, prędkość Athlon 64 z zegarem 2 GHz odpowiada w przybliżeniu 3 GHz procesorowi Pentium 4 Intela (oba znajdują się w segmencie masowym).
Słowniczek skrótów
Ostatnio panuje swoista moda na skróty. Każdy producent pragnie wymyślić swoją nazwę (a najlepiej kilka) na określenie danej technologii. Ponieważ przekroczyło to już zdroworozsądkowe granice, poniżej przedstawiamy tabelkę, która pomaga odnaleźć właściwą drogę w gąszczu najróżniejszych skrótów.
MMX (MultiMedia eXtensions)
57 dodatkowych instrukcji multimedialnych, pozwalających procesorowi na szybkie wykonywanie operacji 2D (64-bitowe rejestry i szybkie przetwarzanie liczb stałoprzecinkowych)
SSE (Streamed SIMD Extensions) [= KNI]
71 dodatkowych instrukcji multimedialnych, wspomagających wykonywanie operacji 3D (128-bitowe rejestry i szybkie przetwarzanie liczb zmiennoprzecinkowych)
SSE2 [= WNI]
144 dodatkowe instrukcje multimedialne, będące udoskonalonymi wersjami MMX i SSE
SSE3 [= PNI]
13 dodatkowych instrukcji multimedialnych, rozszerzających SSE2 i wspomagających wielowątkowość
3DNow!
21 dodatkowych instrukcji multimedialnych, wspomagających wykonywanie operacji 3D (szybkie przetwarzanie liczb zmiennoprzecinkowych)
x86-64 [= EM64T = AMD64]
Zestaw dodatkowych instrukcji i rejestrów, pozwalający na adresowanie pamięci powyżej 4 GB oraz szybsze wykonywanie niektórych rodzajów obliczeń.
EDB (Execute Disable Bit) [= Enhanced Virus Protection (EVP) = NX Bit = XD Bit]
Udoskonalenie procesora, pozwalające na oznaczanie, które strony pamięci zawierają dane, a które wykonywalny kod. Pozwala to na dodatkową ochronę uruchomionych programów przed niektórymi rodzajami wirusów.
Cool'n'Quiet
Technologia pozwalająca zmniejszyć temperaturę i pobór prądu przez procesor. Polega na automatycznym obniżaniu częstotliwości jego taktowania, kiedy nie jest obciążony. Wykorzystywana przez AMD min. w procesorach Athlon 64.
Enhanced SpeedStep
Technologia Intela analogiczna do Cool'n'Quiet. Wykorzystywana min. w najnowszych procesorach Pentium.
HT - Hyper Threading
Technologia, występująca w procesorach Intel Pentium, umożliwiająca uruchamianie dwóch procesów na jednym rdzeniu. Pozwala na przyspieszenie aplikacji wielowątkowych o 10%-20% i poprawia działanie multitaskingu w systemie operacyjnym.
AMD Sempron (Socket 754)
typ rdzenia |
Venice (90nm) |
Rodzaje podstawki |
Socket 754 |
HyperThreading |
brak |
Oszczędzanie energii |
Cool and Quiet |
Kontroler pamięci |
128-bitowy jednokanałowy |
Częstotliwości taktowania |
1.6 - 1.8 GHz |
Szyna FSB |
200 MHz |
Pamięć cache |
L1 : 128 KB |
rozszerzenia instrukcji |
MMX, SSE, SSE2, 3DNow!, EVB |
Napięcie zasilania |
1.4V (Paris: 1.5V) |
Thermal Design Power |
62W |
Najpopularniejsze chipsety |
nForce 250, K8T800 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania i wielkościami cache:
Sempron 2600+ : 1,6 GHz (L2: 128 KB)
Sempron 2800+ : 1,6 GHz (L2: 256 KB)
Sempron 3000+ : 1,8 GHz (L2: 128 KB)
Sempron 3100+ : 1,8 GHz (L2: 256 KB)
Sempron 3300+ : 2,0 GHz (L2: 128 KB)
Sempron 3400+ : 2,0 GHz (L2: 256 KB)
Kilka słów o Sempronie
Sempron to nowa rodzina AMD, na którą składają się procesory z segmentu budżetowego. W wersji Socket 754 są to po prostu Athlony 64 z wyłączoną obsługą instrukcji 64-bitowych oraz zmniejszoną pamięcią podręczną. Nie posiadają też dwukanałowej obsługi pamięci (nie pozwala na to rodzaj zastosowanego gniazda). Poza tym procesory te zawierają wszystkie właściwości, którymi cechują się ich drożsi bracia. Do naszej dyspozycji pozostaje więc zarówno technologia Cool & Quiet (jednak ze względu na specyfikę działania została ona wyłączona w modelach poniżej 3000+), ochrona przed wirusami w postaci EVP oraz całe 256 KB cache L2.
Główne nowości
pierwsza seria tanich procesorów dla Socket 754
zintegrowany w procesor kontroler do jednokanałowej obsługa pamięci RAM
Największe zalety
Cena
wysoka wydajność przy niskiej częstotliwości
niska temperatura pracy, żadnych problemów z chłodzeniem
technologia Cool'n'Quiet - spowalnianie CPU do 1000 MHz przy małym obciążeniu (tylko modele 3000+ i wyższe)
Uwagi i podsumowanie
Sempron dorównuje, a nawet trochę przewyższa analogiczne procesory Celeron D zarówno zmniejszonym poborem mocy, jak i nieco wyższą wydajnością w większości aplikacji. Jeśli dodać do tego atrakcyjną cenę, rysuje nam się wizja ciekawego i niedrogiego procesora bardzo konkurencyjnego dla swojego Intelowego odpowiednika.
3 sierpnia 2005
AMD Sempron 3400+
Do naszych testów prosto z firmy AMD trafił najnowszy model procesora Sempron 3400+ (Socket 754). Seria Sempron to linia procesorów określanych mianem 'budżetowych', czyli tańszych w stosunku do 'głównej' linii Athon 64. Oparty na jądrze Venice wykonanym w technologii 90nm, z dodatkowymi instrukcjami SSE3 i x86-64. Najnowszy model oznaczony współczynnikiem 3400+ pracuje z tą samą częstotliwość co jego poprzednik 3300+, czyli 2.0 GHz - ale ma od niego dwa razy więcej pamięci cache L2. W sumie to też nic nowego, bo 256KB L2 miał już model o oznaczeniu 3100+. Firma AMD po prostu raz coś wyłącza, innym razem włącza ponownie i tak przybywa kolejnych modeli w ofercie. Jednak tym razem nowy Sempron po raz pierwszy obsługuje też 64-bitowe adresowanie i instrukcje SSE3. Według AMD wydajniejszy jest także zintegrowany kontroler pamięci - może obsłużyć moduły o różnej wielkości i zapełnione wszystkie gniazda pamięci z dwustronnymi modułami. Został też 'zniesiony' limit prędkości pamięci PC2700 (DDR-333)
W rzeczywistości nowy Sempron 3400+ bardziej przypomina teraz Athlona 64 'Venice' - w którym zablokowano połowę pamięci cache i połowę kontrolera pamięci. Dodanie obsługi 64-bitowych instrukcji w procesorze - bądź co bądź - low-endowym jest naszym zdaniem cokolwiek pozbawione sensu - zresztą tak samo jak wyposażenie w te instrukcje Celerona D. Czy wyobrażacie sobie, że ktoś kto oszczędza 25% na kosztach procesora, dokupi do tego 64-bitowy Windows i 4 GB ramu? Raczej mało prawdopodobne. Tak więc instrukcje x86-64 to kolejny gadżecik marketingowy w rękach producentów CPU - zarówno Intela i AMD. Jego współczynnik 3400+ mógłby sugerować, że będzie on dysponować wydajnością podobną do innych modeli AMD oznaczonych takim samym współczynnikiem. Nic bardziej mylnego. Oznaczenia w serii Sempron i Athlon 64 nie pokrywają się ze sobą - co potwierdza firma AMD - niestety wprowadzając nas w ten sposób trochę w błąd.
Z uwagi na cenę niższą o 25% w stosunku do Athlonów 64, Sempronik 3400+ wydaje się ciekawą pozycja dla osób, które chcą jak najwięcej zaoszczędzić przy budowaniu nowoczesnej i wydajnej platformy - z podstawką Socket 754 można kupić fajne płyty oparte na chipsecie nForce4. Pojawia się jednak dylemat; czy po ostatnich zapowiedziach firmy AMD dotyczących wycofania się z Socket 754, warto jeszcze 'pchać' się w tą podstawkę? Zapraszamy do naszych testów wydajności nowego Semprona 3400+.
AMD Athlon 64 (Socket 939)
typ rdzenia |
Venice (90nm) |
Rodzaje podstawki |
Socket 939 |
HyperThreading |
brak |
Oszczędzanie energii |
Cool'n'Quiet |
Kontroler pamięci |
128-bitowy dwukanałowy |
Częstotliwości taktowania |
1.8 - 2.4 GHz |
Szyna FSB |
200 MHz |
Pamięć cache |
L1 : 128 KB |
rozszerzenia instrukcji |
MMX, SSE, SSE2, 3DNow!, x86-64, EVP |
Napięcie zasilania |
1.4V (Winchester i Venice) |
Thermal Design Power |
67W - 89W |
Najpopularniejsze chipsety |
nForce4, K8T890 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania i wielkościami cache:
Athlon 3000+ : 1,8 GHz (L2: 512 KB)
Athlon 3200+ : 2,0 GHz (L2: 512 KB)
Athlon 3500+ : 2,2 GHz (L2: 512 KB)
Athlon 3800+ : 2,4 GHz (L2: 512 KB)
Athlon 4000+ : 2,4 GHz (L2: 1 MB)
Kilka słów o Athlonie 64
Athlon 64 to flagowy produkt AMD. W wersji Socket 939 po raz pierwszy dysponujący obsługą dwóch kanałów pamięci.
Główne nowości
nowe gniazdo Socket 939
zintegrowany w procesor kontroler do dwukanałowej obsługa pamięci RAM
obsługa 64-bitów (również w wersji Socket 754)
technologia oszczędzania energii Cool'n'Quiet (również w wersji Socket 754)
EVP - ochrona przed wirusami (również w wersji Socket 754)
Największe zalety
Technologia Cool'n'Quiet - spowalnianie CPU do 1000 MHz przy małym obciążeniu
niska temperatura pracy, żadnych problemów z chłodzeniem
wysoka wydajność przy niskiej częstotliwości
Uwagi i podsumowanie
To AMD jako pierwsze wprowadziło 64-bitowe instrukcje, jednak chyba zabrakło siły przekonywania, bo Microsoft z premierą swojego systemu, wykorzystującego nowe możliwości czekał ponad rok - aż do premiery 64-bitowych Pentiumów. Teraz sytuacja jest już komfortowa - zarówno dla Intela, jak i AMD. System jest dostępny i zgodny z prawie wszystkimi dotychczasowymi aplikacjami, natomiast nowe 64-bitowe programy powoli się pojawiają. Jednak póki co nie ma ich zbyt wiele - dotychczas pokazało się głównie kilka niewielkich narzędzi oraz parę gier. 64-bitowe instrukcje należy więc traktować bardziej jako dodatek, który może się przydać w przyszłości niż coś, co natychmiast trzeba mieć. Na szczęście 64-bity to nie jedyna zaleta Athlona 64. Procesory AMD jako pierwsze i póki co jedyne na rynku, posiadają kontroler pamięci nie w mostku północnym, jak u konkurencji, lecz w samym procesorze. W praktyce oznacza to mniejsze opóźnienia w dostępie do pamięci i wyższą prędkość działania całego systemu. Athlon 64 zawiera również modną ostatnio ochronę przed wirusami w postaci obsługi EVP. Dzięki nowym chipsetom, takim jak nForce4, czy K8T890 nie ma też problemu z dostępnością płyt głównych, obsługujących magistralę PCI-Express. Jednak głównym argumentem przemawiającym na korzyść tego procesora jest zastosowanie nim oszczędnego, mało grzejącego się rdzenia oraz efektywnej metody oszczędzania energii. Cool'n'Quiet stworzony przez AMD działa analogicznie do intelowego Enhanced SpeedStep - w momencie, kiedy procesor nie jest obciążony, automatycznie spada jego zegar oraz napięcie zasilania. Konsekwencją jest obniżenie temperatury działania, spowolnienie wiatraków chłodzących oraz kilkukrotna oszczędność energii. O ile jednak w przypadku Intela, wszystkie jego nowe procesory (nawet te z Enhanced SpeedStep) potrafią być bardzo gorące, o tyle temperatury Athlonów 64 są generalnie niższe nawet o 15-20 stopni. Biorąc pod uwagę wszystkie powyższe zalety, podsumowanie będzie krótkie - AMD jest oczywistym wyborem dla każdego, kto pragnie mieć szybki, a przy tym możliwie cichy i energooszczędny komputer.
AMD Athlon 64 FX
typ rdzenia |
San Diego (90nm) |
Rodzaje podstawki |
Socket 939 (Socket 940 - starsze wersje) |
HyperThreading |
brak |
Oszczędzanie energii |
Cool'n'Quiet |
Kontroler pamięci |
128-bitowy dwukanałowy |
Częstotliwości taktowania |
2.2 - 2.6 GHz |
Szyna FSB |
200 MHz |
Pamięć cache |
L1 : 128 KB |
rozszerzenia instrukcji |
MMX, SSE, SSE2, 3DNow!, x86-64, EVP |
Napięcie zasilania |
1.5V |
Thermal Design Power |
89W lub 104W (FX-55) |
Najpopularniejsze chipsety |
nForce4, K8T800 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania:
Athlon FX-51 : 2,2 GHz
Athlon FX-53 : 2,4 GHz
Athlon FX-55 : 2,6 GHz (ClawHammer)
Athlon FX-57 : 2,8 GHz (San Diego)
Kilka słów o Athlonie FX
Athlon FX to oznaczenie zarezerwowane dla high-endowych procesorów AMD. Ostatni procesor z tej rodziny, FX-55 to stary, dobry ClawHammer, taktowany zegarem o 200 MHz wyższym od najszybszego Athlona 64.
Najnowszy FX-57 produkowany jest w technologii 90nm, a jego rdzeń ma kodową nazwę San Diego.
Główne nowości
w wersji FX - najwyżej taktowany Athlon64
zwiększona podatność na podkręcanie dzięki odblokowanym mnożnikom
wszystkie procesory z serii FX mają 1 MB cache L2
Największe zalety
Wysoka wydajność przy niskiej częstotliwości
1 MB cache L2
niska temperatura pracy, żadnych problemów z chłodzeniem
technologia Cool'n'Quiet - spowalnianie CPU do 1000 MHz przy małym obciążeniu
Uwagi i podsumowanie
Athlony FX to takie same procesory, jak każdy inny jednordzeniowy Athlon 64, tyle że występujące z nieco wyższymi zegarami, wyposażone zawsze 1 MB pamięci podręcznej drugiego poziomu i mające odblokowany mnożnik. Biorąc pod uwagę, iż FX-55 wytwarzany jest w technologii 0,13 mikrona, jego taktowanie, wynoszące 2,6 GHz to całkiem niezły wynik. Trzeba jednak pamiętać, że płacimy ponad 3500 złotych za procesor minimalnie tylko szybszy od dwukrotnie tańszego Athlona 3800+, za to bardziej podatny na podkręcanie. Do tego w przeddzień premiery Athlona X2, zawierający tylko jedno jądro FX-55 nie wydaje się już tak atrakcyjny dla entuzjastów, jak wcześniej. AMD musi się więc pospieszyć i uzupełnić rodzinę FX o nowy, dwurdzeniowy procesor. Jeśli natomiast chodzi o modele FX-51 i FX-53 - jeżeli nie brać pod uwagę faktu, iż mają one odblokowany mnożnik, to kupowanie ich w obecnej chwili nie ma wielkiego sensu. Zostały już zastąpione przez analogiczne lub szybsze Athlony 64. 29 czerwca firma AMD oficjalnie ogłosiła swój kolejny procesor z rodziny FX. FX-57 pasuje w dotychczasowe podstawki Socket 939, produkowany jest w nowszej technologii 90nm, a jego rdzeń ma kodową nazwę San Diego. Częstotliwość taktowania jest o 200 MHz wyższa od poprzednika - FX-55 - i wynosi już 2.8 GHz. Jak każdy dotychczasowy FX, również i ten wyposażony jest w 1MB pamięci cache L2. Nowością są dodane rozszerzenia instrukcji SSE3 - te same, które pojawiły się niedawno w procesorach AMD Athlon 64 z rdzeniem Venice.
AMD Athlon 64 X2
typ rdzenia |
dwurdzeniowe |
Rodzaje podstawki |
Socket 939 |
HyperThreading |
brak |
Oszczędzanie energii |
Cool'n'Quiet |
Kontroler pamięci |
128-bitowy dwukanałowy |
Częstotliwości taktowania |
2.2 - 2.4 GHz |
Szyna FSB |
200 MHz |
Pamięć cache |
L1 : 2 x 128 KB |
rozszerzenia instrukcji |
MMX, SSE, SSE2, SSE3, 3DNow!, x86-64, EVP |
Napięcie zasilania |
1.3V |
Thermal Design Power |
89W (model 3800+) |
Najpopularniejsze chipsety |
nForce4, K8T890 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania i wielkościami cache:
Athlon X2 3800+ : 2,0 GHz (cache L2: 2 x 512 KB)
Athlon X2 4200+ : 2,2 GHz (cache L2: 2 x 512 KB)
Athlon X2 4400+ : 2,2 GHz (cache L2: 2 x 1 MB)
Athlon X2 4600+ : 2,4 GHz (cache L2: 2 x 512 KB)
Athlon X2 4800+ : 2,4 GHz (cache L2: 2 x 1 MB)
Kilka słów o Athlonie 64 X2
Athlon X2 to najnowsza seria 64-bitowych, dwurdzeniowych procesorów AMD.
Główne nowości
pierwszy dwurdzeniowy Athlon 64
wymaga aktualizacji BIOS'u
Największe zalety
Wysoka wydajność przy niskiej częstotliwości
niska temperatura pracy, żadnych problemów z chłodzeniem
technologia Cool'n'Quiet - spowalnianie CPU do 1000 MHz przy małym obciążeniu
Uwagi i podsumowanie
AMD i Intel jednocześnie zaprezentowały nowe, dwurdzeniowe procesory. Daje to nadzieję na ich szybkie spopularyzowanie i powstanie odpowiedniego oprogramowania. Trudno jednak oprzeć się wrażeniu, że nowe chipy bardziej udały się koncernowi AMD. Po pierwsze, Athlony X2 są znacznie bardziej oszczędne w kwestii poboru energii, dzięki czemu nie musiały mieć obniżonej przez producenta częstotliwości taktowania. Po drugie, dzięki rozsądnemu zaprojektowaniu, nowe procesory bez problemu będą działać w starych płytach głównych - co niestety nie ma miejsca w przypadku Pentium D Intela. Generalnie rzecz biorąc, Athlon X2 jest oparty na bardziej obiecującej architekturze od swojego konkurenta - efektem jest większa szybkość i mniejsza prądożerność. O ile więc nowe Pentium D są na tyle kontrowersyjne, że trudno jednoznacznie odpowiedzieć na pytanie, czy stanowią optymalny wybór do nowego komputera, o tyle w przypadku Athlona X2 nie mamy takich wątpliwości - jeśli dwa rdzenie, to tylko AMD!
16 sierpnia 2005
Przegląd procesorów : AMD Athlon 64 X2 3800+
Kolejny przedpremierowy procesor, który otrzymaliśmy z firmy AMD do testów, to nowy, tańszy dwurdzeniowy Athlon 64 X2 3800+. Taktowany częstotliwością 2 GHz, wyposażony w podwójną pamięć cache ; dla każdego rdzenia po 512KB L2 i po 128KB pamięci L1 (64KB dane + 64KB instrukcje). Nowy model jest obecnie 'najsłabszym' procesorem w serii X2, z zegarem o 200 MHz niższym od Athlona X2 4200+. Nie trudno się domyślić, że firma AMD zdecydowała się na wydanie tańszej wersji X2 z uwagi na atrakcyjną cenę dwurdzeniowych CPU swojego konkurenta - Intel Pentium D 820 kosztuje zaledwie 1100 zł. Jak na razie najtańszy X2 kosztuje dwa razy więcej, podczas gdy zapowiadana cena X2 3800+ ma już ponoć ostro rywalizować z Pentium D 820 lub 830. Oprócz niższej częstotliwości taktowania, albo lepiej było by napisać; właśnie za jej sprawą, Athlon 64 X2 3800+ pobiera jedynie ~90W energii, co jest jego jedną z głównych zalet. W połączeniu z technologią Cool'n'Quiet jest to niewątpliwie najchłodniejszy wśród najwydajniejszych obecnie procesorów. benchmarkach testujących wielowątkowość i platformy wieloprocesorowe, Athlon 64 X2 3800+ jest do 50% wydajniejszy od Athlonów 64 z ta samą częstotliwością 2 GHz i jednym rdzeniem. Miejscami wykazuje też średnio o 5-10% lepsze osiągi niż Pentium D 820. Wolniejszy natomiast jest o około 20% od najszybszego Athlona 64 X2 4800+. Zapraszamy do najnowszego zestawienia wyników CPU w którym umieściliśmy już X2 3800+
Intel Celeron D
typ rdzenia |
Prescott (90nm) |
Rodzaje podstawki |
Socket 478 |
HyperThreading |
brak |
Częstotliwości taktowania |
2.36 - 3.06 GHz |
Szyna FSB |
533 MHz (zewnętrzna) |
Pamięć cache |
L1 : 16 KB +12kµops |
rozszerzenia instrukcji |
MMX, SSE, SSE2, SSE3, |
Napięcie zasilania |
1.35V - 1.375V |
Thermal Design Power |
73W lub 84W (seria J) |
Najpopularniejsze chipsety |
i865, i915 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania:
Celeron D 315 : 2,26 GHz
Celeron D 320 : 2,40 GHz
Celeron D 325 : 2,53 GHz
Celeron D 330 : 2,66 GHz
Celeron D 335 : 2,80 GHz
Celeron D 340 : 2,93 GHz
Celeron D 345 : 3,06 GHz
Kilka słów o Celeronie D
Celeron D to niskobudżetowa seria procesorów Intela, tym razem oparta na nowym jądrze Prescott. W stosunku do starych Celeronów z rdzeniem Northwood, charakteryzuje się nowymi instrukcjami SSE3, szyną FSB 533 MHz oraz tym, co najważniejsze z punktu widzenia wydajności - zwiększeniem pamięci cache ze 128 KB do 256 KB.
Główne nowości
256 KB L2 - dwa razy większy cache niż w poprzednich Celeronach
przyspieszona z 400 do 533 MHz szyna FSB
nowe instrukcje SSE3
EDB (tylko w serii J)
wymaga zgodnej z nim płyty głównej (w przypadku Socket 478)
Największe zalety
Cena
znakomita podatność na podkręcanie (poprzez podnoszenie szyny FSB z 133 na 166 MHz)
Uwagi i podsumowanie
Intel zrobił miłą niespodziankę swoim klientom (przy okazji odpierając ataki ze strony coraz szybszego i tańszego Semprona), wprowadzając na rynek o połowę szybszy procesor budżetowy. Wystarczyła stara sztuczka - podwojenie pamięci podręcznej drugiego poziomu, żeby architektura NetBurst dostała skrzydeł. Efekt jest piorunujący - system działa wyraźnie szybciej, a niektóre programy (zwłaszcza gry) - niemal 2 razy wydajniej.
Niestety Celeron D to Prescott, a Prescott lubi się grzać. Trzeba więc wziąć pod uwagę, iż w większości przypadków komputer po włożeniu nowego procesora nie będzie już tak cichy, jak poprzednio. Na szczęście w przeciwieństwie do swoich droższych odpowiedników, Celerony D są taktowane niższymi zegarami, co przekłada się na zmniejszone wydzielanie ciepła.
W poprawionej wersji J, Celeron D zyskał również obsługę Execute Disable Bit, co zwiększa ochronę przed wirusami. Nowy układ nie obsługuje natomiast technologii oszczędzania energii.
Celeron D jest ciekawym rozwiązaniem dla oszczędnych fanów Intela. Trzeba jednak wziąć pod uwagę fakt, iż konkurencyjny Sempron wydajnościowo depcze mu po piętach i na dodatek jest znacznie chłodniejszy.
Intel Pentium 4 seria 500
typ rdzenia |
Prescott (90nm) |
Rodzaje podstawki |
Socket 775 |
HyperThreading |
tak (2 procesory logiczne) |
Oszczędzanie energii |
Enhanced Intel SpeedStep (tylko stepping E0) |
Kontroler pamięci |
obsługiwany przez chipset |
Częstotliwości taktowania |
2.8 - 3.8 GHz |
Szyna FSB |
200 MHz |
Pamięć cache |
L1 : 16 KB +12kµops |
rozszerzenia instrukcji |
MMX, SSE, SSE2, SSE3, |
Napięcie zasilania |
1.4V |
Thermal Design Power |
84W lub 115W (począwszy od modelu 550) |
Najpopularniejsze chipsety |
i915, i925 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania:
Pentium 4 520 : 2,80 GHz
Pentium 4 530 : 3,00 GHz
Pentium 4 540: 3,20 GHz
Pentium 4 550 : 3,40 GHz
Pentium 4 560 : 3,60 GHz
Pentium 4 570 : 3,80 GHz
Kilka słów o Pentium 4 500
Przy okazji premiery Pentium 4 500, udało się Intelowi zrobić na rynku PC niemałe zamieszanie. Bardziej niż sam procesor, wyobraźnię pobudzała jednak liczba nowych technologii, związanych z jego wprowadzeniem.
Po raz pierwszy zastosowano nową magistralę PCI-Express, mającą w dłuższej perspektywie zastąpić dotychczasowe sloty PCI i AGP. Z myślą o zwiększonym poborze energii wprowadzono nowe, beznóżkowe gniazda Socket 775. Nowe chipsety i915 i i925 przyniosły natomiast obsługę pamięci DDR2.
Jeśli chodzi o wewnętrzną architekturę procesora, zwiększono rozmiar pamięci podręcznej L2 z 512 KB do 1 MB oraz wydłużono potok wykonawczy. W późniejszych wersjach dodano obsługę EDB (seria J) oraz technologię oszczędzania energii (stepping E0).
Główne nowości
nowa podstawka LGA 775
nowy rdzeń Prescott wykonany w technologii 0,09 mikrona
1 MB pamięci podręcznej L2
technologia oszczędzania energii: Enhanced SpeedStep Technology (tylko stepping E0)
poprawione bezpieczeństwo dzięki Execute Disable Bit (tylko wersja J)
Największe zalety
Technologia HyperThreading - zwiększa płynność pracy systemu przy działających równocześnie kilku aplikacjach.
Uwagi i podsumowanie
Nowe podstawki Socket 775 na dobre już zadomowiły się w komputerach biurkowych. Pamięci DDR2 niedługo prawdopodobnie staną się standardem. Szyna PCI-Express skutecznie wypycha AGP z rynku, a niedługo prawdopodobnie zacznie silnie konkurować z PCI.
Natomiast jeśli chodzi o sam procesor, to trzeba zauważyć, iż pierwsza wersja Prescotta choć odniosła sukces marketingowy, z technicznego punktu widzenia okazała się klapą. Przejście na technologię 0,09 mikrona spowodowało liczne problemy, z którymi Intel nie zdołał się na czas uporać. W efekcie Prescott bardzo się grzał, nie będąc jednocześnie specjalnie szybszym od swojego poprzednika opartego na jądrze Northwood - nawet pomimo dwukrotnego zwiększenia pamięci cache.
Na szczęście dzisiaj na rynku znajdują się już poprawione wersje Prescotta - co prawda ich wydajność pozostała na niezmienionym poziomie, ale za to charakteryzują się rozszerzoną funkcjonalnością i częściowo rozwiązanym problemem nadmiernego poboru mocy. Chodzi o procesory o steppingu E0 z serii J. Zawierają one mechanizm wspomagający ochronę przed wirusami (EDB) a do tego mniej się grzeją. O zastosowanej w nich technologii oszczędzania energii przeczytacie w dziale dotyczącym Pentium 4 600.
Najnowszy stepping procesora (E0) przy dużym obciążeniu wciąż charakteryzuje się wysokimi temperaturami. Jest jednak na tyle poprawiony, że można go zwolennikom Intela polecić. Przy zakupie trzeba natomiast uważać, żeby nie trafić na któregoś z pierwszych Prescottów, gdyż wówczas dostaniemy naprawdę bardzo mocno grzejący się procesor, na dodatek pozbawiony kilku ciekawych funkcji.
Intel Pentium 4 seria 600
typ rdzenia |
Prescott (90nm) |
Rodzaje podstawki |
Socket 775 |
HyperThreading |
tak (2 procesory logiczne) |
Oszczędzanie energii |
Enhanced Intel SpeedStep |
Kontroler pamięci |
obsługiwany przez chipset |
Częstotliwości taktowania |
3.0 - 3.6 GHz |
Szyna FSB |
200 MHz |
Pamięć cache |
L1 : 16 KB +12kµops |
rozszerzenia instrukcji |
MMX, SSE, SSE2, SSE3, x86-64, EDB |
Napięcie zasilania |
1.4V |
Thermal Design Power |
84W lub 115W (model 660) |
Najpopularniejsze chipsety |
i915, i925 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania:
Pentium 4 630 : 3,00 GHz
Pentium 4 640 : 3,20 GHz
Pentium 4 650 : 3,40 GHz
Pentium 4 660 : 3,60 GHz
Pentium 4 670 : 3,80 GHz
Kilka słów o Pentium 4 600
Wraz z premierą tego procesora miało miejsce wydarzenie bez precedensu - po raz pierwszy w historii to Intel zapożyczył zestaw instrukcji od swojego rywala, AMD. Dotychczas AMD było firmą, która wprowadzała do swoich chipów rozwiązania wypracowane wcześniej przez konkurenta. Mowa oczywiście o x86-64 (nazywanego też EM64T lub AMD64), czyli 64-bitowym rozszerzeniu instrukcji procesora, wprowadzającym pecety w świat szybkich obliczeń i obsługi pamięci powyżej 4 GB.
Poza tą rewolucyjną zmianą Intel postanowił również podjąć próbę walki z wadą, która od początku dręczyła użytkowników procesorów opartych na rdzeniu Prescott - dużą ilością wydzielanego ciepła. W Pentium 4 600 wprowadzono więc technologię oszczędzania energii, będącą rozszerzoną wersją rozwiązań znanych wcześniej z notebooków, czy konkurencyjnego Athlona 64.
Aby zwiększyć wydajność, w nowej wersji rdzenia powiększono też rozmiar pamięci podręcznej drugiego poziomu do 2 MB.
Główne nowości
64-bitowe instrukcje x86-64
technologia oszczędzania energii: Enhanced SpeedStep Technology
2 MB pamięci podręcznej L2
wymaga aktualizacji BIOS'u
Największe zalety
Technologia HyperThreading - zwiększa płynność pracy systemu przy działających równocześnie kilku aplikacjach.
technologia SpeedStep - spowalnianie CPU do 2800 MHz przy małym obciążeniu
Uwagi i podsumowanie
Nowe, 64-bitowe instrukcje mogą się przydać, tym bardziej, że jakiś czas temu mieliśmy już premierę Windows 64-bit Edition, a stare programy działają pod nowym systemem bez większych problemów.
Jednak w chwili obecnej, pomimo istnienia 64-bitowej wersji systemu, programów potrafiących w pełni wykorzystać jego nowe możliwości jest jak na lekarstwo. Dlatego uważamy, iż na dzień dzisiejszy najważniejszą zaletą Pentium 4 600 są nie tyle jego 64-bitowe instrukcje, co wprowadzenie do procesora technologii oszczędzania energii. Ich zastosowanie pozwoliło dwukrotnie zmniejszyć pobór mocy w stanie spoczynku. Oznacza to większą oszczędność energii i możliwość stosowania cichszych wiatraków.
Powiększenie pamięci drugiego poziomu do 2 MB nie jest natomiast specjalnie godne uwagi - oznacza tutaj co najwyżej kilkuprocentowy wzrost wydajności. W żadnym wypadku nie można mówić o takim skoku wydajnościowym, jak choćby w Celeronie D, gdzie dodanie 128 KB L2 przyspieszyło procesor niemalże dwukrotnie.
Pentium 4 600 to ciekawa konstrukcja, w której Intel zrobił wiele, żeby naprawić swoje błędy i udoskonalić nieudany rdzeń Prescott (wcześniej kilka z tych poprawek wprowadził do serii 500). Dokonane modyfikacje to krok w dobrym kierunku, ale procesor wciąż do chłodnych nie należy i Intel musi pamiętać, że jeśli chce skutecznie konkurować z AMD, będzie w przyszłości musiał dokonać radykalniejszych zmian i wymienić rdzeń na mniej prądożerny.
Intel Pentium D seria 800
typ rdzenia |
dwurdzeniowy Smithfield (90nm) |
Rodzaje podstawki |
Socket 775 |
HyperThreading |
brak |
Oszczędzanie energii |
Enhanced Intel SpeedStep |
Kontroler pamięci |
obsługiwany przez chipset |
Częstotliwości taktowania |
3.0 - 3.6 GHz |
Szyna FSB |
200 MHz |
Pamięć cache |
L1 : 16 KB +12kµops |
rozszerzenia instrukcji |
MMX, SSE, SSE2, SSE3, x86-64, EDB |
Napięcie zasilania |
1.4V |
Thermal Design Power |
95W lub 130W (model 840) |
Najpopularniejsze chipsety |
i955 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania:
Pentium D 820 : 2,80 GHz
Pentium D 830 : 3,00 GHz
Pentium D 840 : 3,20 GHz
Kilka słów o Pentium D 800
Seria 800 to kolejna po wprowadzeniu 64 bitów rewolucja na rynku pecetów. Tym razem pomysł polega na dodaniu do procesora drugiego rdzenia. Innymi słowy - otrzymujemy dwa procesory w jednym!
dwa rdzenie Smithfield w jednym procesorze
Główne nowości
dwa rdzenie
wymaga nowej płyty głównej
Uwagi i podsumowanie
Nie będzie wielkim uproszczeniem stwierdzenie, że Smithfield to po prostu dwurdzeniowy Prescott. Jednak pomimo, iż pasuje do podstawki Socket 775, wymaga nowej, zgodnej z nim płyty głównej oraz zmodyfikowanego BIOS'u.
Już Prescott nie był wzorem chłodnego procesora (delikatnie mówiąc). Rdzeń Smithfield potrafi z generować jeszcze więcej ciepła - nawet o kilkunaście procent przy tym samym zegarze. Dlatego, żeby w kwestii poboru mocy nie przekroczyć zdroworozsądkowych granic, Intel zdecydował się na taktowanie Pentium D mniejszymi zegarami od swoich poprzedników.
Czy nowe procesory są w związku z tym szybsze, nawet pomimo zmniejszenia taktowania? To zależy. Przyrost prędkości nastąpi przede wszystkim w aplikacjach, które zostały napisane z myślą o wielowątkowości. Oznacza to, że wszelkiego rodzaju programy do przetwarzania danych (enkodery, dekodery, renderery) będą działały nawet 80% szybciej od Prescotta taktowanego takim samym zegarem. Natomiast w programach niezoptymalizowanych - najczęściej grach - jednordzeniowe Pentium 4 będą działały szybciej - z racji swojego wyższego taktowania.
Na szczęście wszystko wskazuje na to, że nowe procesory nie będą miały wygórowanych cen - co najwyżej kilkanaście procent wyższe od swoich odpowiedników z serii 600. Oznacza to, że nowa technologia szybko trafi pod strzechy, a optymalizowanych z myślą o niej programów i gier będzie coraz więcej. Z drugiej strony, trzeba pamiętać, iż Pentium D to procesor w prostej linii wywodzący się od gorącego i mało energooszczędnego Prescotta. Do tego jego taktowanie, a wraz z nim wydajność, nie są takie wysokie, jak byśmy sobie tego życzyli.
Intel Pentium 4 Extreme Edition (EE)
//
typ rdzenia |
Prescott (90nm) |
Rodzaje podstawki |
Socket 775 |
HyperThreading |
tak (2 procesory logiczne) |
Oszczędzanie energii |
brak |
Kontroler pamięci |
obsługiwany przez chipset |
Częstotliwości taktowania |
3.73 GHz |
Szyna FSB |
266 MHz |
Pamięć cache |
L1 : 16 KB +12kµops |
rozszerzenia instrukcji |
MMX, SSE, SSE2, SSE3, x86-64, EDB |
Napięcie zasilania |
1.3V |
Thermal Design Power |
115W |
Najpopularniejsze chipsety |
i925XE Express, i955X Express |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania:
Pentium 4 Extreme Edition : 3,73 GHz
Kilka słów o Pentium 4 Extreme Edition
Pracujący z zegarem 3,73 GHz Pentium 4 Extreme Edition to Prescott z serii 600, taktowany o 133 MHz wyższym zegarem. Do tego pozbawiony technologii oszczędzania energii. Gorący potwór!
Główne nowości
najszybszy procesor Intela
FSB 1066 MHz
wymaga płyty głównej z odpowiednim chipsetem (np. i925XE, nForce 4 SLI Intel Edition)
Największe zalety
Wysoka wydajność i zapas mocy na dodatkowe podkręcanie
Uwagi i podsumowanie
Pentium 4 Extreme Edition 3,73 GHz to najszybszy obecnie procesor Intela. W większości programów, które nie robią dobrego użytku z wielowątkowości, wyprzedza nawet najszybsze modele Pentium D (razem z samym Pentium Extreme Edition 840). Wysokie taktowanie szyny FSB i samego procesora robią tutaj swoje.
Do tego dochodzą te same zalety, którymi cechuje się Pentium 4 600, a więc obsługa 64-bitowych programów i ochrona przed wirusami (EDB). Główne wady to wysoka cena i - tradycyjnie już w przypadku rdzeni Prescott - wysokie temperatury. Tym bardziej, że z powodu technicznych ograniczeń Enhanced SpeedStep, Pentium 4 EE 3,73 GHz nie jest w stanie obsługiwać technologii oszczędzania energii.
Jak na procesor z najwyższej półki przystało, Pentium 4 Extreme Edition świetnie się podkręca - osiągnięcie częstotliwości powyżej 4 GHz nie powinno sprawić problemu - pod warunkiem posiadania odpowiedniej płyty głównej i dobrego (głośnego albo wodnego) systemu chłodzenia. Tradycyjnie więc procesor ten nadaje się dla tych, którzy za wszelką cenę pragną najwyższej wydajności. Muszą jednak liczyć się z tym, że najnowsze, dwurdzeniowe procesory Intela i AMD potrafią w niejednej aplikacji zostawić Pentium 4 EE w tyle.
Intel Pentium Extreme Edition (EE) seria 800
jeszcze niedostępny w sprzedaży
typ rdzenia |
dwurdzeniowy Smithfield (90nm) |
Rodzaje podstawki |
Socket 775 |
HyperThreading |
tak (4 procesory logiczne) |
Oszczędzanie energii |
Enhanced Intel SpeedStep |
Kontroler pamięci |
obsługiwany przez chipset |
Częstotliwości taktowania |
3.2 GHz |
Szyna FSB |
200 MHz |
Pamięć cache |
L1 : 16 KB +12kµops |
rozszerzenia instrukcji |
MMX, SSE, SSE2, SSE3, x86-64, EDB |
Napięcie zasilania |
1.4V |
Thermal Design Power |
130W |
Najpopularniejsze chipsety |
i955 |
Tabela oznaczeń procesorów wraz z odpowiadającymi im częstotliwościami taktowania:
Pentium EE 840: 3,20 GHz
Kilka słów o Pentium Extreme Edition
Pentium Extreme Edition to nowe jądro Smithfield z paroma udogodnieniami: włączonym HyperThreadingiem i firmową podatnością na podkręcanie.
Główne nowości
dwa rdzenie i obsługa HyperThreadingu = 4 logiczne procesory w jednym
zwiększona podatność na podkręcanie dzięki odblokowanym mnożnikom
wymaga nowej płyty głównej
Uwagi i podsumowanie
Pentium Extreme Edition to po prostu Pentium D z włączonym HyperThreadingiem. Niestety wydajność całości wcale nie jest rewelacyjna - najszybszy Pentium 4 z serii 600 często przegania nowego Pentium Extreme Edition. Programy wielowątkowe chodzą szybciej, ale pomimo obecności czterech logicznych procesorów jest to zazwyczaj przyrost wynoszący zaledwie kilka procent.
Intel musiał więc wymyślić inny powód, dla którego ktoś będzie chciał kupić nowego i bardzo drogiego Extreme Edition. Ponieważ topowe procesory biurkowe kupują zazwyczaj entuzjaści i overclockerzy, wpadł na pomysł, żeby odblokować mnożniki. Dzięki temu wielbiciele podkręcania mogą przyspieszyć Pentium Extreme Edition nawet do 4 GHz i wyżej. Brzmi świetnie, ale smutna prawda jest jednak taka, że w wielu testach nawet tak podkręcony procesor jest w dalszym ciągu wolniejszy od starszego Pentium 4 660.
Trudno polecać Pentium Extreme Edition innym, niż wielbicielom najnowszych technologii, którzy w dodatku lubią sprawdzić się w maksymalnym podkręcaniu. Muszą do tego mieć gruby portfel, bo nowy procesor tani nie będzie. Niestety, nie będzie też grzeszył nadzwyczajną wydajnością.
Premiera nowej podstawki AMD AM2 - źródło: benchmark.pl
maj 2006
Na naszym biurku przedstawiciel najnowszej serii AM2:
AMD Athlon 64 FX-62 (K8 Windsor) - z kontrolerem DDR2
Oceniając to wydarzenie pragmatycznie, w zasadzie można by powiedzieć, że nic takiego szczególnego nie wydarzyło się. AMD wymieniło kontroler pamięci w swoich procesorach AMD64 na nowszy, popychając w ten sposób i swoje CPU, i całą branżę nieco do przodu. Intel przerzucił się przecież na DDR2 już w czerwcu 2004 roku, promując nam jednocześnie szynę PCI-Express.
Firma AMD odczekała, aż pamięci te staną się bardziej powszechne, tańsze i co najważniejsze szybsze, bo jak mogliśmy się przekonać podczas ich premiery w 2004r, DDR2-533 i DDR-667 wcale nie oferowały lepszych osiągów od odpowiednio DDR400 i DDR 550. Teraz, gdy na rynku jest już dostępna szeroka gamma względnie tanich modułów DDR2-675 i 800, a nawet 1066 MHz, wyposażanie procesora w kontroler pamięci do ich obsługi ma sens.
A DDR2 to nie tylko wyższe częstotliwości. Pamięci te mają mniejsze napięcie zasilania ~1.8V (dla porównania DDR aż 2.6V), zmniejszając tym samym pobór prądu i wytwarzanie ciepła o około 50%. Cechuje je ponadto zakończenie sygnału wewnątrz układu (ODT - On-Die Termination), zapobiegające powstawaniu błędów wskutek transmisji odbitych sygnałów. Mają usprawnienia operacyjne, sprawność i parametry czasowe zwiększające wydajność. (w praktyce tylko przy opóźnieniach CAS od 4 w dół).
A więc od teraz, zamiast dotychczasowych pamięci DDR400 ~ DDR550, przy najnowszych procesorach AMD na płycie głównej będziemy instalować nowe, lepsze pamięci typu DDR2.
|
Technologia Dual Data Rate (podwójny przepływ danych) przesyła dwie dane na jeden cykl zegara. Tak więc podczas używania na przykład procesora Athlon 64 z pamięciami DDR400 (lub inaczej PC3200), procesor odwołuje się do nich z częstotliwością 200 MHz, a nie 400 MHz. To właśnie dlatego pamięci DDR i DDR2 opisuje się częstotliwościami wyższymi niż rzeczywiste - a my przyjęliśmy je nazywać 'efektywnymi'. |
Nowy kontroler pamięci siłą rzeczy wymusza nowy typ podstawki - czy się nam to podoba czy nie - chociażby po to, aby nikt nie próbował wtykać ich w stare Sockety 939 lub 940, i odwrotnie.
Jest to zmiana raczej kosmetyczna i z całą pewnością mniej rewolucyjna, niż np: LGA775 Intela - przez wielu zresztą uważane jako posunięcie nieudane.
Nowe zapięcie dla wentylatorów... no cóż, jest kwestią sporną czy faktycznie jest potrzebne, ale skoro branża ma się kręcić, a AMD ma być lubiany w tej branży, to każdy coś musi coś na tym zyskać, także producenci coolerów.
Ale powiedzmy sobie szczerze, ile jest osób, które przesiądzie się ze starej platformy S939 na nową, zatrzymując sobie dotychczasowe chłodzenie? Zaledwie promil. Zostają mu stare pamięci DDR, więc czemu miałby się przejmować, że stary cooler nie pasuje do nowej płyty?
W płytach głównych dla AMD64 układ "north bridge" jest tylko mostkiem pomiędzy CPU a szyną graficzną (AGP lub PCI Express) i układem south bridge. Pojemność pamięci - łącznie z obsługiwanymi typami i obsługą dwukanałową - jest więc określana przez CPU, a nie przez chipset.
Efektem ubocznym tej architektury jest fakt, że nie ma zauważalnej różnicy w wydajności płyt głównych dla procesorów AMD64, ponieważ wszystkie korzystają z tego samego kontrolera pamięci, umieszczonego w procesorze.
Płyty główne z grafiką mają zintegrowany kontroler wideo, który umieszczony jest poza procesorem, co w zależności od użytego kontrolera wpływa na jej wydajność.
Kontroler pamięci wbudowany w procesory AMD64 może obsługiwać do czterech modułów pamięci na kanał. Tak więc w przypadku dwukanałowego systemu, może on kontrolować osiem modułów pamięci. Liczba dostępnych gniazd na płycie głównej jest ograniczona przez model płyty danego producenta.
Do dnia dzisiejszego mieliśmy do czynienia z trzema różnymi gniazdami dla procesorów AMD64. Liczba nóżek, a co za tym idzie typ podstawki na płycie głównej, określał różne specyfikacje kontrolerów pamięci:
Socket 754 - z jednokanałowym, 64-bitowym kontrolerem pamięci DDR (1 x 64bit).
Pierwsze modele procesorów Athlon 64, Turion 64 i Sempron socket 754.
Thermal Power |
AM2 |
S939 |
FX-62 |
125 W |
- |
X2 5000+ |
89 W |
- |
X2 4800+ |
65W |
110W |
X2 4600+ |
65W |
110W |
X2 4400+ |
65W |
89W |
X2 4200+ |
65W |
89W |
X2 4000+ |
65W |
- |
X2 3800+ |
35W |
89W |
64 3800+ |
65W |
89W |
64 3500+ |
35W |
67W |
64 3200+ |
35W |
67W |
Sempron 3600+ |
65W |
- |
Sempron 3500+ |
65W |
- |
Sempron 3400+ |
35W |
62W |
Sempron 3200+ |
35W |
- |
Sempron 3000+ |
35W |
62W |
Sempron 2800+ |
35W |
62W |
Socket 939 - z dwukanałowym 128-bitowym kontrolerem pamięci DDR (2 x 64-bit).
Modele procesorów Athlon 64, Athlon 64 X2, Athlon 64 FX i niektóre Opterony z serii 1xx.
Socket 940 - z dwukanałowym 128-bitowym kontrolerem pamięci DDR ECC.
Opteron i pierwsze modele Athlon 64 FX.
Socket AM2 - z dwukanałowym 128-bitowym kontroler pamięci DDR2 (2 x 64-bit).
Najnowsze modele procesorów Athlon 64, Athlon 64 X2 i Athlon 64 FX.
W tabelce po prawej umieściliśmy wszystkie modele nowych AM2, które mają się pojawić na rynku po 23 maja, a przy okazji porównanie współczynnika 'Thermal Power' w stosunku do obecnej serii Socket 939/754 (przydatny komparator AMD znajdziecie na stronie www.amdcompare.com/us-en/desktop).
Jeśli podane nam przez AMD, tuż przed premierą, dane dotyczące AM2 są 'prawdziwe',
to nowa seria procesorów będzie pobierać dużo mniej mocy i tym samym wydzielać znacznie mniej ciepła. W niektórych przypadkach nawet o połowę mniej!
W samej architekturze procesorów niewiele się zmieniło... może to i dobrze, bo Athlony 64 były bardzo udanymi procesorami i szkoda, aby AMD coś w nich niechcący popsuło.
Komunikacja pomiędzy procesorami AMD64 a mostkiem następuje poprzez szynę nazywaną HyperTransport. Szybkość HyperTransport zależy od modelu procesora. Typowe wartości to 3200 MB/s (znane też jako 800 MHz, 1600MHz lub 6400 MB/s) lub 4000 MB/s (1000MHz, 2000MHz lub 8000 MB/s).
Podczas gdy wszystkie procesory AMD64 przeznaczone są dla komputerów stacjonarnych i notebooków - Athlon 64, Athlon 64 FX, Athlon 64 X2, Sempron i Turion 64 - mają tylko jedną szynę HyperTransport, modele AMD64 dla serwerów i stacji roboczych - Opteron - mogą mieć więcej niż jedną szynę HyperTransport.
Procesory AMD64 wyposażone są w łącze krzyżowe ('crossbar'), które czuwa nad przesyłem danych i komend z i do procesora, pamięci i szyn HyperTransport.
Wszystkie procesory AMD64 wyposażone są w 64 KB pamięci podręcznej rozkazów (instruction cache L1) i 64 KB pamięci podręcznej danych (data cache L1). Pamięć podręczna L2 różni się w zależności od modelu procesora. W procesorach dual-core, cache L2 jest podzielona, tak aby każdy rdzeń miał swoją pamięć podręczną. W najnowszych procesorach Intela (Core Duo i Core 2 Duo) procesor ma tylko jedną pamięć podręczną L2, która jest dzielona przez oba rdzenie (Intel twierdzi, że rozwiązanie to zwiększa wydajność).
W przypadku architektury AMD64 scieżka danych pomiędzy pamięcią podręczną L2, a pamięcią podręczną danych L1 ma szerokość 128 bitów. Dla porównania w siódmej generacji procesorów Intela Pentium 4, ścieżka ta ma 256 bitów.
To w zasadzie wszystko co warto wiedzieć. Raczej nie ma sensu przynudzać o przetwarzaniu potokowym AMD64, jednostce pobierania, dekodowaniu, rozsyłaniu i planowaniu, czy jednostce wykonawczej. Jeśli chcecie dowiedzieć się więcej na ten temat architektury tych procesorów, poczytajcie AMD64 Architecture Programmer Manual Vol. 3: General Purpose and System Instructions. Znacznie lepsze niż liczenie baranków przed snem ;)
|
AMD 64 |
AMD 64 |
technologia wykonania |
90 nm SOI |
90 nm DSL SOI |
zintegrowany kontroler pamięci |
DDR |
DDR2 |
obsługa pamięci |
DDR 400 |
DDR2 do 667 MHz (A64) |
maksymalna |
6.4 GB/s |
do 12.8 GB/s |
łączna efektywna |
14.4 GB/sec |
20.8 GB/sec |
szyna FSB |
200 MHz |
200 MHz |
szyna |
1.0 - 8GB/sec |
1.0 - 8GB/sec |
pamięć cache |
L1 64K + 64K |
L1 64K + 64K |
oszczędzanie energii |
Cool'n'Quiet |
Cool'n'Quiet |
zabezpieczenia |
EVP (Enhanced Virus Protection) |
EVP (Enhanced Virus Protection) |
dodatkowe instrukcje |
MMX, 3Dnow!, SSE, SSE2, SSE3 |
MMX, 3Dnow!, SSE, SSE2, SSE3 |
inne |
- |
AMD Virtualization technology |
Thermal Design Power |
62 - 110 W |
35 - 65 W |
Nowe procesory Intela: Core 2 - benchmark.pl
lipiec 2006
W latach 90 ubiegłego wieku, firma Intel wizje swojego rozwoju technologicznego snuła dość powolnie. Nie zagrażała jej konkurencja ze strony Cyrixa i AMD. Prawdziwy bój zaczął się na początku roku 2000. Wtedy AMD debiutowało ze swoim procesorem K7, a Intel zaczął poważnie traktować rywala i dotarło do niego, iż nie jest sam na rynku. Obecnie każdy z 'liderów' prześciga się ogłaszaniu nowych technologii i o ile Intel w istocie jest jednym z największych producentów chipów na świecie, to według opinii wielu użytkowników to firma AMD oferowała 'lepsze' i wydajniejsze układy.
Nie tak dawno pisaliśmy na temat nowej platformy AMD AM2, która wniosła trochę świeżości na rynek PC (najważniejsze to obsługa DDR 2 w procesorach AMD). Mija dosłownie chwila, a doniesienia prasowe informują o zbliżającej się premierze nowych procesorów Intela o kodowej nazwie Conroe i Merom oraz Woodcrest. Pierwszy z nich dedykowany jest do komputerów typu desktop, Merom dla technologii mobilnych, natomiast ostatni do stacji serwerowych.
Co nowego serwuje nam Intel?
Jeśli rozpatrywać wydajność CPU pod kątem częstotliwości taktowania, to bez dwóch zdań, na rynku królował do tej pory AMD ze swoim Athlonem FX-62 (2.80GHz). Intelowi cały czas zarzucano, że jego wydajność desktopowych CPU opiera się wyłącznie na wysokich częstotliwościach taktowania. Jednak to się zmieni, bo zbliża się najbardziej oczekiwana premiera roku 2006 - Intel Core 2, a wraz z nią Extreme X6800 - 2.93GHz.
Charakteryzując w największym skrócie nową serie procesorów Intela, będzie ona oferowała znaczenie większą wydajnością przy dużo niższych zegarach, oraz mniejszy pobór energii - co oznacza, że CPU będą znacznie chłodniejsze. Intel musi odbudować swoje zaufanie wśród graczy i wymagających użytkowników, które niegdyś utracił grzejnikami z rodziny 500, 600 i 800, oraz architekturą NetBurst, która okazała się klapą.
Jedną ze zmian natury kosmetycznej będzie zmiana systemu kodowego oznaczania układów. Kod nowych jednostek będzie 5-znakowy. Pierwszym jest litera, która poinformuje nas o zakresie poboru energii:
U - oznacza bardzo niski pobór mocy - poniżej 15W
L - niski pobór mocy - 15-24W
T - średni pobór z zakresu 25-55W
E - oznaczony tą literką CPU pobierze moc z zakresu 55-75W,
X - to najwyższy bardzo mocy, powyżej 75W.
Pozostałe 4 znaki kodu to cyfry, określające rodzinę i zegary. Układy Conroe należą do linii 4000 i 6000, a układy Merom do linii 5000 i 7000.
Bardzo łatwo domyśleć się, że taki system oznaczeń sugeruje, iż Intel stawia teraz na ograniczanie wydzielanego ciepła. Procesor Intel Core 2 X6800 (2.93GHz), mimo iż zalicza się do najwyższej grupy, ma 95W TDP (Total Designed Power), więc plasuje się w klasie średnio 'grzejących' jednostek. Dla porównania najszybsza jednostka konkurenta - Athlon FX-62 (2.80Ghz) - ma TDP już 125W. Różnica 30W jest spora, a większe wydzielanie ciepła oznacza też mniejsze możliwości OC.
Na tegorocznym forum poświęconym technologii Intela - Intel Developer Forum Spring 2006 (IDF) - zaprezentowany układ Conroe pokazał próbkę swoich możliwości, dosłownie pożerając swojego młodszego brata, najszybszego jak dotąd na rynku Pentium D 950. Wiadomo, że testy były przeprowadzane 'pod dziennikarzy', więc miały ukazać nowy procesor w jak najlepszym świetle. Jednak po testach, które już przeprowadziliśmy w naszej redakcji, wiemy, że taktowany zegarem 2.4 GHz model Core2 Duo E6600, jest faktycznie znacznie wydajniejszy od 3.4 GHz'owego Pentium D 950.
Cała idea Conroe, Merom oraz Woodcrest, jest rozwinięciem technologii, na której oparty został procesor Yonah, czyli podstawa mobilnej platformy trzeciej generacji. W zależności od liczby rdzeni w procesorze, będą one oznaczane Core Duo oraz Core Solo.
Nowości w nowych CPU jest dużo więcej. Najważniejszą, znacznie podwyższającą wydajność jest Wide Dynamic Execution. Jest to 14-etapowy potok wykonawczy, dzięki któremu jest możliwe przetworzenie w jednym cyklu zegara 4 instrukcji. Dotychczas w jednym cyklu były możliwe tylko trzy. Różnica pozornie niewielka, ale mająca dać aż 33% wzrost wydajności w stosunku do obecnej generacji procesorów.
Macro-fusion to technologia, która pozwala procesorowi na łączenie ciągów instrukcji w pakiety i przetwarzanie ich w ciągu jednego cyklu zegara. Do tej pory była znana jako Micro-fusion w Pentium 4, z tą różnicą, iż zarządzała wewnętrznymi operacjami procesora. Natomiast Macro-fusion działa w oparciu o kod x86.
Taka zmiana powoduje przetworzenie funkcji IF w jednym cyklu zegara układu, gdy obecnie odbywa się to w dwóch taktach. Jeden dotyczy przetworzenia instrukcji CMP (compare), a drugi JNE (jump). Są to tak zwane instrukcje skoku warunkowego. Ich udział w kodach programów sięga kilkudziesięciu procent, więc przyspieszenie przetworzenia danych w oparciu o tę cechę spowoduje kolejny wzrost wydajności.
Intelligent Power Capability - zastosowanie tego rozwiązania znacznie wpłynie na ograniczenie poboru energii przez jednostkę. Na bieżąco będzie monitorowane zapotrzebowanie na moc obliczeniową rdzeni. Dzięki temu zużycie mocy będzie ograniczone do minimum.
Advanced Digital Media Boost, to opracowane przez Intela rozwiązanie mające zapewnić obsługę wszystkich multimedialnych operacji SSE (Steraming SIMD Extension w jednym cyklu zegara ze 128-bitową dokładnością (do tej pory wymagane było wykonanie od 2 do 4 taktów). SIMD (Single Instruction, Multiple Data) = jedna instrukcja wiele danych.
Wykorzystanie wszystkich instrukcji SSE przez Core 2 ma podnieść wydajność procesorów w grach, przetwarzaniu video oraz tworzeniu bardziej realistycznych wirtualnych światów. Tutaj podobnie, wydajność ma wzrosnąć o ok. 30%.
Advanced Smart Cache. W Pentium D 950 mamy do dyspozycji pamięć podręczną L2 w postaci 2 x 2MB. W Conroe natomiast całe 4MB jest współdzielone z dwoma rdzeniami. Gdy jedno jądro będzie w stanie spoczynku, drugie będzie miało do dyspozycji całe 4096 KB pamięci. Podobnie w sytuacji, gdy jedno z nich będzie bardziej obciążone.
Takie rozwiązanie ma znacznie przyspieszyć dostęp do pamięci przez oba rdzenie, ale istnieje też spiskowa teoria, że ostatecznie jądra mogą się 'pogubić'. Każde z nich w chwili równoczesnej pracy będzie chciało uzyskać dostęp do pamięci L2, w konsekwencji może dojść do 'zapętlenia' i spowolnienia pracy układu. Jak będzie naprawdę?
Socket 775. Podstawka co prawda nie zmieni się - pozostanie nadal LGA 775 - ale i tak większość płyt z chipsetem 945-975 nie będzie obsługiwać nowych procesorów.
Intel idąc za ciosem informuje, że w 2007 roku ukaże się układ 4 rdzeniowy, więc teoretycznie dwukrotnie wydajniejszy od Conroe. Pojawiły się także informacje o planach przejścia producenta na produkcję w technologii 45nm. Można powiedzieć, że AMD odpadnie w przedbiegach ze swoją technologią 65nm, ale być może to tylko kwestia czasu, jak i od tej firmy usłyszymy coś równie rewolucyjnego.
Nowy procesor, a więc nowe chipsety
Z chwilą wejścia na rynek nowego procesora, zazwyczaj rodzi się nowy chipset dedykowany dla tej jednostki. Nie inaczej jest tym razem. Dla platformy Intel Core 2 powstały nowe układy o nazwie P965 Express, znany pod kodowa nazwą Broadwater, Q965/Q963 Express oraz G965 Express.
P965 Express będzie obsługiwał magistralę FSB 533/800/1066 MHz oraz pamięci DDR2 800, które będą działać z technologią FMA (Fast Memory Access), zapewniającą większy i szybszy dostęp do pamięci. Przepustowość pamięci ma dochodzić do 12.8GB/s.
Nowy chipset będzie korzystał z mostka północnego MCH oraz mostków południowych ICH8-R lub ICH8-DH. W wersji R płyta otrzyma dwa dodatkowe porty eSATA oraz sześć portów Serial-ATA II. Patrząc na powyższy schemat zauważamy, że starsze porty Parallel ATA (ATA) nie będą wspierane - ich czas dobiegł końca i muszą ustąpić miejsca nowej technologii.
Chipsety w obu wersjach będą posługiwały się technologią QST (Quiet System Technology), która będzie polegała na automatycznej regulacji prędkości wentylatorów. Będzie także możliwość automatycznego aktywowania lub dezaktywowania poszczególnych portów USB w zależności od zapotrzebowania.
Układ Q965 Express jest dedykowany dla komputerów wykorzystywanych w przedsiębiorstwach. Stanowić będzie część nowej platformy o nazwie Averill, skonstruowanej z myślą o przeznaczeniu do aplikacji biurowych. Będzie obsługiwał tą samą magistralę FSB oraz pamięci.
Od poprzednika różni się przede wszystkim zintegrowanym akceleratorem grafiki Intel Graphics Media Accelerator 3000. To już czwarta generacja graficznych chipsetów tego producenta. Q965 sprzętowo udzieli wsparcia nowemu systemowi operacyjnemu Windows Vista. Podobnie jak P965, będzie obsługiwał do 10 portów USB 2.0, porty Serial-ATA II oraz eSATA.
Drugą bardzo ciekawą funkcją chipsetów serii Q jest Intel Active Management Technology (AMT). Dzięki temu będzie możliwe łączenie wielu pojedynczych komputerów w jedną strukturę. Administrator będzie miał możliwość aktywowania lub dezaktywowania poszczególnych systemów w zależności od potrzeb. W skład AMT wchodzi także sprzętowy i programowy firewall o nazwie Network Filtering. Blokujący przedostawanie się groźnych wirusów i robaków oraz próby nieautoryzowanego dostępu. Isolation Function umożliwi odłączenie zainfekowanego systemu od reszty, uniemożliwiając tym samych rozprzestrzenianie się wirusa.
Chipset G965 dedykowany jest do domowych komputerów, gdzie nie będzie zależało na ogromnej wydajności , lecz niskim poborze mocy i cichej pracy komputera. Możliwości układu są bardzo podobne do pozostałych chipsetów. Taki sam mostek południowy ICH8-R lub ICH8-DH. Chipset G965 umożliwia podłączenie monitora lub telewizora za pośrednictwem nowego złącza HDMI oraz DVI, S-Video, Composite oraz HDTV.
Zintegrowana grafika zaoferuje wsparcie dla DirectX 9.0c, Shader Model 3.0 oraz OpenGL 1.5, mające zapewnić wystarczające możliwości tworzenia grafiki 3D (zależy do czego?).
Przewidziana jest kompatybilność z obrazem w formacie HD 720p, 1080i oraz 1080p. Obraz może być wyświetlany w maksymalnej rozdzielczości 2048x1536 z częstotliwością odświeżania 75Hz.
Intel Clear Video Technology to sprzętowe i programowe funkcje mające na celu znaczną poprawę jakości wyświetlanego obrazu. Zastosowano także możliwość podglądu obrazu z innego złącza dzięki funkcji PIP (Picture In Picture).
Core 2 i co dalej?
Gdyby nie konkurencja, Intel mógłby zmonopolizować cały rynek PC. Począwszy od domowych pecetów poprzez laptopy i komputery biurowe, a skończywszy na stacjach serwerowych.
Sceptyczni twierdzą, że Intel prześcignie Athlona w prędkości otwierania Worda lub Excela, a gierki i multimedia pozostaną domeną jednostek AMD. Na razie nic nie sugeruje takiego rezultatu.
Pewnym jest fakt, iż Intel musi twardo ruszyć do ataku jeśli chce odzyskać dobre imię i prestiż wśród graczy komputerowych, które aktualnie dzierży AMD. Z wydajnością jaką oferuje Core2 oraz ich przewidywanymi cenami, bynajmniej nie powinno to być dla Intela trudne zadanie.
A plany na najbliższe lata przedstawiają się następująco. Produkcja nadal będzie się odbywała w technologii 65nm.
Kategoria |
Nazwa kodowa |
Rdzeń (core) |
Pamięć L2 |
Termin |
Desktopowe |
Kentsfield |
2-rdzeniowe |
4 MB |
połowa 2007 |
Desktopowe |
Conroe |
2-rdzeniowe, |
4 MB współdzielona |
koniec 2006 |
Desktopowe |
Allendale |
2-rdzeniowe, |
2 MB współdzielona |
koniec 2006 |
Desktopowe |
Cedar Mill |
Jednordzeniowe |
512 kB, 1 MB, 2 MB |
początek 2006 |
Desktopowe |
Presler |
2-rdzeniowe |
4 MB |
początek 2006 |
Desktopowe / Mobilne |
Millville |
Jednordzeniowe |
1 MB |
początek 2007 |
Mobilne |
Yonah2 |
2-rdzeniowe, Jednordzeniowe |
2 MB |
początek 2006 |
Mobilne |
Yonah1 |
Jednordzeniowe |
1, 2 MB |
połowa 2006 |
Mobilne |
Stealey |
Jednordzeniowe |
512 kB |
połowa 2007 |
Mobilne |
Merom |
2-rdzeniowe, Jednordzeniowe |
2, 4 MB współdzielona |
koniec 2006 |
Serwerowe |
Sossaman |
2-rdzeniowe, Jednordzeniowe |
2 MB |
początek 2006 |
Serwerowe |
Woodcrest |
2-rdzeniowe, Jednordzeniowe |
4 MB |
połowa 2006 |
Serwerowe |
Clovertown |
4-rdzeniowe, Wielordzeniowe |
4 MB |
połowa 2007 |
Serwerowe |
Dempsey |
2-rdzeniowe |
4 MB |
połowa 2006 |
Serwerowe |
Tulsa |
2-rdzeniowe, |
4, 8, 16 MB |
koniec 2006 |
Serwerowe |
Whitefield |
4-rdzeniowe |
8 MB, 16 MB współdzielona |
początek 2008 |
Wiemy, że dopiero w fabryce D1D Intela w Hillsboro w Oregonie odbywać się będzie produkcja układów w technologii 45nm. Pierwsza masowa produkcja w nowej technologii ma się rozpocząć drugiej połowie 2007 roku. Podstawowe wielkości pamięci podręcznej L2 procesorów mają być zwiększona o ok. 50%, będą wynosić 3 MB, natomiast dla dwurdzeniowych odpowiednio 6 MB.
Kategoria |
Nazwa kodowa |
Rdzeń (core) |
Pamięć L2 |
Termin |
Desktopowe |
Wolfdale |
2-rdzeniowe |
3 MB |
2008 |
Desktopowe |
Ridgefield |
2-rdzeniowe |
6 MB współdzielona |
2008 |
Desktopowe |
Yorkfield |
8-rdzeniowe |
12 MB współdzielona |
2008+ |
Desktopowe |
Bloomfield |
4-rdzeniowe |
---- |
2008+ |
Desktopowe / Mobilne |
Perryville |
2-rdzeniowe |
2 MB |
2008 |
Mobilne |
Penryn |
Jednordzeniowe |
3, 6 MB współdzielona |
2008 |
Mobilne |
Silverthorne |
---- |
--- |
2008+ |
Serwerowe |
Hapertown |
8-rdzeniowe |
12 MB współdzielona |
2008 |
Powyższe dane nie są oficjalne, ale co nie znaczy, że nie są prawdziwe. Nie zmienia to faktu, iż walka pomiędzy Intelem, a AMD w najbliższych latach zapowiada się bardzo ciekawie. To tylko plany Intela w stosunku do swoich produktów, AMD też na pewno coś szykuje. Wiadomo, że Intel planuje pod koniec lipca br. obniżyć o ok. 60% ceny, niektórych swoich procesorów.
Tak prezentuje się oficjalna roadmapa Intela na najbliższy okres. Z biegiem czasu na pewno ulegnie niewielkim zmianom.
Na początku 2007 Intel planuje wprowadzenie na rynek platformy Santa Rosa. W praktyce mają to być niewielkie SFF (small-form-factor), komputery pracujące z procesorami Core 2 Duo.
Idea tej platformy ma zbliżyć jednostki stacjonarne do notebooków pod względem poboru energii i wydzielanego ciepła. SFF jest jednym z elementów strategii Intela, Mobile on Desktop (MoDT). Na tego typu urządzeniach instaluję się zazwyczaj Windows XP Media Center Edition, wówczas taki sprzęt pełni rolę domowego centrum rozrywki.
Nowe procesory Intela: Quad Core 2 - benchmark.pl
listopad 2006
Core2 z napędem na cztery rdzenie
O nowej Mikroarchitekturze procesorów Core2 pisaliśmy już odrobinę podczas premiery Core2 Duo. Ponowny wykład z tego, jak działa architektura Quad byłaby z pewnością interesująca dla garstki osób. Ale zamiast ponownie bawić się w 'inżynierów', bo w sumie póki co wiemy tylko tyle, ile przeczytamy z PDF'ów lub innych stron, dociekać jak co zostało zbudowane, udawać że potrafimy rozgryźć to, co twardsze głowy niż nasze projektowały przez kilkanaście miesięcy, wskazywać słabe punkty i błędy, lepiej chyba będzie poświęcić ten czas, aby odpowiedzieć sobie na ciekawsze pytanie: i co nam przyjdzie z tych czterech rdzeni?
W jednym z artykułów pisaliśmy już na benchmarku, że prawdziwym powodem, dla którego Intel i AMD zdecydowały się na tę technikę nie był fakt, że dual-core, a teraż już quad-core, nagle okazał się świetnym pomysłem. Producenci układów byliby bardziej zadowoleni z postępu polegającego na produkcji coraz szybszych, jednordzeniowych procesorów. Jednakże nie było to możliwe, ponieważ w chwili, gdy taktowanie zegarów procesorów przekroczyło barierę 3 GHz, jednordzeniowe procesory zaczęły zużywać zbyt dużo energii.
Wraz ze wzrostem wydajności, super szybkie jednordzeniowe procesory stały się drogie w chłodzeniu, wymagają większych radiatorów i potężniejszych wiatraczków, które są w stanie utrzymać eksploatacyjną temperaturę.
Początkowo wydawało się, że dwa rdzenie posłużą producentom CPU do tworzenia sprytniejszych reklam w stylu: "Dwa za cenę jednego! Zapytaj sprzedawcę", albo "5.6 GHz !" - czyli ordynarne dodanie częstotliwości 2.8GHz dwóch rdzeni. Ale to prawda.
Powiedzmy to sobie szczerze, dla większości domowych użytkowników, graczy, pracowników biurowych itp, dwa rdzenie są po prostu niepotrzebne. Wyobraźcie sobie, że producenci silników do samochodów zachowują się identycznie jak producenci chipów, zwiększając ich moc i osiągi. Mamy silnik o pojemności 1.4 litra i 90 koni mechanicznych, 2.0 litry i 150KM, 3.0 litry i 200 KM... 8.0 litrów itd. W pewnym momencie osiągają pułap fizycznych i technicznych możliwości. Silnik jest za duży, za gorący, zużywa masakryczne ilości paliwa i wydziela masę spalin. A my przecież jeździmy tylko do pracy i na zakupy.
Co mogliby zrobić? Oczywiście zamontować w samochodzie dwa, a potem nawet cztery silniki np: 2.0 litra i pochwalić się, że oto oddają nam auto o łącznej mocy odpowiednio 300 i 600KM. Brzmi nawet nieźle. Rzecz jednak w tym, że nasze autko w drodze na zakupy i do pracy (a nawet weekendowym wypadzie 'z łokciem'), przez 99% czasu eksploatacji i tak będzie jeździć na jednym silniku.
I raczej nie będzie mieć już znaczenia, że taki silnik mógłby na 'zamkniętym liczniku' zużywać 2 litry paliwa, bo nawet nie będzie gdzie rozpędzić tych trzystu koni. A przynajmniej do czasu, gdy pewna firma drogowa "Miękki asfalt" pomiędzy naszym domem, pracą i supermarketem, dla poprawienia i pokolorowania nam naszego 'szarego' życia, położy nową drogę, niczym 'Col de Turini' albo 'Pikes Peak'. Koniec z nudnymi dojazdami do pracy! ...oczywiście przejazd będzie płatny (a po zmianie auta trzeba będzie wykupić nowy karnet na przejazd ;))
Ale pomyślcie też, że poza zwykłymi, przeciętnymi użytkownikami peceta, są jeszcze osoby wykorzystujące komputer do pracy, do zadań specjalnych i profesjonalnych. Oni swoim komputerem nie jeżdżą już tylko po mieście. Codziennie wjeżdżają na 800 kilometrową autostradę, którą chcą pokonać najszybciej jak tylko mogą, albo na totalne bezdroża, gdzie łatwo utknąć w szczerym polu na kilka godzin. Oni z pewnością będą bardzo, bardzo zadowoleni z pojazdu, który na tej trasie pozwoli im wycisnąć maksimum z tych dwóch, albo czterech silników pod maską, a jazda przez 'bezdroża' będzie niczym jazda dobrą terenówką z napędem na cztery koła.
No i tu pojawia się całe sedno sprawy. Owszem, pokonają ten 800km odcinek szybciej cztero-silnikowcem, pod warunkiem, że autostrada, drogi i dróżki przez które będą jechać, pozwolą im na to.
Korzyści z dwu- i cztero-rdzeniowych procesorów są zasadniczo dwie: dużo szybciej wykonana jedna operacja/obliczenia dzięki rozłożeniu jej na dwa lub cztery rdzenie (przykład renderingu w Cinema 4D), oraz płynna praca kilku aplikacji jednocześnie (przykład testu Multithreaded w PCmark05). O ile w tym drugim przypadku możemy zawierzyć jedynie systemowi operacyjnemu na którym pracujemy, to pierwszy jest bardzo łatwy do sprawdzenia - wystarczy dowiedzieć się, czy aplikacja, którą wykorzystujemy w pracy, 'potrafi' działać na platformach wieloprocesorowych.
Nie powinien nam też umknąć inny bardzo ważny fakt - Wirtualizacja. Ktoś, kto zdecyduje się na korzystanie z tego dobrodziejstwa, w przypadku dwu-rdzeniowego procesora realnie będzie mieć po jednym rdzeniu w każdym systemie. Przy czterordzeniowym CPU, każdy z systemów będzie mieć do dyspozycji ponownie 'dwa'. To przynajmniej tyle w teorii, bo jak to działa naprawdę jeszcze nie mieliśmy okazji się przekonać, ale mnie osobiście możliwość uruchomienia dwóch systemów na jednym komputerze niezwykle pociąga.
A przy okazji, na hasło 'Wirtualizacja' do naszych drzwi zapukało natarczywie dociekliwie pytanie: a jak wirtualizacje dwóch OS wytrzyma dwu-rdzeniowy Core2 i jego współdzielony Smart Cache? Czy biedaczysko nie pogubi się już wtedy na amen? Krążą plotki, że już na jednym systemie, w szczególnym przypadku, może dojść do kolizji w takiej wspólnej pamięci podręcznej. Postaramy się zadać to pytanie fachowcom z Intela.
Kolejną nadzieją na wykorzystanie wielordzeniowych procesorów będzie zastosowanie w grach 3D osobnych obliczeń dla fizyki. Jednak w tej materii nie jest jeszcze nic pewnego. Nie wiadomo kto pierwszy zdecyduje się wziąć na swoje barki tę działkę, producenci GPU czy CPU. Dla tych drugich bez wątpienia byłaby to wielka szansa na wciśnięcie wszystkim graczom dwu-, a może nawet cztero- rdzeniowych procesorów.
Intel Core 2 Extreme QX6700 - czyli coś jakby dwa procesory E6700 w jednej obudowie
Podsumowując, nikt nie mówi, że już dziś mamy biec do sklepu po Quad'a, ale wielordzeniowe procesory to wcale nie taki 'głupi' pomysł - z punktu widzenia nowych technologii i wygody pracy. Oczywiście pod warunkiem, że kupujemy je świadomie i wiemy jakie będziemy z nich mieć korzyści. Bo sam fakt posiadania dwu lub cztero-rdzeniowca podczas gry w 'Company of Heroes', powodem do dumy i radości przecież być nie może.
Oficjalna premiera 'Barcelony' AMD - wrzesień 2007 - benchmark.pl
Firma AMD wypuściła wreszcie na rynek nową architekturę Barcelona. Pierwsze produkcyjne egzemplarze procesorów trafiły już do klientów. Barcelona jest pierwszym od dłuższego czasu jądrem, które wprowadza tak poważne zmiany do konstrukcji procesorów AMD. Ostatnia tego rodzaju rewolucja miała miejsce w momencie inauguracji architektury K8 i ukazania się na rynku pierwszych Opteronów i Athlonów 64. Poza usprawnieniami architekturalnymi, K10 - bo tak brzmi oficjalna nazwa kodowa Barcelony - może się również pochwalić obsługą nowych wersji technologii znanych już z K8.
Barcelona jest pierwszym procesorem AMD wyposażonym w cztery rdzenie, przy czym warto zauważyć, iż w odróżenieniu od rozwiązań Intela, na Barcelonę składają się cztery niezależne jednostki. Intelowskie czterordzeniowe jądra Clovertown i Kentsfield oraz nadchodzące dopiero Harpertown i Yorkfield są tworzone z dwóch układów Core połączonych na jednej podkładce. Powstające w ten sposób konstrukcje mogą się również pochwalić czterema jądrami, jednak nie są to rozwiązania zaprojektowane od zera jako czterordzeniowe.
AMD wyposażyło architekturę Barcelona w szereg usprawnień. Składają się na nie, między innymi, ulepszony cache, nowy kontroler pamięci, nowe algorytmy przewidywania rozgałęzień i pre-odczytu pamięci, poprawione zarządzanie energią i pakiet rozszerzeń AMD-V.
Pamieć cache Barcelony jest o tyle interesująca, że zawiera również cache L3, które to rozwiązanie widzieliśmy ostatnio w zapomnianych już praktycznie procesorach K6-III+ i K6-2+. Cache trzeciego poziomu jest w przypadku K10 32-drożną pamięcią asocjacyjną, liczy sobie 2 MB i jest wspólny dla wszystkich rdzeni procesora. Dodatkowo każde z jąder ma do dyspozycji 512 KB 16-drożnego asocjacyjnego cache'u L2 i 128 KB 2-drożnej asocjacyjnej pamięci cache L1, dokładnie tyle samo, co w układach poprzedniej generacji.
Procesory oparte na architekturze K10 będą więc miały łącznie 4,5 MB pamięci podręcznej. Da porównania, Intelowskie czterordzeniowe Clovertown i Kentsfield dysponują 64 KB cache'u L1 na jądro, a każdy zestaw dwóch rdzeni ma też do dyspozycji 4 MB dzielonego cache'u L2. Łącznie daje to 8,25 MB.
AMD poprawiło również wydajność sterownika pamięci, który w przypadku Barcelony skonstruowany jest trochę inaczej niż w dotychczasowych procesorach. Zamiast jednej 128-bitowej szyny pamięci, AMD zastosowało dwa kontrolery 64-bitowe. W założeniu mają one pracować niezależnie od siebie, pozwalając uzyskać lepszą przepustowość.
Nowy kontroler pamięci został zaprojektowany z myślą o przyszłych technologiach. Premierowe egzemplarze Barcelony współpracują z pamięcią DDR2, ale już pierwsza przyszłościowa rewizja architektury, ochrzczona nazwą Shanghai, będzie oferowała wsparcie dla nowych kości DDR3.
Nowością w sterowniku pamięci jest układ pre-odczytu pamięci DRAM, którego zadaniem jest pobieranie potencjalnie użytecznych danych i przetrzymywanie ich do wykorzystania w późniejszych operacjach. Prefetcher ten ma swój osobny bufor i nie zaśmieca żadnego z poziomów cennej pamięci cache.
Barcelona ma też nowy, 512-bitowy moduł przewidywania rozgałęzień podobny do tego, który Intel zastosował w swoich procesorach Pentium M. Zwiększona dzięki niemu wydajność układu przekłada się, między innymi, na mniejsze zużycie energii.
Kolejnym usprawnieniem Barcelony w stosunku do K8 jest poprawiony prefetcher pamięci cache. Choć nadal każdy z rdzeni procesora ma do dyspozycji dwa takie układy, są one wyposażone w poprawiony algorytm logiczny, co w praktyce pozwala osiągnąć lepszą wydajność. Co więcej, dzięki nowemu algorytmowi możliwe jest ładowanie danych przewidzianych jako potrzebne bezpośrednio do cache'u L1, podczas gdy układ pre-odczytu stosowany w architektucze K8 odkładał je w pamięci cache L2.
Również obsługa pełnych 128-bitowych instrukcji SSE jest sporym krokiem naprzód w porównaniu z K8, który mógł co najwyżej pochwalić się zdolnością wykonywania dwóch 64-bitowych instrukcji jednocześnie.
Efektem tego ograniczenia K8 było marnowanie czasu na podział każdej 128-bitowej instrukcji na dwa możliwe do wykonania 64-bitowe elementy. Barcelona nie ma tego problemu, a co za tym idzie, wykonuje instrukcje SSE szybciej od poprzednika.
Również prędkość odczytu instrukcji SSE poszła w górę - z 16 bajtów na cykl procesora w przypadku K8 do 32 bajtów na cykl w Barcelonie. Co więcej, AMD poprawiło także przepustowość wewnętrznego połączenia pomiędzy kontrolerem pamięci, a pamięcią cache L2 z 64 do 128 bitów na cykl procesora.
Kolejną pozycją na tej sprawiającej wrażenie, jakby się miała nigdy nie skończyć liście usprawnień, które AMD wprowadziło w swojej nowej architekturze, jest ważna zmiana w zarządzaniu energią. Otóż w Barcelonie jądro procesora i kontroler pamięci mają osobne zasilanie, dzięki czemu każdy z tych elementów może pracować z inną prędkością i na innym napięciu. Niestety, konfiguracja obecnych płyt głównych uniemożliwia wykorzystanie tej innowacji.
Na oszczędność energii przez Barcelonę ma też wpływ fakt, iż każde z jąder procesora może dostosowywać swoją prędkość taktowania do aktualnego obciążenia. Dzięki takiemu rozwiązaniu nowe układy powinny oddawać podobną ilość ciepła, co obecne dwurdzeniowe Opterony.
Na koniec warto wspomnieć o instrukcjach AMD-V, które oferują sprzętowe wsparcie dla techniki stronicowania znanej jako shadow paging. Umożliwia on systemom operacyjnym zainstalowanym na maszynach wirtualnych bezpośredni dostęp do pamięci. AMD nazywa tę nową funkcjonalność nested paging.
Wszystkie te usprawnienia architektury oraz posiadanie czterech rdzeni powodują, że Barcelona liczy sobie 463 miliony tranzystorów, co nie wypada szczególnie imponująco w porównaniu z procesorami Xeon Kentsfield Intela, które mimo prawie dwukrotnie większej pamięci cache, mają raptem 582 miliony tranzystorów. Jest to o tyle martwiące, że podobnie jak „stare” Xeony, układy z serii Barcelona będą produkowane w technologii 65 nm.
Czterordzeniowe K10 zużywają tyle samo energii, co dostępne obecnie dwurdzeniowce. Identyczna z obecną jest również polityka AMD w kwestii ciepła oddawanego przez nowe procesory, na skutek czego Barcelona pojawi się w trzech wersjach różniących się współczynnikiem TDP. Poza standardowymi układami dostępne będą również chłodne, lecz mniej wydajne HE, oraz bardziej grzejące się, lecz wysokowydajne SE. Modele SE pojawią się jednak dopiero w ostatnim kwartale 2007 roku.
AMD wyznaczyło też dla każdej z wersji Barcelony nowy rodzaj współczynnika - ACP, który wyraża całkowity pobór mocy przez jądro procesora, kontroler pamięci i złącze HyperTransport. Pomiarów dokonano po obciążeniu układów „zadaniami realistycznymi z punktu widzenia użytkownika dostępnych na rynku programów”.
Aplikacje, które wykorzystano do pomiaru ACP, to między innymi TPC-C, SPECcpu2006, SPECjbb2006 oraz STREAM. Współczynnik ACP jest zasadniczo niższy od TDP, lecz zdaniem AMD dużo lepiej odzwierciedla poziom ciepła oddawanego podczas rzeczywistej pracy, podczas gdy TDP jest dla bezpieczeństwa sztucznie zawyżany.
AMD przygotowało na premierę Barcelony dziewięć modeli Opteronów z serii 2300 i 8300. Ich prędkości taktowania oscylują pomiędzy 1,7 a 2,0 GHz, aczkolwiek szybsze wersje zostały już zapowiedziane na ostatni kwartał 2007. AMD ma też nadzieję wypuścić na rynek procesory taktowane od 2,3 GHz wzwyż dzięki modelom SE. Ich współczynnik TDP będzie jednak wynosił 120 W.
Premiera opartych na architekturze Barcelona Opteronów 2300 i 8300 ma się odbyć dzisiaj (10 września). Posiadacze płyt głównych wyposażonych w podstawki Socket AM2, którzy chcieliby zaopatrzyć się w czterordzeniowy procesor, będą musieli jeszcze trochę poczekać na jedno-socketowe Opterony z jądrem Budapest bądź oparte na jądrze Agena Phenomy X4 i FX.
K8 to architektura, która pojawiła się na rynku w 2003 roku wraz z premierą serwerowego Opterona opartego na rdzeniu SledgeHammer. Później była cała seria procesorów - Athlon 64, Sempron i dwurdzeniowy Athlon 64 X2. Było to w czasach, kiedy Intel forsował chipy z technologią NetBurst. W 2004 wprowadził procesory Prescott, które nie grzeszyły wydajnością, za to koszmarnie się grzały, wymagając wydajnych i często głośnych systemów chłodzenia.
Rozwiązania AMD były chłodne, wydajne, wyposażone w obsługę 64-bitowych instrukcji i oferowane w atrakcyjnych cenach. Intel zauważył swój błąd, zrezygnował z NetBurst i wprowadził w 2006 roku nową architekturę Core 2 Duo. Była ona oparta na energooszczędnych rdzeniach, znanych z takich procesorów, jak Pentium M i stanowiła połączenie najlepszych cech procesorów Pentium III i Pentium 4, przy jednoczesnej rezygnacji z architektury NetBurst. Chipy Intela przestały być gorące, a zaczęły być chłodne i wydajne, co w połączeniu z ich dużą podatnością na podkręcanie z dnia na dzień zmniejszyło atrakcyjność oferty konkurencyjnego AMD. Koncern był już w trakcie przygotowywania nowej architektury, która byłaby w stanie nawiązać równorzędną walkę z konkurentem na polu wydajności. Udało się to w drugim kwartale 2007 roku - na rynku pojawił się K10.
K10 zaczyna się od Opterona
K10 to określenie architektury, na której oparte będą nowe procesory AMD, między innymi Phenomy oraz Opterony wykorzystujące rdzeń Barcelona. Przy okazji wokół nazwy kodowej nowych chipów powstało pewne zamieszanie. Na wielu portalach oraz przez wielu użytkowników pojęcia K10 i Barcelona używane są zamiennie. W praktyce nazwa kodowa Barcelona dotyczy zaledwie jednego z wielu planowanych procesorów wykorzystujących nową architekturę AMD. Na początek koncern przygotował procesory czterordzeniowe (po raz pierwszy w swojej historii), planowane są również chipy z mniejszą liczbą rdzeni.
W poniższym artykule zaprezentujemy nowości, którymi dysponuje K10, w tym jego nową architekturę, dodatkową pamięć L3, poprawiony kontroler pamięci i świeżo wprowadzony zestaw instrukcji. Pokażemy też zapowiadane modele procesorów opartych na K10 wraz z odpowiadającymi im nazwami kodowymi.
Nowa architektura
K10 oparty jest na nowej architekturze, która jednak nie jest rewolucyjnym odejściem od dotychczasowych procesorów AMD, a co najwyżej twórczym rozwinięciem wcześniejszej K8. Nie ma więc tutaj mowy o takich zmianach, jak te wprowadzone w Pentium 4, który w stosunku do Pentium III był zaprojektowany niemal zupełnie od nowa. K10 można porównać do Core 2 Duo, który jest ulepszoną i wzbogaconą wersją Pentium M.
Dreźnieński Fab 36 od środka - to tutaj powstają procesory AMD
Jednym z usprawnień występujących w K10 jest ilość danych, które procesor może pobrać w jednym cyklu zegara z przeznaczonej na instrukcje pamięci cache L1. Jest ona dwukrotnie większa niż w K8, co oznacza, że nowe układy AMD są w stanie odczytać 32 bajty na jeden cykl, podobnie jak procesory Intela z serii Core.
Balcerona, czyli cztery rdzenie w jednej obudowie
Kolejne istotne usprawnienie stanowi akcelerator obliczeń zmiennoprzecinkowych, zwany w oryginale AMD Wide Floating Point Accelerator. W układach z serii K8 przekazywanie danych wewnątrz procesora odbywało się po 64-bitowej szynie. Stanowiło to wąskie gardło dla instrukcji SSE. Posiadają one bowiem 128-bitowe rejestry XMM0-XMM7, co sprawiało, że wykonywane na nich operacje musiały być najpierw rozbite na dwa 64-bitowe fragmenty. W K10 zastosowano wewnętrznie 128-bitową szynę danych, co sprawia, że wykonywanie 128-bitowych operacji SSE nie jest już tak czasochłonne. Podobnie zresztą zrobił Intel w swoich procesorach Core.
Ogólna architektura 4 rdzeni AMD na przykładzie nowego Opterona
Usprawniony kontroler pamięci
Wydajność komputera w dużej mierze zależy od tego, jak dużą ilość danych z pamięci RAM uda się pobrać procesorowi podczas jednego cyklu zegara. Ponieważ taktowanie CPU jest znacznie wyższe od taktowania pamięci RAM, wydajność tej ostatniej bezpośrednio przekłada się na prędkość działania procesora. Sposobem na zapewnienie wydajnej pracy CPU jest ładowanie dużych porcji danych podczas każdego odwołania do pamięci operacyjnej.
Moduły pamięci komunikują się za pośrednictwem 64-bitowej szyny danych. Aby zwiększyć ich wydajność, kilka lat temu wymyślono tryb dual-channel, a więc dwukanałowy dostęp do pamięci. Polega on na jednoczesnym dostępie do dwóch 64-bitowych modułów, dzięki czemu w jednym cyklu można odczytać dwa 64-bitowe pakiety danych. W teorii więc takie rozwiązanie podwaja przepustowość pamięci RAM.
Dwukanałowy dostęp do pamięci ma jednak swoje wady. Jedną z nich jest to, że kolejne dwie porcje danych mogą być pobrane wyłącznie z adresów bezpośrednio następujących po sobie. Na przykład, jeśli CPU odczyta informację, znajdującą się pierwszej komórce RAM, kontroler pamięci automatycznie przekaże mu również dane z drugiej, następującej po niej komórki. Ponieważ dane z tej ostatnie w wielu wypadkach okazują się niepotrzebne dla CPU (ponieważ zakończył proces odczytu na jednej komórce lub wymaga danych z zupełnie innego miejsca), dodatkowy odczyt nie przekłada się na przyrost wydajności.
Zawarty w K10 sterownik pamięci wykorzystuje nową technologię AMD Memory Optimizer Technology, która pozwala na ominięcie powyższego problemu. Udoskonalony sterownik jest w stanie w jednym cyklu zegara pobierać dane z dwóch zupełnie różnych komórek pamięci RAM. Takie rozwiązanie pozwala zwiększyć wydajność procesora, ponieważ unika się w ten sposób tracenia cykli na ładowanie niewykorzystanych danych z pamięci. AMD oficjalnie nazywa swoje rozwiązanie AMD Memory Optimizer Technology.
K10 oficjalnie obsługują jedynie pamięci DDR2, wewnętrznie jednak są przygotowane również na nowy, wydajniejszy i bardziej energooszczędny standard DDR3. AMD uaktywni jego obsługę, kiedy uzna to za stosowne, a więc zapewne w połowie przyszłego roku, kiedy ceny tych modułów spadną do akceptowalnych poziomów (obecnie DDR3 potrafią być nawet 10-krotnie droższe od DDR2).
Pamięć cache trzeciego poziomu
Pamięć cache procesora to szybka pamięć Static RAM, znajdująca się bezpośrednio na procesorze. Jej zadaniem, podobnie jak każdej innej pamięci cache, jest przechowywanie często wykorzystywanych danych - w tym przypadku takich, które mogą być przydatne do wykonania instrukcji planowanych na najbliższe cykle zegara. W sytuacji, kiedy procesor nie znajdzie wymaganych danych w pamięci cache, będzie zmuszony do sięgnięcia do wielokrotnie wolniejszej pamięci DRAM, wetkniętej w sloty na płycie głównej. Ponieważ jest ona dynamiczna, wymaga częstego odświeżania, co spowalnia jej działanie, jest też taktowana kilkukrotnie niższym zegarem, niż pamięć cache na procesorze.
W dwurdzeniowych procesorach K8 (na przykład w Athlonie 64 X2), a także w Pentium D, każdy ze rdzeni posiada własną, odrębną pamięć L2. Natomiast w przypadku nowocześniejszej architektury Core zastosowano inne rozwiązanie, w którym w procesorze znajduje się jeden cache L2, wykorzystywany wspólnie przez oba rdzenie.
Przepływ danych pomiędzy rdzeniami procesorów K10
Oba rozwiązania mają swoje wady i zalety. W przypadku odrębnej pamięci L2 dla każdego z rdzeni, mogą zdarzyć się sytuacje, w której jeden ze rdzeni wykorzystał już całą dostępną dla siebie pamięć i musi odwoływać się do wolniejszej zewnętrznej pamięci DRAM, podczas gdy drugi rdzeń dysponuje jeszcze wolną pamięcią drugiego poziomu. Z drugiej strony, takie rozwiązanie jest prostsze i tańsze w implementacji. Wspólna pamięć L2 teoretycznie pozwala z kolei na bardziej elastyczny przydział pamięci do tego rdzenia, który aktualnie bardziej jej potrzebuje.
A jak to wygląda w układach czterordzeniowych Intela, takich jak procesory Core 2 Quad? Jako, że składają się one z dwóch połączonych chipów dwurdzeniowych, każda para rdzeni ma do podziału swój własny moduł cache. W przyszłości Intel planuje stworzenie procesorów z czterema oddzielnymi rdzeniami, które będą miał do swojej dyspozycji jedną, wspólną pamięć L2.
Bohaterowie niniejszego artykułu, a więc procesory oparte na architekturze K10 będą wykorzystywały jeszcze inny pomysł, zbliżony do rozwiązań stosowanych w serwerach. Będzie to współdzielony cache trzeciego poziomu (L3). AMD nazywa swoje podejście mianem Balanced Smart Cache. Jego rozmiar będzie zależał od modelu układu, podobnie jak objętość cache L2. A co z pamięcią L1? Ta pozostanie natomiast identyczny, co dotychczas w K8 - po 64 KB na instrukcje i dane.
Energooszczędność
Mimo że już procesory z serii K8 były całkiem chłodne, w K10 wprowadzono dodatkowe usprawnienia, mające na celu ograniczenie poboru energii, a co za tym idzie redukcję ilości oddawanego ciepła.
Independent Dynamic Core Technology pozwala na niezależne zarządzanie taktowaniem poszczególnych rdzeni
Najważniejszą technologią, wpływającą na większą energooszczędność nowych CPU jest Independent Dynamic Core Technology. Pozwala ona każdemu z rdzeni pracować z inną częstotliwością. Nie ma jednak róży bez kolców - wszystkie rdzenie będą musiały korzystać z takiego samego napięcia, co ten najbardziej obciążony w danym momencie.
Kolejnym krokiem w zakresie walki z wysoką temperaturą jest CoolCore Technology. Dzięki niej niewykorzystywane w danym momencie elementy procesora będą mogły być wyłączane (odłączane od zasilania). Taka funkcjonalność jest już wykorzystywana przez Intela w procesorach z serii Core.
Jeszcze jedną nowością jest Dual Dynamic Power Managment (DDPM), funkcjonująca również pod nazwą split-plane. DDPM umożliwia procesorowi i zintegrowanemu z CPU kontrolerowi pamięci na korzystanie z oddzielnych źródeł zasilania. Dzięki temu nie muszą one pracować pod tym samym napięciem, a kontroler pamięci może być wyżej taktowany, zazwyczaj o około 200 MHz więcej niż główny zegar procesora. Technologia ta pozwala procesorowi na pracę przy niższym napięciu przy zachowaniu takiej samej wydajności, ułatwia również systemowi powrót z trybu uśpienia. DDPM wymaga nowej płyty głównej z gniazdem AM2+, w starszych płytach nie będzie wykorzystywana, a obie części procesora będą zasilane tym samym napięciem.
HyperTransport 3.0
Procesory z serii K10 w wersji desktopowej będą też korzystały z nowej technologii HyperTransport 3.0. Dzięki temu transfer danych pomiędzy procesorem, a pozostałymi podzespołami komputera będzie szybszy niż w dotychczasowych wersjach tej magistrali i wyniesie maksymalnie 10,4 GB / sekundę. Jest to wydajność ponad 2.5-krotnie wyższa od dotychczasowej wersji HT, z której można było wycisnąć co najwyżej 4 GB / sekundę przy taktowaniu jej zegarem 1 GHz. Dzięki szybszej magistrali zwiększy się skalowalność całego systemu. W rozwiązaniach serwerowych szybsze HT pojawi się w późniejszym terminie.
HyperTransport 3.0 to jednak nie tylko wyższa wydajność, a również oszczędność energii. Dzięki temu, że HT 3.0 pozwala procesorowi na bieżąco zmieniać taktowanie oraz liczbę bitów przesyłanych w jednym cyklu zegara po tej magistrali, w momencie gdy procesor nie jest obciążony, będzie redukował swój zegar, a przy okazji pobierał mniej energii.
Nowy HyperTransport jest zgodny wstecz. Dzięki temu procesory K10 będzie więc można instalować w płytach głównych z gniazdem AM2. Będą jednak działały z wolniejszym taktowaniem magistrali HT i obniżoną prędkością transferu.
Nowe instrukcje
Lista rozkazów w procesorach K10 została rozszerzona o kilka nowych instrukcji:
1. Rozszerzone operacje bitowe na rejestrach ogólnego przeznaczenia: LZCNT i POPCNT
2. Instrukcje przetwarzania rejestrów SSE, czyli zestaw SSE4a: EXTRQ, INSERTQ, MOVNTSS i MOVNTSD
Warto zauważyć, że rozszerzenie SSE4a to coś zupełnie innego niż wprowadzane przez Intela dodatki w postaci SSE4.1 i SSE 4.2. Na początku z pewnością spowoduje to mały zamęt i konieczność dostosowywania kompilatorów i oprogramowania do obsługi kolejnych rozszerzeń.
Warstwy wirtualizacji w architekturze x86
AMD rozwija też swoje technologie wirtualizacyjne. Wirtualizacja jest technologią umożliwiającą jednoczesne uruchamianie kilku systemów operacyjnych w tym samym czasie bez znaczącego spadku wydajności. Jednym z usprawnień K10 w sferze wirtualizacji jest implementacja technologii nested paging. Strony pamięci maszyn wirtualnych są w przypadku tej technologii zagnieżdżone w nadrzędnej tablicy stron. W sytuacji, gdy w buforze TLB nie znajdują się odniesienia do żądanej strony pamięci, procesor automatycznie wykonuje wszystkie wymagane przekształcenia tablic. Nested paging stanowi spory krok naprzód w stosunku do starszej technologii shadow paging, przy zastosowaniu której, operacje na tablicach stron pamięci maszyn wirtualnych pożerały sporą część zasobów procesora.
Przewidywanie rozgałęzień
Procesor, który wykonuje serię rozgałęziających się instrukcji powinien umieć przewidzieć najbardziej prawdopodobny przebieg operacji. Dzięki temu będzie w stanie uniknąć przerw w przetwarzaniu kodu. Jedną z większych bolączek architektury K8 była niezdolność przewidywania rozgałęzień pośrednich, które nie mają ustalonego adresu skoku.
W rozgałęzieniach tego rodzaju adres skoku obliczany jest na bieżąco podczas wykonywania programu. Zwykle pojawiają się one podczas interpretacji instrukcji warunkowych, bądź przy wywołaniach funkcji adresowanych i wirtualnych stosowanych w programowaniu obiektowym. K8 zawsze pobierał blok kodu, kierując się adresem ostatniego rozgałęzienia, a w przypadku jego zmiany opróżniał potok. Jeśli adres zmieniał się często, pomyłki przy zgadywaniu procesor wykonywał praktycznie bez przerwy. Pierwszym układem, w którym zastosowano moduł przewidywania dynamicznie zmieniających się adresów rozgałęzień pośrednich, był Pentium M. Brak podobnego algorytmu w K8 powodował, że procesor nie miał rewelacyjnej wydajności podczas wykonywania kodu obiektowego.
Na szczęście K10 może się pochwalić sporymi poprawkami na tym polu. W nowej architekturze zaimplementowano algorytm przewidywania adresów rozgałęzień warunkowych, który korzysta z 512-elementowej tablicy. Wzrosła też objętość rejestru pozwalającego określić typowy przebieg rozgałęzień na podstawie wyników uprzednio wykonanych instrukcji - z 8 do 12 bitów. Inżynierowie AMD zdecydowali się również na zwiększenie do 24 pozycji wielkości stosu adresów zwrotnych. Stos ten umożliwia szybkie pobranie adresu zwrotnego i kontynuowanie wykonywania kodu bez zwyczajowego oczekiwania na wynik funkcji RET.
Dzięki wprowadzonym ulepszeniom, K10 powinien radzić sobie ze złożonym kodem obiektowym dużo lepiej od poprzednika. Jak wypadnie w praktyce, okaże się po wykonaniu odpowiednich benchmarków.
Procesory oparte na K10
Pierwszymi procesorami z serii K10, które pojawiły się już na rynku są czterordzeniowe Opterony oparte na rdzeniu Balcerona. My jednak skupmy się na tych najbardziej interesujących, przeznaczonych dla komputerów biurkowych.
Planowane przez AMD desktopowe procesory K10 to:
Spica: jednordzeniowy Sempron z 512 KB L2 pamięci cache, obsługą DDR2 i szyną HyperTransport 3.0, przeznaczony dla gniazda AM2+
Rana: dwurdzeniowy Athlon X2 z 512 KB L2 cache na rdzeń, pamięcią L3 o nieznanej dotąd wielkości, obsługą DDR2 i szyną HyperTransport 3.0, przeznaczony dla gniazda AM2+
Kuma: dwurdzeniowy Phenom X2 z 512 KB L2 cache na rdzeń, 2 MB pamięci L3, obsługą DDR2 i szyną HyperTransport 3.0, przeznaczony dla gniazda AM2+
Agena: czterordzeniowy Phenom X4 z 512 KB L2 cache na rdzeń, 2 MB pamięci L3, obsługą DDR2 i szyną HyperTransport 3.0, przeznaczony dla gniazda AM2+
Agena FX: czterordzeniowy Phenom FX z 512 KB L2 na rdzeń, 2 MB pamięci L3, obsługą DDR2 i szyną HyperTransport 3.0, przeznaczony dla gniazd AM2+ oraz Socket 1207+
Przedstawione powyżej gniazda AM2+ oraz Socket 1207+ są po prostu unowocześnionymi odpowiednikami dotychczasowych AM2 i Socket 1207. Różnią się obsługą szyny HyperTransport 3.0 oraz technologią dynamicznego zarządzania energią (DDPM). Jak już wspomnieliśmy, można zainstalować procesory K10 w starym gnieździe AM2 lub Socket 1207, jednak kosztem nieco niższej wydajności i wyłączenia niektórych funkcji oszczędzania energii.
Trzy rdzenie
Przy okazji wprowadzenia nowej architektury, AMD zdecydowało się na stworzenie swoistego kompromisu między niską ceną procesorów dwurdzeniowych, a droższych rozwiązań quad-core. Będą to procesory Phenom X3, a więc trzy rdzenie na jednym chipie.
Ogólna architektura trzyrdzeniowych procesorów AMD Phenom X3
Trzyrdzeniowe rozwiązania od AMD planowane są na pierwszy kwartał 2008 roku. Pierwszy tego typu procesor, który ujrzy światło dziennie nie został jeszcze zapowiedziany, ale wiadomo, że będzie oferował obsługę pamięci DDR2, dysponował 512 KB cache L2 na rdzeń, 2 MB pamięci L3, będzie też oczywiście zgodny z nową szyną HyperTransport 3.0 i gniazdkami AM2+.
Podsumowanie
K10 to dla AMD możliwość odebrania palmy pierwszeństwa albo przynajmniej dorównania konkurencyjnym procesorom Intel Core 2 Duo, które są szybkie, chłodne i oferowane w atrakcyjnych cenach - choć nie tak atrakcyjnych, jak AMD. Chyba, że wziąć pod uwagę możliwości podkręcania procesorów Intela - wówczas wygrywa on znacząco, gdyż taktowane 1.8 GHz egzemplarze E4300 za 400 złotych spokojnie można podciągnąć do 2.7 GHz, a w wielu przypadkach nawet i więcej, do ponad 3 GHz. Intel oferuje również procesory E6850, firmowo taktowane takim zegarem. AMD póki co nie ma w swojej ofercie właściwie niczego, co odpowiadałoby wydajności 3 GHz Core 2 Duo.
Serwerowa Balcerona, choć spóźniona, jest już na rynku. Biurkowych K10 można spodziewać się na przełomie listopada i grudnia. Dlaczego ich premiery są ciągle przekładane? AMD najprawdopodobniej zmaga się z kolejnymi problemami technologicznymi, które nie pozwalają na taktowanie nowych chipów na tyle wysokimi zegarami, aby mogły być konkurencyjne. Występują również problemy z osiągnięciem odpowiednio dużej liczby sprawnych procesorów z jednego wafla, co jest koniecznie, aby cały proces produkcyjny był opłacalny.
Czy przyszłość AMD jest świetlana? Naszym zdaniem K10 pozwoli temu koncernowi iść z Intelem łeb w łeb w dziedzinie wydajności przez kolejne kilka(naście) miesięcy. Jeśli bowiem nie brać pod uwagę wydajności, lecz stosunek możliwości do ceny, czy też wydzielanie ciepła, to już od jakiegoś czasu w tych aspektach AMD może się pochwalić lepszymi wynikami od swojego flagowego konkurenta. Trzyrdzeniowe procesory X3 również są w stanie nieźle zamieszać na rynku i jeśli "zieloni" dobrze to rozegrają, ich triple-core może zostać niezłym hitem - przynajmniej do czasu radykalnych spadków cen czterordzeniowców.
Opisz krótko (500-1000 znaków) to, co według Ciebie jest ważne lub ciekawe z punktu widzenia najnowszej technologii produkcji procesów. Porusz co najmniej dwa odrębne tematy, najlepiej NIE opisane powyżej.
Wymienione znaki towarowe i marki należą do ich prawnych właścicieli
Zawsze zwróć uwagę na daty utworzenia fragmentów tekstu. Niektóre informacje mogą być lub na pewno są nieaktualne!!!
1
14
procesory 2003/2004 (i wcześniej) Arkadiusz Gawełek, Cosinus, Łódź 2002-2007
35
procesory 2005/2006 Arkadiusz Gawełek, Cosinus, Łódź 2002-2007
60
procesory 2006/2007 Arkadiusz Gawełek, Cosinus, Łódź 2002-2007
Zadanie do samodzielnego wykonania
63
zadanie do wykonania Arkadiusz Gawełek, Cosinus, Łódź 2002-2007