Temat:
„Najnowsze trendy w budowie procesorów do komputerów PC. Analiza porównawcza rozwiązań i producentów.”
Spis treści
Wstęp
1. Wstęp
1. 1. Informacje ogólne
W owej pracy spróbuje przedstawić najnowsze trendy w budowie procesorów. Zarówno ich szybką ewolucję w przeciągu ostatnich lat oraz nieustanny „wyścig” producentów w osiąganiu coraz wyższych szybkości. Chciałbym wspomnieć, że słowo procesor można również wieloznacznie interpretować. Gdyż możemy wyróżnić:
Procesor CPU
Uklad scalony, którego dzialanie polega na wykonywaniu instrukcji programów - jego role mozna porównac do mózgu czlowieka. Procesor nadzoruje i synchronizuje prace wszystkich urzedzen w komputerze. Jest kilka charakterystycznych cech, które odrózniaja procesory od siebie: architektura (CISC lub RISC), liczba bitów przetwarzanych w jednym cyklu (mówimy np. procesor 16-bitowy), czestotliwosc taktowania podawana w MHz. Por. AMD, Cyrix, Intel, Motorola.
Procesor dźwięku
Cyfrowe urzadzenie obrabiajace dzwiek. Do typowych zadan realizowanych przez procesor dzwieku nalezy zarzadzanie przestrzenia dzwieku (np. w systemie Dolby Pro Logic), czyli tlumaczenie danych dzwiekowych ze zródla na sygnaly elektryczne przesylane do wszystkich glosników, oraz korekcja dzwieku (korekcja niskich i wysokich tonów, echo, poglos itp.). Por. DSP.
Procesor graficzny
Uklad scalony umieszczony na karcie graficznej lub na karcie akceleratora 3D odpowiedzialny za wiekszosc obliczen zwiazanych z prezentowaniem skomplikowanej grafiki na ekranie. Procesory graficzne znajduja najczesciej zastosowanie w grach komputerowych
W mojej pracy skupie się jedynie nad procesorami CPU.
1. 2. Ogólna zasada działania procesora
Procesor (ang. processor) nazywamy urządzenie przeznaczone do przetwarzania informacji w sposób określony przez użytkownika. Jest najważniejsza część składowa komputera, serce każdego komputera; dlatego jest on nazywany centralną jednostką obliczeniową (w skrócie CPU).
Procesor przetwarza informacje wykonując na niej operacje nazywane instrukcjami lub rozkazami. Ciąg instrukcji realizujący konkretne zadanie nazywany jest programem. Procesor może wykonywać kilkaset dosyć prostych czynności - tzn. rozkazów maszynowych. Każdy rozkaz ma własny kod, liczbę zapisaną w jednym lub kilku bajtach. Procesor pobiera z pamięci kolejne bajty traktując je jako rozkazy lub dane i wykonuje zaprogramowane operacje. Procesor dzieli się na dwie podstawowe jednostki : wykonawczą i sterującą.
Zadaniem jednostki wykonawczej jest przetwarzanie informacji czyli wykonywanie operacji artmetycznych i logicznych. Rodzaj wykonywanych operacji zależy od sygnałów sterujących przesyłanych przez jednostkę sterującą. W skład jednostki wykonawczej wchodzi : jednostka artmetyczno-logiczna, oraz zestaw rejestrów, które z nią współpracują. Informacją wejściową do jednostki wykonawczej są dane a informacją wyjściową wyniki w postaci liczb tekstu sygnałów sterujących pracą innych urządzeń.
W skład jednostki sterującej wchodzi : rejestr rozkazów, dekoder rozkazów oraz układ sterowania. W rejestrze rozkazów przechowywany jest kod aktualnie wykonywanego rozkazu (instrukcji). W czasie wykonywania programu procesor odczytuje kolejne rozkazy, które następnie musi rozpoznać (dekodować).
Istnieje wiele rodzajów mikroprocesorów. Większość z nich różni się częstotliwością zegara, wyrażaną w magahercach. Im wyższa częstotliwość zegara tym szybszy procesor. Wszystkie mikroprocesory więc zawierają podobne elementy:
1. układ sterowania i synchronizacji, który kontroluje pracę procesora i wytwarza sygnały potrzebne do sterowania niektórymi elementami komputera.
2. arytmometr, czyli układ, który wykonuje operacje arytmetyczne i logiczne (niektóre procesory mają kilka arytmometrów).
3. rejestry, tj. układy pamięci.
4. wbudowana pamięć podręczna cache, która działa podobnie do zewnętrznej pamięci RAM. Zapewnia ona, że procesor nie jest zmuszony czekać na dane potrzebne mu do pracy.
5. koprocesor matematyczny, który jest zestawem instrukcji przeznaczonych do obsługi skomplikowanych operacji matematycznych.
6. wewnętrzne szyny łączące elementy procesora
Podstawowymi rejestrami, które znajdują się w każdym mikroprocesorze, są:
1. licznik rozkazów - zawiera on adres następnego rozkazu do wykonania.
2. rejestr rozkazów - zawiera kod aktualnie wykonywanego rozkazu.
3.akumulator, jest używany w czasie wykonywania rozkazów arytmetycznych, logicznych, I/O i in. niektóre procesory mają kilka takich rejestrów.
4.rejestr znaczników - zawiera dodatkowe informacje o wyniku operacji arytmetyczno-logicznych, np. "wynik równy zeru".
1.3. Schemat blokowy procesora
OZNACZENIA:
RAM (Random Acces Memory) - pamięć operacyjna
BU (Bus Unit) - układ zarządzający magistralami
AU (Addresing Unit) - układ obliczania adresu połączony z
MMU (Memory Management Unit) - układem zarządzania pamięcią
IU (Instruction Unit) - dekoder instrukcji
EU (Execution Unit) - moduł wykonawczy zawiera
ALU (Aritmetic-Logic Unit) - jednostkę arytmetyczno-logiczną
FPU (Floating Point Unit) - jednostkę zmiennoprzecinkową
1.4. Rejestry
Zarówno jednostka artmetyczno-logiczna jak i układ sterowania musi współpracować z określonym zestawem rejestru. Zawartość pewnej części rejestru może być zmieniona w wyniku wykonania przez procesor określonej instrukcji. Rejestry takie nazywamy rejestrami dostępnymi programowo. W grupie tych rejestrów występują takie typy rejestrów, których odpowiedniki znajdują się praktycznie w każdym mikroprocesorze. Ich pojemność lub ilość może się zmieniać jednak zastosowanie i wykonywane zadania pozostają takie same.
A - akumulatory
B,C,D,E,H,L - rejestry robocze
SP - wskaźnik stosu
F - rejestr flagowy
PC - licznik rozkazów
Akumulator - jest to rejestr, który zawiera jeden z argumentów wykonywanej operacji i do którego ładowany jest wynik wykonywanej operacji.
Rejestr flagowy - zawiera dodatkowe cechy wyniku wykonywanej operacji, które potrzebne są do podjęcia decyzji o dalszym sposobie przetwarzania informacji. Cechami tymi mogą być: znak wyniku, przekroczenie zakresu, parzysta lub nieparzysta liczba jedynek. Wystąpienie określonej cechy sygnalizowane jest ustawieniem lub wyzerowaniem określonego bitu w rejestrze flagowym. Ustawione bity nazywane są znacznikami lub flagami.
Licznik rozkazów - jest jednym z istotniejszych rozkazów dzięki któremu procesor potrafi pobierać kolejne rozkazy do wykonania. Licznik rozkazów zawiera adresy komórki pamięci w której przechowywany jest kod rozkazu przeznaczony do wykonania jako następny.
Oprócz tego procesor ma kilka (kilkanaście) rejestrów używanych w czasie wykonywania niektórych rozkazów np. wskaźnik stosu służący do adresowania pamięci. Stosem nazywamy wyróżniony obszar pamięci, używany według następujących reguł:
Informacje zapisywane są na stos do kolejnych komórek przy czym żadnego adresu nie wolno pominąć
Informacje odczytuje się w kolejności odwrotnej do zapisu
Informacje odczytujemy z ostatnio uzupełnianej komórki natomiast zapisujemy do pierwszej wolnej
Stos jest wydzielonym miejscem w pamięci w którym obowiązuje zasada: ostatni wchodzi pierwszy wychodzi
1.5.Dodatki multimedialne
Producenci nowoczesnych procesorów za podstawowy kierunek rozwoju technologicznego obrali rozszerzenie multimedialnych mozliwosci ukladu. Poszerzone listy rozkazów operujace na stalo i zmiennoprzecinkowych macierzach znaczaco przyspieszaja obróbke grafiki, dzwieku czy generowanie obrazów 3D.
MMX - Pierwszym wprowadzonym rozszerzeniem multimedialnym, wbudowanym we wszystkie obecnie produkowane modele procesorów, jest zestaw 57 instrukcji arytmetyki stałoprzecinkowej typu SIMD, znany pod nazwa MMX.
3DNow - Firma AMD wprowadziła 21 nowych instrukcji zmiennoprzecinkowych typu SIMD-FP zorientowanych na wspomaganie grafiki trójwymiarowej. Był to pierwszy przypadek wprowadzenia tak istotnych zmian do architektury procesora przez firmę inna niż Intel. SIMD-FP procesorów AMD wykorzystuje do działania połączone w pary 64-bitowe rejestry MMX - co niestety, utrudnia automatyczna optymalizacje kodu programu, gdyż wymagany jest podział danych na dwa segmenty.
SSE - Również Intel wprowadził w swoich procesorach Pentium III, instrukcje zmiennoprzecinkowe SIMD-FP. Instrukcje te są wykonywane przez wyspecjalizowana jednostkę operującą na ośmiu 128-bitowych dedykowanych rejestrach - co sprzyja optymalizacji kodu programu.
2. Historia
2.1. Rewolucja procesorów
Początki rozwoju procesora sięgają roku 1971, wtedy to powstał pierwszy procesor 4004 wykorzystany do budowy kalkulatora. Ten, jak na tamtejsze czasy "cud techniki", pracował z częstotliwością blisko 110 KHz. Następnym tworem inżynierów i projektantów firmy Intel był 8-bitowy procesor 8080. Częstotliwość zegara wynosiła od 0,5 do 2 MHz. Procesor Intela został użyty do budowy komputera osobistego Altair, w którym ponadto znalazły miejsce: 256 bajtów pamięci, stacja dysków i wyświetlacz ciekłokrystaliczny. W roku 1975 na komputerze Altair można było uruchomić BASIC, pierwszy produkt stworzony przez Billa Gatesa i Paula Allena z Microsoft. Komputer kosztował kilkaset dolarów.
W 1978 powstał pierwszy procesor z rodziny x86 8086, jeszcze nie w pełni 16-bitowy. Pierwsze wersje pracowały z częstotliwością 4,77 MHz, a po dołożeniu koprocesora osiągały 10 MHz. W rok później firma IBM wypuszcza na rynek procesor 8088, ta 8-bitowa konstrukcja była jedynie uproszczoną wersją swojego poprzednika. Nowy procesor zostaje użyty w komputerze o nazwie Acorn. W komputerze tym tylko klawiatura, obudowa i BIOS pochodziły z IBM. Cała architektura zostaje nazwana IBM PC. Procesor został stworzony przez firmę Intel, a system operacyjny i język programowania BASIC - przez firmę Microsoft. Sprzedawana razem z nim drukarka została stworzona przez firmę Epson. Architektura była znana i można było ją kopiować; pierwsza uczyniła to mało znana firma Columbia Data Products, jednak większy sukces odniosła rok później firma Compaq.
W sierpniu 1985 roku IBM tworzy nowy model swojego komputera osobistego - IBM AT. Posiada on procesor 286 z zegarem 6 MHz i 16-bitową architekturę znacznie przyśpieszające pracę komputera. Na komputerze pracował system operacyjny PC DOS 3.0. Komputer AT z 512 kB RAM i dyskiem 20 MB kosztował około 5000 dolarów. Gdy Intel pracuje nad wersją 32-bitowego procesora, wspomniana już firma Compaq wprowadza na rynek pierwszy komputer z procesorem 386. Nowa konstrukcja nosiła nazwę Deskpro 386 i pojawiła się we wrześniu 1986. 386 to pierwszy w pełni 32-bitowy procesor posiadający mnóstwo nowych instrukcji, dostęp do pamięci powyżej 1MB oraz pracujący w trybie chronionym. Płyty główne pod niego wyposażone były po raz pierwszy w cache L2 - najczęściej 128 kB. Procesor był produkowany przez firmy Intel, AMD, Compaq w wersjach 16, 20, 25, 33 i 40 MHz.
W roku 1987, Intel tworzy procesor 486. Nowy produkt pracuje z częstotliwościami 20, 25, 33 ,40 i 50 MHz, zwiera koprocesor i pamięć cache L2. Działają na nim pierwsze wersje systemu Windows i aplikacje CAD. Kolejne prace producentów doprowadzają jedynie do przyśpieszenia procesora 486 do wartości nawet 100MHz.
Rok 1993 przynosi nowy procesor o nazwie Pentium. Produkt Intela zasilany napięciem 5V odznacza się wydajnością na poziomie najszybszych 486 i pracuje z częstotliwościami 60 i 66 MHz. Dalsze prace doprowadzają do obniżenia napięcia do 3,3V, co pozwoliło zminimalizować układ, zwiększyć upakowanie tranzystorów, a co za tym idzie zwiększyć taktowanie. Dużą zmianą w stosunku do 486 była zastosowana 64-bitowa szyna danych, dwukrotnie szybsza wymiana danych z pamięci oraz możliwość pracy w duecie. Kresem możliwości okazało się 200 MHz. Wersje procesora z zegarem 60 i 66 przystosowane były do gniazda Socket 4. Dla następnych procesorów aż do Pentium z zegarem 120 MHz przeznaczone było złącze Socket 5. Dopiero od Pentium 133 stosowano gniazdo Socket 7. Procesor był produkowany w wersjach 60, 66, 75, 90, 100, 120, 133, 150, 166, 180 i 200 MHz.
W tym samym czasie AMD wprowadza na rynek procesor o nazwie K5, jednakże ze względu na słabą jednostkę zmiennoprzecinkową, produkt jest mniej popularny. Wersje procesora to 75, 90, 100, 120, 133, 150 i 166 MHz.
Jeszcze innym produktem który trafia na rynek jest procesor firmy Cyrix 5x86. Technologia produkcji 0,9 mikrometra oraz wykorzystanie 2 milionów tranzystorów powoduje, że produkt jest mało wydajny . Procesory z częstotliwością pracy zegara 100, 120 i 133 MHz cechują się wydajnością na poziomie rodziny 486.
Wkrótce później Cyrix opracowuje procesor serii 6x86 M1. Cache L1 wynosząca 16 kB, super skalarna architektura i zastosowana magistrala 75 MHz powodują, że procesory wymagają specjalnej płyty głównej, a producenci nie akceptują takiego rozwiązania. Cyrix-y 6x86 choć zgodne zewnętrznie z Pentium, wewnętrznie działają jak znane ze stacji roboczych układy RISC. Zalety takiej architektury są wyraźnie widoczne w przypadku 6x86, który przy niższych częstotliwościach taktowania osiągał średnią wydajność procesorów Pentium, pracujących z szybszym zegarem wewnętrznym. Stąd też wziął się pomysł wskaźnika PR (Performance Rating). Np: procesor 6x86 P166+, taktowany wewnętrznym zegarem 133 MHz, odpowiadał Pentium 166 MHz. Wyprodukowane wersje procesora: 120, 150, 166 i 200 MHz. Następnym procesorem jest 6x86 MX, który od swoich poprzedników różni się od swoich poprzedników szybszymi zegarami : 233, 266 i 300 MHz oraz technologią produkcji. Nowy procesor wykonany w technologii 0,35 mikrona wyposażono w 64 kB, co zaowocowało znacznym wzrostem wydajności. Procesom mógł pracować z częstotliwościami szyny FSB w przedziale od 50 do 83 MHz.
W roku 1995 Intel ulepsza swój dotychczasowy produkt, czego owocem jest Pentium MMX. Nowy procesor od zwykłego Pentium, różni się przede wyspecjalizowaną jednostkę do współpracy z aplikacjami multimedialnymi i komunikacyjnymi. Zastosowanie jednostki MMX przyspiesza o ok. 60 procent działanie gier, programów edukacyjnych, programów do współpracy z Internetem, do obróbki audio i wideo. Na chipie wykonanym w technologii 0,35 mikrometra umieszczono 4,5 miliona tranzystorów. Pentium MMX to dodatkowe instrukcje typu SIMD, czyli instrukcje działające na wielu danych np. obliczenia macierzowe, cache L1 zwiększona do poziomu 32 kB. MMX był dostępny w wersjach dla komputerów stacjonarnych (166,180, 200 i 233 MHz) i przenośnych (150 i 166 MHz).
Później na rynek trafia Pentium Pro czyli P6. Przeznaczony był głównie do dużych serwerów i maszyn klasy workstation, pracujących pod kontrolą w pełni 32-bitowych systemów operacyjnych. W przypadku oprogramowania 16-bitowego lub "mieszanki" 32-bitowego systemu operacyjnego i 16-bitowej aplikacji działał wolniej od Pentium z tym samym zegarem! W procesorze zastosowano architekturę DIB (Dual Independent Bus), czyli oddzielenia magistrali cache drugiego poziomu od magistrali głównej. Pentium Pro pojawił się w następujących wersjach: 150, 166, 180, 200 MHz.
W 1997 AMD produkuje procesor K6 wyposażony w instrukcje MMX. Sporą przewagę nad Pentium dała układowi AMD olbrzymia pamięć podręczna pierwszego poziomu o pojemności po 32 kB dla danych i programu, oprócz tego ze względu na tanią produkcję i zgodność z Pentium procesor tan był bardzo konkurencyjną konstrukcją. Pierwsze wersje zawierały błędy, później dzięki obniżeniu napięcia układ pracował z coraz większą częstotliwością. Wprowadzone wersje to 166, 200, 233, 266 i 300 MHz.
Intel w końcu pokazuje nowy produkt o nazwie Pentium II. Architektura DIB, podstawka Slot 1, 512 kB cache L2 we wspólnej obudowie spowodowało że konkurencja została w tyle. Pierwsze Pentium II o nazwie kodowej Klamath, produkowany był w przestarzałej technologii 0,35 mikrometra. Owa technologia decydowała o tym że procesory te spisywały się gorzej od Celeronów.
Następcą Klamatha był Pentium II Deschutes, produkowany już w technologii 0,25 mikrona, z nowym jądrem, magistralą FSB 100 MHz i cachem o szybkości dostępu 4,4, był już szybszy od poprzednika. Pentium II Xeon taką oficjalną nazwę przyjął Deschutes. Ulepszona jednostka i poprawione błędy z poprzednika dały nowym procesorom wzrost wydajności o około 10 %. Procesory produkowano już w technologii 0,25 mikrona. Zastosowano nowe złącze Slot 2. Xeony wyposażone były w 32 kB pamięci L1 oraz od 512 do 2 MB cache L2. Ze względu na jego cenę i mały nakład produkcji trafił do wydajnych serwerów i stacji roboczych. Wersje Pentium II 233, 266, 300, 333, 350, 400, 450 MHz, Xeon 400 i 450 MHz.
Drugim nowym produktem Intela jest Celeron. To tania wersja Pentium II z 66 MHz magistralą. Początkowo produkowany bez cache L2 i niewiele szybszy od Pentium MMX, przeznaczony jest głównie dla dolnego segmentu rynku. Celerony nie spotkały z entuzjastycznym przyjęciem - pozbawiony pamięci cache L2 procesor nieszczególnie spisywał się w typowych testach wydajności. Okazało się , że zgodność z rodziną Pentium II i relatywnie niska cena to argumenty wystarczające dla mniej zamożnych użytkowników. Co prawda "overclocking" nie jest rozwiązaniem, które należałoby polecać, ale wielu użytkowników domowych lubi takie eksperymenty, a uzyskiwana w ten sposób wydajność pozwala Celeronowi skutecznie walczyć z konkurencyjnymi w tym segmencie rynku procesorami Socket 7, łącznie z AMD "3DNow!". Nieco później pojawia się Celeron z literką "A". Celeron A o nazwie kodowej Mendocino, jest wyposażony w pamięć cache L2, umieszczoną w tej samej strukturze krzemowej. Pamięć ta jest niewielka - 128 kB, tym niemniej dostatecznie duża, by nowy procesor swoją wydajnością dorównywał Pentium II, a nawet w niektórych zastosowaniach przewyższał. Dzięki temu, że komunikacja z pamięcią cache odbywa się z pełną prędkością zegara procesora, podczas gdy PII komunikuje się z cache L2 z połową tej prędkości. Celeron A był oferowany zarówno w wersji Slot 1, jak i w "oszczędnej" wersji Socket 370. Wyprodukowane wersje to 266, 300, 300A, 366A, 400A.
Kilka miesięcy później Intel wypuścił nowego Celerona z zegarem 500 MHz, wciąż niestety z szyną FSB taktowaną częstotliwością 66 MHz. Także i firma Cyrix nie pozostawała w tyle za konkurencją i wypuściła procesor Cyrix 6x86 MII. Jednakże wersje 166, 200, 233, 266, 300 i 333 MHz są dużo słabsze od konkurencyjnych produktów i nie nadają się do gier czy aplikacji 3D, pomimo zaimplementowania instrukcji MMX. Nic nie dało zastosowanie nowej technologii wykonania, wynoszącej 0,35 mikrona przy pierwszych egzemplarzach oraz 0,25 przy następnych.
Rok 1998 przynosi wzrost szybkości i wydajności procesorów. Pojawiają się nowe produkty AMD, o nazwie K6-2 i K6-III. Dodatkowe instrukcje wektorowej arytmetyki zmiennoprzecinkowej, rozłam x86 na dwie odrębne listy rozkazów, w K6-III pamięć cache L2 o pojemności 256 kB wbudowana w chip, dodatkowe instrukcje SSE (streaming SIMD extensions) oraz 3D Now! powodują że procesory bardzo dobrze zachowują się w grach 3D.
Rok 1999 to znowu wzrost mocy i wydajności procesorów. Na rynku pojawiają się Pentium III i AMD Athlon. Pentium III taką nazwę otrzymał procesor Intela, znany pod nazwą kodową Katmai. Procesorowi wbudowano rozszerzoną listę instrukcji, zorientowaną na wspomaganie grafiki trójwymiarowej. Nowe instrukcje, początkowo nazywane jako MMX 2, a później KNI (Katmai New Instructions), otrzymały oficjalną nazwę Streamed SIMD eXtension. Streamed SIMD eXtension to przede wszystkim zmiennoprzecinkowa jednostka wykonawcza, umożliwiająca wykonywanie operacji o pojedynczej precyzji równocześnie na czterech argumentach, przy wykorzystaniu ośmiu 128-bitowych rejestrów. Zestaw pięćdziesięciu instrukcji SIMD pozwala na intensywne wspomaganie grafiki trójwymiarowej, a także innych zadań wymagających dużej wydajności zmiennoprzecinkowej, jak np. rozpoznawanie mowy. Dzięki tym instrukcjom procesor Pentium III dysponuje wydajnością wystarczającą do takich zadań, jak np. kompresja strumienia wideo do formatu MPEG 2 w czasie rzeczywistym. System pamięci cache w Pentium III jest analogiczny, jak w jego poprzedniku. Stosunkowo niewielka pamięć L1 (32 kB), umieszczona w strukturze procesora i pracująca z pełną szybkością jego zegara, wspierana jest dużą, bo liczącą 512 kB pamięcią drugiego poziomu, umieszczoną na zewnątrz i pracującą z połową szybkości zegara procesora. Wyglądem zewnętrznym Pentium III nie odbiega od swojego starszego brata. Zmiennoprzecinkowe instrukcje SIMD dały Pentium III dwukrotnie większa wydajność w aplikacjach 3D, nad konkurencyjnymi dotychczas procesorami AMD K6-2 i K6-III. Pierwsze wersje Pentium III o oznaczeniach E i EB pracują z zegarami od 500 do 800 MHz. Coppermine to klon Pentium III, jego jądro wyposażone w 256 kB pamięci cache L2, umieszczonej na wspólnej z procesorem strukturze krzemowej. Pamięć ta współpracuje z procesorem z pełną szybkością jego zegara - dwukrotnie szybciej niż ma to miejsce w procesorze Pentium III. Coppermine mają zegary 800, 866, 933, 1000 i 1133 MHz.
Najwydajniejszym procesorem z rodziny Pentium III jest Tanner. Oficjalnie procesor przybrał nazwę - Pentium III Xeon. Na budowę układu wykonanego w technologii 0,25 wykorzystano 9,5 miliona tranzystorów. Częstotliwość pracy zegara wynosząca 100 MHz, pamięć cache L2 o pojemności od 512 kB do 2 MB zapewniły moc, którą wykorzystano głównie w konfiguracjach wieloprocesorowych. Intel wyprodukował jedynie dwa egzemplarze z zegarami 500 i 550 MHz.
Odpowiedzią AMD na nowe procesory Intela był Athlon. Po raz pierwszy w historii procesorów x86 konstrukcja AMD uzyskała znaczną przewagę wydajności nad produktami konkurencji. Pierwsze testy nowego procesora wykazały, że Athlon w porównaniu z procesorem Pentium III, pracującym z tą samą częstotliwością zegara osiągnął dużą przewagę. Źródła wydajności K7 należy dopatrywać się w jego wewnętrznej architekturze. Pamięć cache L1 zastosowana w K7 była największą jak na ówczesne czasy tego typu pamięcią w historii procesorów z rodziny x86, wynosiła 128 kB. Cache L1 podzielono na 64 kB cache danych i 64 kB cache instrukcji. Takie rozwiązanie pozwoliło na znaczne zwiększenie poziomu trafień pamięci, a tym samym na zwiększenie płynności przepływu danych. Pierwszy seryjny K7, pod nazwą Athlon z 512 kB pamięci cache L2, pracującej z 1/3 częstotliwości zegara jądra procesora, wykonany został w technologii 0,25 mikrona, w wersjach 500, 550, 600, 650 i 700 MHz.
Następcą Athlona zostaje procesor znany pod kryptonimem Thunderbird. Układ wykonany w technologii 0,18 mikrona różni się od poprzednika, przede wszystkim zintegrowaną z jądrem pamięcią podręczną drugiego poziomu oraz typem złącza. Pamięć cache L2 zredukowana została o połowę, czyli do 256 kB. Nowe Atlony pracują z częstotliwością magistrali 200 MHz, a w przypadku Athlona 1200 MHz 266 MHz. W procesorze AMD zaimplementowano znane z układów K6-2/III instrukcje SIMD, dzięki którym możliwe jest znaczne przyśpieszenie obliczeń zmiennoprzecinkowych. Listę poleceń zwiększono z 21 do 45, z czego nowością są nowe rozkazy wykorzystywane do kodowani i dekodowania MP3, dźwięku przestrzennego, MPEG2.
Dla mniej wymagających użytkowników AMD wprowadziło tanią konstrukcję procesora o nazwie Duron. Układ ten zaprojektowano z myślą o bezpośredniej rywalizacji z Celeronem, a wyniki jakie osiąga, pozwalają mu konkurować także ze słabszymi wersjami Pentium III. Duron komunikuje się z pamięcią przez magistralę taktowaną zegarem 100 MHz, pracującą w trybie DDR, co daje w efekcie częstotliwość FSB równą 200 MHz. Projektanci z AMD zastosowali ciekawe rozwiązanie w przypadku pamięci, stosując tak zwany exclusive cache. Rozwiązanie to polega na połączeniu cache L1 i L2, stanowiącą praktycznie wspólną pamięć podręczną o sumarycznej pojemności. Podobnie jak w układach K6, w układzie zaimplementowano zestaw rozkazów 3DNow!, poszerzając je o dodatkowe rozkazy nazwane Enchanced 3DNow!. Dzięki tym instrukcjom Duron nie tylko sprawdza się w zastosowaniach biurowych ale także w bardzo obciążających procesor grach 3D. Główną zaletą procesora jest jego cena.
W obliczu rosnącej konkurencji ze strony AMD, Intel wprowadził na początku 2000 roku na rynek procesor Celeron II. Od swoich starszych braci różni się przede wszystkim nową architekturą i szerokością ścieżek. Celeron II produkowany w technologii 0,18 mikrometra jest bardzo podobny do Pentium III Coppermine. Wyposażono go w instrukcje SSE, co korzystnie wpłynęło na jego wydajność. Także obudowa procesora zmieniła się z PPGA na FC-PGA. Intel aż do modelu z zegarem 766 MHz nie zmienił częstotliwości magistrali i w dalszym ciągu wynosi 66 MHz. Dopiero Celerony z zegarem od 800 MHz wzwyż wyposażono w 100-megaherową magistralę. Jednak i ten zabieg nie pozwolił uzyskać przewagi wydajnościowej Celerona II nad Duronem. Obecnie najsilniejszym zegarem z jakim pracuje Celeron Tualatin to 1300 MHz. Nowe Celerony otrzymały obudowę FC-PGA2 oraz metalową osłonę na chip lepiej odprowadzającą ciepło. Procesory z serii Tualatin wyprodukowano w technologii 0,13 mikrona, co pozwoliło obniżyć napięcie zasilania do 1,475 V.
Przeciwko Athlonowi Intel wystawił groźnego konkurenta Pentium IV. Ten najświeższy produkt wyróżnia się głównie zastosowaną architekturą i częstotliwością pracy układu, wynoszącą od 1,3 do 2 GH przy konwencjonalnym chłodzeniu. Willamette, tak brzmi nazwa kodowa procesora wykonanego w technologii 0,18 mikrona, a w przypadku układu z zegarem 2 GHz w technologii 0,13 mikrona. Procesor szczególnie sprawdza się w grach, przy obróbce muzyki i obrazu, ze względu na zastosowanie w nim nowej jednostki arytmetryczno-logicznej, która pracuje z dwukrotnie większą prędkością niż reszta układu. Wyróżniającym się elementem Pentium IV jest 64-bitowa, 400 megahercowa magistrala systemowa o przepustowości 3,2 GB/s oraz 16 kB cache L1. Cache L2 wynosi 256 kB. W Pentium IV usprawniono działanie mechanizmów SIMD, a zestaw instrukcji SSE powiększono o kolejne 144 rozkazy SSE2, umożliwiające operacje na 128-bitowych liczbach zmiennoprzecinkowych. Nowe procesory wymagają użycia podstawki Socket 432 lub Socket 478. Przy zakupie procesora dostajemy 128 MB pamięci RDRAM.
W wyniku kolejnych eksperymentów Intela przy poszukiwaniu wydajności powstało Pentium IV o nazwie kodowej Northwood. Technologia produkcji układu 0.13 mikrometra, napięcie zasilania rdzenia: 1.5V spowodowały znaczne pomniejszenie układu. Jednakże mimo małych rozmiarów Northwood wymaga bardzo wydajnego chłodzenia. Pierwsze testy pokazywały znaczną przewagę nowego układu nad procesorami konkurencji, jednak po pojawieniu się na rynku Athlona XP 2000+ z jądrem Palomino przewaga zmalała niemalże całkowicie. Athlon prawie we wszystkich testach osiąga wyniki lepsze od Pentium, a w niektórych osiąga przewagę kilku dziesięcio procętową. Przed zakupem nowego procesora Intela odstrasza jego cena. Za procesor 2,2 GHz trzeba zapłacić prawie 2500zł.
Pentium IV Xeon kodowa nazwa Foster, to procesor o przeznaczeniu na rynek konfiguracji wieloprocesorowych. Architekturą nie odbiega od swojego poprzednika Willamette. Wykonany w technologii 0,18 mikrona, ma 603 nóżki i wymaga odpowiedniej podstawki. Pojawi się w wersjach 1400, 1500 i 1700 MHz.
Intel pokazał na salonie LinuxWorld procesor Itanium kodowa nazwa Merced. Najwyższa zaprezentowana wersja pracowała z zegarem 733 MHz w konfiguracji jednoprocesorowej. Natomiast w konfiguracji 16-procesorowej Itanium, układy chodziły z częstotliwością zegara ok. 500 MHz. Zapowiadana jest również wersja z 800 MHz zegarem. Ten nowy układ zrywa zupełnie z dotychczasową architekturą x86 na korzyść EPIC (Explicitly Parallel Instruction Computing), która ma znacząco poprawić szybkość wykonywania równoległych instrukcji. Itanium pozostanie kompatybilny "w dół" z 32-bitowymi aplikacjami, dzięki wbudowaniu dodatkowo starego jądra x86. Największą wydajność Itanium ma zapewnić zastosowanie specjalnie zoptymalizowanego oprogramowania, napisanego z wykorzystaniem EPIC i skompilowanego w 64-bitowym środowisku. Intel wspiera czołówkę światowych producentów software'u w przygotowaniu 64-bitowych systemów operacyjnych. Przede wszystkim firma Microsoft z 64-bitowym systemem operacyjnym ma pomóc wprowadzić na rynek 64-bitowe układy. Powstaje również 64-bitowy Linux Trilion.
W momencie gdy Intel pokazał 2-u GHz Pentium IV, AMD wprowadziło na rynek następcę obecnych Atlonów. Zademonstrowany procesor o nazwie kodowej Palomino pracował z częstotliwością zegara 1433 MHz (XP 1600+). Jak się później okazało nowe procesory otrzymały nowe nazewnictwo. Np: Athlon o nazwie XP 1700+ oznacza że osiąga wydajność porównywalną z Pentium IV 1,7GHz, jednakże "+" zapowiada jeszcze większą wydajność. Architektura QuantiSpeed™, liczba operacji w jednym cyklu zegara: 9, potoki stałoprzecinkowe: 3, potoki zmiennoprzecinkowe: 3, dekodery x86: 3, pamięć L1 cache: 128KB, pamięć L2 cache: 256KB zintegrowanej pamięci, łączna ilość pamięci cache pracującej z pełną częstotliwością: 384KB, częstotliwość magistrali systemowej: 266MHz, maksymalna przepustowość magistrali: 2.1 GB/s, zaległe operacje magistrali: 24 na procesor, technologia zegara: Source synchronous (Zegar wyprzedzający) i instrukcje rozszerzające 3D: 3DNow!™ Professional to tylko niektóre cechy nowego superwydajnego procesora. Nowy Athlon jak sama nazwa wskazuje (XP) zapewnia extra wydajność (w przeciwieństwie do Pentium IV) a ponadto za tę super moc niewiele trzeba zapłacić.
Jeszcze za mniejsze pieniądze można kupić ulepszonego Durona z jądrem Morgan. Począwszy od modelu 1,0 GHz, dotychczasowy rdzeń został zastąpiony jądrem zapożyczonym z Athlona XP (Palomino). W nowych Duronach oprócz nowego modułu dekodowania rozkazów (data prefetch), zastosowano zestaw instrukcji 3DNow! Professional odpowiednik Intelowskich SSE. Wydajność Morgana można porównać z procesorami Celeron II Tualatin, jednak w testach wyraźnie widać dużą przewagę tego pierwszego.
Niedawno na rynku pojawił się nowy procesor Intela Prestonia. Jest to typowa konstrukcja procesora przeznaczonego dla stacji roboczych i wydajnych serwerów. Procesor ma 602 wyprowadzenia, wielkość cache L2 zależy od modelu. Xeon z L2 o pojemności 256KB przeznaczony jest do stacji roboczych, natomiast o 512KB do serwerów. Procesory pracują także z różnymi zegarami, ten z 256KB cache z zegarami 1,4, 1,5, 1,7 i 2,0GHz, natomiast jego brat bliźniak z zegarami 1,8, 2,0 i 2,2GHz.
Producent z Texasu zapowiedział nowe procesory o kodowych nazwach Hammer. Przyszły 64-bitowy procesor AMD o nazwie Hammer będzie obsługiwał instrukcje SSE oraz SSE 2. Będzie to więc dodatkowy atut w rywalizacji tego procesora z 64-bitowym Itanium Intela. Podobnie jak lista rozkazów 3DNow, instrukcje SSE mają przyśpieszyć niektóre obliczenia 3D oraz aplikacje multimedialne (rozpoznawanie głosu, dekodowanie obrazu wideo). Hammer będzie obsługiwał następujące zestawy instrukcji: MMX, 3DNow!, SSE, SSE 2. K8 będzie produkowany w technologii 0,13 mikrona. Ukaże się w dwóch wersjach: "ClawHammer" (2002) dla systemów jedno- i dwuprocesorowych oraz "SledgeHammer" na szynie LDT i z dużym cache'm L2 (2002), który będzie montowany w maszynach dwu- i czteroprocesorowych.
W najbliższym czasie ma pojawić się Athlon Thoroughbred przeznaczony dla stacji roboczych nieco później Barton. Oba procesory pojawią się pod postacią Athlona XP o oznaczeniach od 1800+ do 2600+ (Thoroughbred) oraz od 2400+ do 2800+ (Barton). Oba będą produkowane w technologii 0,13 mikrona.
Także i rodzina Duronów powiększy się, następcą Morgana będzie Appalloosa produkowany w technologii 0,13 microna. Szyna FSB zostanie podniesiona ze 100 do 133. Szeroką gamę procesorów będzie rozpoczynał model 1500+ kończąc na 2200+. Wieczny konkurent AMD także nie składa broni, wręcz przeciwnie prace wrą nad procesorami o kodowych nazwach: Galatin, Nocona, Banias, Derfield, Madison i Prescott. Galatin to nowe jądro Pentium Xeon przeznaczonego do konstrukcji wieloprocesorowych. 16 KB cache L1, 512 L2 i od 1 do 2 MB L3, technologia produkcji 0,13 microna oraz zegary od 1,6GHz to wielkości którymi będzie mógł szczycić się Galatin. Prescott to procesor który jak zakładają jego twórcy będzie wykonany w technologii 0,09 mikrona. Nowy procesor przeznaczony dla domowego użytkownika wykorzystywał będzie technologię HyperThreading (równoległe przetwarzanie instrukcji). Następny w kolejności Nocona to nic innego jak Pentium 5 Xeon. Ma być 32-bitowym procesorem produkowanym w technologii 0,1 mikrona przeznaczonym dla wydajnych dwuprocesorowych serwerów i stacji roboczych. Pojawić się powinien w 2003 roku z zegarami powyżej 3GHz. Także wtedy ujrzy światło dzienne Deerfield i Madison kości dla 64-bitowego procesora Itanium. Najpóźniej swoją premierę będzie miał Banias około 2004 roku..
3.Najnowsze procesory
Produkowane w obecnym czasie procesory pomimo istotnych podobieństw w ogólnej architekturze, występują w nich znaczące różnice w działaniu i w konstrukcji poszczególnych bloków wykonawczych. Te rozwiązania, różniące się wewnętrznymi szczegółami budowy, wpływają na wydajność różnych modeli CPU. Jeśli mowa o procesorach to uwzględnię produkty firm AMD, INLET i VIA.
Schemat współczesnej architektury procesorów
3.1. Procesory AMD
Wykres przedstawia mapę rozwoju najnowszych procesorów AMD:
AMD Durom
Procesor AMD Duron umożliwia stworzenie systemu PC zoptymalizowanego dla zwracających uwagę na koszty użytkowników domowych oraz typu business. Wraz z premierą procesora AMD Duron, użytkownicy segmentu value mają dostęp do technologii, która wyróżnia ten procesor od innych w swojej klasie
Cechy charakterystyczne:
Szybka magistrala systemowa: Procesor AMD Duron posiada 200MHz-ową magistralę sytemową, oferującą trzykrotnie większą przepustowość niż procesor Intel Celeron (66MHz). Szybka magistrala systemowa oznacza bardzo wysoką wydajność aplikacji przetwarzających duże ilości danych, takich jak odtwarzacze MP3 i kompresory, odtwarzacze softDVD, pakiety do edycji video. Ponadto, posiada zapas mocy na przyszłość dla urządzeń peryferyjnych o dużej przepustowości oraz innych dopiero pojawiających się technologii bez straty wydajności.
Wyrafinowana architektura pamięci cache: Architektura pamięci cache procesora AMD Duron zawiera 192KB zintegrowanej pamięci cache-20% więcej niż oferuje Intel Celeron.
Superskalarna jednostka zmiennoprzecinkowa z rozszerzoną technologią 3DNow!TM: Procesor AMD Duron oferuje trzy potoki zmiennoprzecinkowe podczas gdy procesor Intel Celeron tylko jeden. Jest to cecha bardzo podnosząca wydajność, która w połączeniu z rozszerzoną multimedialną technologią AMD 3DNow!TM, umożliwia procesorowi AMD Duron dostarczanie najwyższej wydajności w aplikacjach wykorzystujących obliczenia zmiennoprzecinkowe i multimedialne. Aplikacje tego rodzaju to na przykład narzędzia do projektowania stron internetowych, jak również wiele współczesnych produktów rozrywkowych i edukacyjnych.
Bezkonkurencyjny lider w swoim segmencie. Dzięki wszystkim korzyściom wynikającym z jego innowacyjnej architektury, procesor AMD Duron spełnia potrzeby najbardziej wymagających użytkowników segmentu value bez nadwyrężania ich budżetów. W zastosowaniach domowych, procesor AMD Duron ujawnia swą bardzo dużą moc obliczeniową.
AMD DURON Applebred
AMD potwierdziło wypuszczenie nowej wersji tych procesorów, opartej na rdzeniu zwanym Applebred, lub bardziej popularnie Duron Model 8. Zadaniem nowych procesorów jest podbicie rynków w Chinach, Ameryce Łacińskiej i Europie Wschodniej, gdzie wciąż utrzymuje się dość wysokie zapotrzebowanie procesory Duron. Procesory AMD Duron Model 8 posiadają 128KB pamięci cache L1 i tylko 64KB pamięci cache L2, analogicznie jak poprzednia wersja Duronów. Podstawową różnicą pomiędzy starym i nowym Duronem jest częstotliwość szyny systemowej, która została zwiększona z 200 MHz do 266 MHz
Cena nowych Duronów poniżej 50 dolarów sugeruje, że procesory te były dopasowywane do mocno wrażliwych na cenę rynków, gdzie ważniejszym czynnikiem decydującym o zakupie chipa jest jego cena, a nie możliwości. Biorąc pod uwagę, że na takich rynkach raczej dominuje starszy sprzęt komputerowy, maksymalna częstotliwość taktowania jednostki wynosząca 1,8 GHz wydaje się być całkiem wystarczającą dla dużej części potencjalnych nabywców nowego Durona.
Nowy Duron 1400 ma zablokowany mnożnik przez nacięte laserem mostki. W ich odblokowywanie mogą się oczywiście bawić posiadacze starszych płyt, chętni podkręcić trochę swój procesor (porady jak to zrobić znajdziecie między innymi w naszych dziale PROBLEMY). Jednak zacznie większe możliwości i efekty w podkręcaniu Durona 1400 Applebred, będą mieć posiadacze najnowszych płyt, np: z VIA KT400, KT600 czy nForce2. Moi drodzy, ten procesor „świetnie” dobrze podkręca się przez szynę FSB. Bez żadnego zająknięcia, bez żadnej zmiany napięcia VCore (całe szczęście, bo Gigabyte którego wybrałem sobie do testów jak na złość nie oferuje zmiany napięć VCore) poszedł na szynie 175 MHz ! (efektywnie na FSB 350 MHz~) i pociągając tym samym za sobą pamięci DDR do częstotliwości 350 MHz. Tak więc teraz już wiecie, po co nam były tak mocne ramy. Sądzę, że przy podniesieniu napięcia VCore o 0.1-0.2V, procesor ten zdolny byłby pracować nawet przy magistrali 200 MHz (efektywne 400 MHz) czyli z częstotliwością 2100 MHz.
AMD Athlon
Procesor AMD Athlon reprezentuje pierwszą w przemyśle x86 mikroarchitekturę siódmej generacji. Rodzina procesorów AMD Athlon została zaprojektowana dla platform x86 następnej generacji. Spełnia wymagania najnowszych aplikacji przeznaczonych dla najnowocześniejszych komputerów desktop, stacji roboczych i serwerów. Wszystkie procesory AMD Athlon są obecnie produkowane z użyciem technologii 0.18-mikrona. Podczas gdy wszystkie produkowane obecnie przez AMD procesory AMD Athlon posiadają 256K zintegrowanej pamięci L2 cache, działającej z pełną częstotliwością jądra, wcześniejsze wersje bez zintegrowanej pamięci L2 cache mogą być dostępne w niektórych komputerach. Rewolucyjna szyna danych, pracująca obecnie z częstotliwością 266MHz. Procesor siódmej generacji AMD Athlon oparty jest o najbardziej zaawansowaną architekturę x86. Poniższe cechy i możliwości łączą się by dać użytkownikom komputera z procesorem AMD Athlon największą moc oraz pewność, że zaspokoi on ich potrzeby w nadchodzących latach.
Mikroarchitektura: Procesor AMD Athlon posiada wielopotokową, dziewięciojednostkową, superskalarną architekturę zoptymalizowaną dla wysokich częstotliwości taktowania zegara. AMD Athlon zawiera dziewięć potoków wykonawczych: trzy dla adresowania danych, trzy dla obliczeń stałoprzecinkowych i trzy do wykonywania instrukcji x87(koprocesor), 3DNow!™ i MMX™.
Magistrala systemowa: Magistrala systemowa procesora AMD Athlon jest pierwszą magistralą dla platform x86 pracującą z częstotliwością 200MHz i większą. W chwili obecnej procesory AMD Athlon dostępne są w wersjach z magistralą 200 i 266MHz. Jako jedna z najszybszych magistral dostępnych dla procesorów x86, zapewnia aż o 100 procent większą przepustowość niż jakakolwiek inna magistrala x86. Została zaprojektowana dla skalowalnych systemów wieloprocesorowych i wykorzystuje bardzo wydajny protokół AlphaTM EV6 aby zapewnić najwyższą wydajność systemu.
Jednostka zmiennoprzecinkowa: Procesor AMD Athlon posiada pierwszą, w pełni potokowaną, superskalarną jednostkę zmiennoprzecinkową dla platform x86. W efekcie posiada on najpotężniejszą jednostkę zmiennoprzecinkową jaką kiedykolwiek posiadał procesor x86.
Rozszerzona technologia 3DNow!TM: Rozszerzona technologia 3DNow! zaimplementowana w procesorze AMD Athlon znacznie podnosi wydajność i tworzy w oparciu o 21 oryginalnych instrukcji 3DNow! firmy AMD pierwszy zestaw rozkazów x86 używający superskalarnych, zmiennoprzecinkowych instrukcji SIMD. Rozszerzone 3DNow! dodaje 24 nowe instrukcje -19 by poprawić obliczenia stałoprzecinkowe MMX? i zwiększyć transfer danych w aplikacjach internetowych oraz 5 instrukcji DSP dla soft modemu, soft ADSL, Dolby Digital i programów do odtwarzania MP3.
Architektura pamięci cache: Procesor AMD Athlon posiada łącznie 384K zintegrowanej z jądrem, pracującej z pełną częstotliwością zegara pamięci cache, w tym 128K pamięci L1 cache--cztery razy więcej niż procesor Intel PentiumŽ III -- oraz 256K zintegrowanej pamięci L2 cache. Ten system pamięci cache zwiększa ogólną wydajność systemu.
Pamięć Double Data Rate (DDR): Stanowiąca naturalną ewolucję pamięci PC100/133, pamięć DDR umożliwia uzyskanie niezrównanej wydajności x86 pozostając jednocześnie konkurencyjna cenowo. Podczas gdy inne rodzaje pamięci SDRAM pozwalają tylko na jeden zapis i odczyt w cyklu zegara, pamięć DDR pozwala na zapis i odczyt dwukrotnie w każdym cyklu zegara. Pamięć DDR jest dostępna u głównych producentów pamięci DRAM na całym świecie.
AMD Athlon XP
Firma AMD od wielu lat stanowi siłę, która zmusza innych producentów procesorów do ciągłego rozwoju. Zdarzają się okresy, w których wychodzi na prowadzenie szczególnie udanymi konstrukcjami, jednak od kilku już miesięcy jej układy pozostają w cieniu . Dopiero ostatnia premiera, czyli Athlon XP 2600+, zmieniła dość wyraźnie ten niekorzystny układ sił, pozwalając AMD zbliżyć się do najszybszych procesorów Intela. Cechują się bardzo dobrym współczynnikiem wydajności do ceny, a ich największą wadą spora podatność wysoka na uszkodzenia wynikające ze zbyt wysokiej temperatury pracy. Z tego powodu konieczne jest używanie wydajnych, ale przez to dość hałaśliwych wentylatorów.
Najnowszy procesor 2600+ to już inna historia. Jądro Thoroughbred, wprowadzone w wersji 2200+, zostało przeprojektowane (zwiększono liczbę wewnętrznych połączeń), co dało znakomite rezultaty. Wyniki testów pokazują, że najnowszy układ AMD może bez obaw konkurować z 2,53 GHz, choć do 2,83 GHz wciąż nieco traci. Są to jednak różnice o marginalnym praktycznym znaczeniu. Jedyny problem z AMD 2600+ to jego mocno ograniczona dostępność. Wiele płyt do procesorów AMD ma wbudowane funkcje przetaktowywania układów, jednak Athlony w niewielkim stopniu poddają się tego typu zabiegom.
Nowe funkcje
AthlonXP oferuje 3-7% więcej wydajności na takt zegara w porównaniu do poprzednich wersji desktopowych Athlona opartych na rdzeniu 'Thunderbird', ponieważ oparty jest na nowym rdzeniu 'Palomino', który już znamy z wieloprocesorowej oferty AMD - AthlonaMP i przenośnych procesorów Mobile Athlon4.
Dodane funkcje Palomino:
Nowa konstrukcja zmniejszająca pobór energii w porównaniu do rdzenia Thunderbird o 20%
Implementacja pełnego zestawu intelowskich instrukcji SSE. Flaga SSE procesora jest ustawiona (jeżeli BIOS płyty głównej obsługuje Palomino), więc oprogramowanie może uznać AthlonaXP za procesor SSE. AMD nazywa swoją implementację SSE '3Dnow! Professional'.
Jednostka automatycznego sprzętowego pre-odczytu danych
Bufor TLB (ang. Translation Look-Aside Buffer) pamięci podręcznej danych pierwszego poziomu został zwiększony z 32 do 40 wpisów, architektury buforów TLB pamięci podręcznych danych i instrukcji pierwszego i drugiego poziomu teraz będą pracować w trybie wykluczającym, a wpisy TLB będą mogły być dokonywane z wyprzedzeniem.
Implementacja diody termicznej monitorującej temperaturę procesora
Nowa obudowa
AthlonXP posiada nową obudowę, która jest oparta na tym samym materiale, co intelowskie procesory Pentium III, Celeron czy Pentium 4. Jedyna różnica jest taka, że materiał wykorzystywany w Athlonach XP jest brązowy, natomiast procesory Intela są zielone. Nowy materiał ma mieć lepsze właściwości termiczne i posiadać większą elastyczność od poprzednio wykorzystywanej ceramiki. Poza tą ważną cechą, nowy materiał organiczny jest również lżejszy i tańszy od poprzedniego.
Częstotliwości zegarów:
Częstotliwość |
Oznaczenie |
1333 |
1500+ |
1400 |
1600+ |
1467 |
1700+ |
1533 |
1800+ |
1600 |
1900+ |
1667 |
2000+ |
AMD Hammer
Procesor z rodziny Hammer oparty jest na architekturze X86-64 będącej logicznym rozszerzeniem typowej architektury X86-32. Procesory ósmej generacji firmy AMD posiadają 8 dodatkowych, uniwersalnych, 64 bitowych rejestrów a więc niezwykle szybkich obszarów pamięci używanych wewnątrz CPU przy wykonywaniu obliczeń i innych operacji. Rozszerzenie rejestrów GPR do 64 bitów umożliwi nowym procesorom wydajne, szybkie a przede wszystkim bardzo dokładne wykonywanie obliczeń na szalenie dużych liczbach całkowitych. Rejestry te przyspieszą też wykonywanie zaawansowanych algorytmów szyfrowania. Nowe procesory AMD obsługują też 64 bitowe, płaskie adresowanie wirtualne umożliwiające obsługę 4500 terabajtów pamięci operacyjnej. Jednak pierwsze Hammer'y obsługiwać będą tylko 48 bitowe adresowanie, co i tak umożliwi obsługę do 280 terabajtów pamięci, a więc wystarczająco dużo nawet jak dla super wydajnych serwerów.
Architektura X86-64 obsługuje też intelowskie instrukcje SSE oraz SSE2, a także 16 dodatkowych instrukcji tego typu obsługiwanych w trybie 64 bitowym.Hammer'y posiadać będą zintegrowany kontroler pamięci DDR SDRAM o 64 lub 128 bitowym interfejsie. Obsługiwać on będzie mógł zarówno pamięci PC1600, 2100 jak i nadchodzące PC2700, a z rdzeniem procesora połączony będzie za pomocą szyny HyperTransport.
Dzięki temu kontrolerowi zmniejszeniu ulegną opóźnienia w korzystaniu z pamięci, a ogólna przepustowość będzie wzrastać wraz ze zwiększaniem liczby pracujących wspólnie układów. Przykładowo przepustowość 4 procesorów Hammer sięgać ma 8 GB/sec.
Dodatkowo w rdzeniu tych procesorów umieszczono 1 MB pamięci cache drugiego poziomu.
|
|
|
|
Przeznaczony dla wysokowydajnych serwerów SladgeHammer posiadać będzie najprawdopodobniej dwa jądra procesorów zintegrowane w jednym krzemie i połączone z wykorzystaniem technologii HyperTransport. 128 bitowy kontroler pamięci tego procesora obsłużyć może do 8 modułów pamięci, zaś 8 procesorowy system będzie w stanie obsłużyć 64 moduły obsadzone nawet 128 GB pamięci. Kontroler 64 bitowy ujrzymy w desktopowej wersji nowych procesorów o nazwie ClawHammer.
Hammery posiadać będą dłuższy, bo nie 10 a 12 etapowy potok wykonawczy, co przy jeszcze innych usprawnieniach architektury Athlona sprawi, iż układy tę będą w stanie pracować z zegarami znacznie wyższymi aniżeli dzisiejsze procesory firmy AMD. Warto dodać, iż podobnie jak Athlon'y, układy te posiadają 3 potoki przetwarzania i 9 jednostek wykonawczych. Różnica polega na tym, iż każdy potok ma dostęp do wszystkich jednostek wykonawczych i w każdym z tych potoków równolegle przetwarzane są dwie instrukcje.
Hammer'y posiadać będą zintegrowany mostek północny i obsługiwać będą AGP w trybie 8x, mówi się też o obsłudze mostka PCI-X. Desktopowy ClawHammer dzięki zintegrowanemu kontrolerowi pamięci, większemu rozmiarowi pamięci cache L2, a także poprawionemu mechanizmowi przewidywania kolejności wykonywania instrukcji programu będzie z pewnością układem bardzo wydajnym w typowym dla nas środowisku 32-bitowym, mało tego, raczej na pewno będzie wydajniejszy od Northwood'a, a więc następcy obecnego Pentium 4.AMD oczekuje, że w testach SPECcpu2000 procesor ten będzie uzyskiwał wyniki dwukrotnie lepsze od najwydajniejszych, dzisiejszych procesorów. Pomimo zintegrowania z procesorem kontrolera pamięci i zastosowania cache L2 o pojemności dochodzącej do 1 Mb procesory te nie będą jednak układami aż tak złożonymi jak następca Itanium, który składa się z przeszło 200 milionów tranzystorów.
Procesor AMD Opteron
Procesor AMD Opteron™, który umożliwia jednoczesne przetwarzanie 32-bitowe i 64-bitowe, jest oparty na nowej, przełomowej architekturze AMD64. Procesor ten jest zaprojektowany w taki sposób, że może wykonywać z nadzwyczajną wydajnością dotychczasowe aplikacje 32-bitowe, udostępniając równocześnie prostą ścieżkę migracji do aplikacji 64-bitowych. Ten rewolucyjny procesor oznacza ogromny postęp pod względem kompatybilności, wydajności, ochrony poczynionych inwestycji oraz obniżania całkowitego kosztu posiadania (TCO). Oferowane są trzy serie procesorów AMD Opteron: seria 100 (do konfiguracji 1-procesorowej), seria 200 (do konfiguracji 1- lub 2-procesorowej) oraz seria 800 (do konfiguracji maksymalnie 8-procesorowej).
Procesor AMD Opteron zawiera zintegrowane kluczowe elementy systemu:
Zalety procesora AMD Opteron
Procesor AMD Opteron to architektura w wysokim stopniu skalowalna, która zapewnia nowy poziom wydajności, a także elastyczną ścieżkę migracji od aplikacji 32- do 64-bitowych. Procesor AMD Opteron umożliwia przedsiębiorstwu wprowadzenie jednej architektury, która pozwoli na realizację zarówno aktualnych, jak i przyszłych jego potrzeb. Procesor ten pomaga zminimalizować komplikacje związane z integracją, jakie występują i będą w przyszłości występować w środowiskach biznesowych.
Cechy charakterystyczne:
Możliwość jednoczesnego wykonywania aplikacji 32- i 64-bitowych
Obsługa maksymalnie 3 koherentnych łączy HyperTransport, zapewniających maksymalną szczytową przepustowość 19,2 GB/s na procesor
Przestrzeń adresowa pamięci 256 TB
Skalowanie od konfiguracji 1-procesorowej do 8-procesorowej, możliwość używania tej samej infrastruktury sprzętowej i programowej przez centra przetwarzania danych lub centra komputerowe
Zintegrowany kontroler pamięci, zapewniający mniejsze opóźnienie dostępu do pamięci w systemie serwera z symetryczną wieloprocesowością (SMP)
Zastosowania procesora AMD Opteron™
Procesor AMD Opteron jest stosowany w serwerach od 1- do 8-procesorowych oraz w stacjach roboczych od 1- do 4-procesorowych. Obszary zastosowań tego procesora obejmują:
przedsiębiorstwa globalne, małe i średnie firmy, instytucje rządowe i oświatowe
przedsiębiorstwa, które wymagają szybkiego przetwarzania transakcji bazodanowych lub obsługi większej liczby użytkowników w aplikacjach handlu elektronicznego
zastosowania wymagające szybkiej grafiki, takie jak CAD i DCC
zastosowania wymagające intensywnego przetwarzania, takie jak modelowanie finansowe i aplikacje naukowe
AMD Athlon 64
Jest pierwszą w pełni sześćdziesięcioczterobitową jednostkę centralną. Kolejną wyjątkową cechą architektury Hammer jest natywne wykonywanie kodu x86-32 - języka, w jakim działają dzisiejsze Athlony i Pentiumy. Dotychczas, w przypadku np. Intel Itanium (64 bity w wydaniu Intela) potrzebna była translacja rozkazów, co owocowało znacznym spadkiem wydajności. Tutaj nie mamy takiego problemu - AMD określa swoje dziecko jako jedyny 32- oraz 64-bitowy procesor na świecie. Jeszcze jedną unikalną cechą nowych Athlonów jest zintegrowany kontroler pamięci DDR - w przypadku AMD Athlon 64 mamy do czynienia z jednokanałową wersją, natomiast w Athlonie FX miejsce znalazło dwukanałowe rozwiązanie, oferujące maksymalną przepustowość rzędu 6,4 gigabajta na sekundę. Dzięki takiemu rozwiązaniu dostępu do pamięci, eliminujemy opóźnienia powstające na drodze procesor - chipset oraz umożliwiamy wykorzystywanie pełnej przepustowości, nielimitowanej przez prędkość magistrali systemowej. Inżynierowie AMD stworzyli magistralę o nieco szumnie brzmiącej nazwie HyperTransport, potrafiącą przesyłać dane ze szczytową prędkością 6,4GB/s. To właśnie poprzez HyperTransport odbywa się komunikacja jednostki centralnej ze światem zewnętrznym - kartą graficzną, kontrolerem IDE, podsystemem wejścia/wyjścia itp. Takie, a nie inne opracowanie architektury Hammer zaowocowało jeszcze jednym - logika płyty głównej spełnia teraz jedynie bardzo proste zadanie, jakim jest stworzenie mostu pomiędzy AGP, PCI a HyperTransportem. Brak konieczności integrowania z mostkiem północnym kontrolera pamięci prowadzi do dużego zmniejszenia ilości wydzielanego przez chipset ciepła.
Charakterystyczne cechy:
Rdzeń AMD64
» obsługa zestawu rozkazów x86 czyli 32-bitowe przetwarzanie danych, oraz
wykonywanie aplikacji 64-bitowych,
» 40-bitowe adresy fizyczne, 48-bitowe adresy wirtualne,
» szesnaście (w tym osiem nowych) 64-bitowych rejestrów całkowitoliczbowych,
» szesnaście (w tym osiem nowych) 128-bitowych rejestrów SSE / SSE2,
» obsługa technologii 3DNow! Professional i zestawu rozkazów SSE2,
Pamięć cache L1 i L2
» 64 KB pamięci podręcznej instrukcji poziomu 1,
» 64 KB pamięci podręcznej danych poziomu 1,
» 1024 KB pamięci podręcznej poiozmu 2,
» udoskonalone przewidywanie rozgałęzień zapewniające większą dokładność przy pobieraniu rozkazów z wyprzedzeniem,
» powiększone bufory TLB umożliwiające lepsze zarządzanie pamięcią w przypadku złożonych obciążeń,
Zintegrowany kontroler pamięci DDR
» obsługa pamięci DDR SDRAM typu PC3200, PC2700, PC2100 lub PC1600,
» 64 bitowy intrefejs, z maksymalną przepustowością pamięci 3,2 GB/s,
» obsługa niebuforowanych modułów pamięci i pamięci ECC,
Technologia HyperTransport
» 16-bitowe łącze o maksymalnej częstotliwości taktowania 1600 MHz,
» maksymalna przepustowość wejścia-wyjścia magistrali HyperTransport 6,4 GB/s,
» maksymalna całkowita przepustowość komunikacji między procesorem a resztą systemu komputerowego 9,6 GB/s.
Architektura procesora:
3.2. Procesory INLET-a
INTEL Celeron
Intel wprowadził do swojej oferty nowy procesor z rodziny Celeron, taktowany zegarem 2,8 GHz. Procesor produkowany jest w technologii 0,13 mikrona i współpracuje z szyną systemową 400 MHz. Najszybszy dostępny do tej pory procesor z rodziny Celeron taktowany jest zegarem 2,7 GHz.
Poprzednie modele Celeronów o zegarach 1.7GHz i 1.8GHz wykonane były na starszym jądrze Wilamette, w technologii 0.18 mikrona. Posiadały 128kb pamięci cache drugiego poziomu podczas gdy procesory Pentium 4 z tym samym rdzeniem posiadały 256kb cache L2.
Obecnie rodzina Celeronów przesiadła się na rdzeń Northwood produkowany w technologii 0.13 mikrona jednak pamięć cache pozostała dalej na poziomie 128kb. Procesory Pentium 4 Northwood posiadają natomiast 512kb tej pamięci.
W przyszłym roku na rynku mają pojawić się układy Prescott z dużo wyższymi zegarami i mają osiągnąć taktowanie 3.06 GHz. Natomiast w trzecim kwartale mają pojawić się układy taktowane zegarem 3.2 GHz. Dodatkowo przed końcem roku 2004 ma być dostępny procesor Prescott z taktowaniem powyżej 3.2 GHz i wykonany w nowej technologii 90-nanometrów. Czas pokaże co z tego wyniknie bo konkurencja przecież nie śpi z nowymi procesorami Athlon 64 i Athlon 64 FX
INTEL Pentium III
Procesor Intel® Pentium® III posiada odpowiednią wydajność, wystarczającą do prowadzenia biznesu w małych firmach i dla domowych komputerów desktop. Procesor Pentium III jest uniwersalnie przystosowany do obsługi szerokiej gamy aplikacji używanych w środowisku e-biznesu lub domowych systemów elektronicznych. Serwery typu entry-level bazujące na procesorze Pentium III z pamięcią podręczną L2 512 KB mogą obsługiwać pamięć o pojemności do 6 GB. To najlepszy wybór dla jedno- lub dwuprocesorowych kompaktowych serwerów, przydatnych w środowiskach, w których liczy się zarówno moc serwera, jak i zajmowane przez niego miejsce.
Cechy charakterystyczne:
Dostępne częstotliwości |
1,40GHz, 1GHz, 933 MHz, 866 MHz, 850 MHz, 800 MHz, 750 MHz, 733 MHz, 700 MHz, 667 MHz i 650 MHz |
Chipset |
|
Cechy
|
- Technologia dynamicznego wykonywania rozkazów, zawarta w mikroarchitekturze P6 - Internetowe potokowe rozszerzenia SIAD - Nieblokująca pamięć podręczna L1 - Pamięć podręczna przesyłania L2 o wielkości 256 KB - Technologia rozszerzeń multimedialnych Intel MMX |
Pamięć podręczna |
Poziom 1: 32 KB (16 KB dla infrastruktury i 16 KB dla danych) |
Pamięć RAM |
Pamięć typu SDRAM i pamięć typu SDRAM w technologii Rambus |
Częstotliwość magistrali systemowej |
100 MHz |
INTEL Pentium 4
Firma Intel umożliwiła zastosowanie technologii Hyper-Threading¹ w komputerach desktop, wprowadzając procesor Intel® Pentium® 4 o szybkościach od 2,40C do 3,20 GHz obsługujący zaawansowaną magistralę systemową 800 MHz. Technologia Hyper-Threading firmy Intel umożliwia wykonywanie przez procesor równolegle dwóch wątków (części oprogramowania) - teraz oprogramowanie uruchamiane jest sprawniej, a wykonywanie wielu zadań jednocześnie jest wydajniejsze.
Utworzony w oparciu o mikroarchitekturę Intel® NetBurst® i technologię 0,13 mikrometra procesor Pentium® 4 zapewnia znaczny skok wydajności.
Cechy charakterystyczne:
Szybkości obslugujące technologię Hyper-Threading1 |
Magistrala systemowa 533 MHz: 2,80 GHz, 2,66 GHz, 2,53 GHz, 2,40B GHz, 2,26 GHz |
Inne dostępne szybkości |
Magistrala systemowa 533 MHz: 2,80 GHz, 2,66 GHz, 2,53 GHz, 2,40B GHz, 2,26 GHz |
Chipset |
|
Płyty główne firmy Intel do komputerów desktop: |
|
Architektura Intel® NetBurst® |
- Magistrala systemowa 800, 533 i 400 MHz - Technologia hiperpotokowa - Aparat szybkiego wykonywania rozkazów - Podręczna pamięć śledząca - Zaawansowana pamięć podręczna przesyłania - Udoskonalone szybkie wykonywanie rozkazów - Udoskonalony koprocesor i jednostka multimedialna - Streaming SIMD extensions 2 |
Dostępna technologia Intel® RAID |
Ta technologia jest obsługiwana przez chipsety Intel® 875P, 865PE, 865P , 865G z kontrolerem ICH5R |
Chipsety zgodne z Inlet Pentium 4:
Chipsety firmy Intel, optymalnie zaprojektowane oraz przetestowane pod kątem zgodności z procesorem Intel® Pentium® 4, mogą być stosowane w różnego typu systemach. Na przykład chipset Intel® 875P z technologią Hyper-Threading i magistralą systemową 800 MHz wdraża technologię Intel® Performance Acceleration Technology (PAT) z dwukanałową konfiguracją pamięcią DDR400 i technologię Intel® RAID Technology. Lub nowe chipsety Intel® 865G , 865PE i 865P z technologią Hyper-Threading oferują interfejsy wysokoprzepustowe, w tym dwukanałową pamięć główną DDR , interfejs graficzny AGP8X i technologię Intel® Communication Streaming Architecture (CSA) obsługującą interfejs Dedicated Network Bus (DNB) do kablowych kart sieciowych Gigabit Ethernet (GbE).
Szczegóły architektury Intel NetBurst:
Technologia Hyper-Pipelined (technologia hiperpotokowa)
Poszerzona technologia potokowego przetwarzania danych umożliwia procesorowi Inlet Pentium 4 osiągać najwyższe na świecie częstotliwości taktowania zegara w zastosowaniach dla komputerów osobistych typu desktop.
Streaming SIMD Extensions 2 (nowy zestaw operacji zmiennoprzecinkowych)
Streaming Single Instructions Multiple Data (SIMD) Extensions 2 poprawia wydajność przyspieszając najbardziej wymagające elementy internetowe, jak również wideo, rozpoznawanie mowy, kodowanie, obrazowanie oraz aplikacje dedykowane stacjom roboczym.
Magistrala systemowa 400MHz
trzykrotnie zwiększona szerokość pasma w stosunku do poprzednich procesorów. Magistrala systemowa 400MHz przyspiesza transfer informacji z procesora do reszty systemu, wpływając korzystnie na przepustowość i wydajność. Ta przełomowa technologia poszerza możliwości oferując pozostałym elementom systemu najwyższe prędkości przetwarzania.
Advanced Dynamic Execution (zaawansowane dynamiczne wykonywanie)
Usprawnione przewidywanie rozgałęzień przyspiesza pracę procesora i pozwala przetworzyć większą ilość danych. Bardzo głębokie prognozowane i niechronologiczne wykonywanie instrukcji zapewnia, że superskalarne jednostki wykonujące procesora są w pełni wykorzystane, zwiększając ogólną wydajność.
Poszerzona jednostka zmiennoprzecinkowa / multimedialna
Usprawniona jednostka zmiennoprzecinkowa umożliwia płynną obróbkę grafiki dwu- i trójwymiarowej wiernie oddającej rzeczywistość.
Execution Trace Cache (śledzenie wykonywania rozkazów)
Zaawansowany bufor instrukcji pamięci cache L1 skraca czas dekodowania i przechowuje rozkodowane instrukcje, poprawiając wydajność pamięci L2 i wykorzystanie przechowywanych w pamięci cache instrukcji.
Rapid Execution Engine (mechanizm szybkiego wykonywania rozkazów)
Jednostki arytmetyczno-logiczne (ALU) taktowane są dwukrotną częstotliwością pracy procesora, czyli w przypadku procesora o częstotliwości 2 GHz pracują z częstotliwością 4 GHz. Redukują czas wykonywania rozkazu, zwiększając wydajność w operacjach na liczbach całkowitych.
INTEL McKinley - następca Itanium
Od dawna wiadomo, iż Itanium jest procesorem wprowadzonym na próbę, by przetestować nową architekturę i przygotować rynek na procesory IA-64 z prawdziwego zdarzenia. A takim 64 bitowym układem z prawdziwego zdarzenia jest z pewnością następca Itanium czyli układ o nazwie McKinley. Posiada on zintegrowany z rdzeniem procesora cache L3 o pojemności 3 MB. Pamięć ta to około 180 z 220 milionów tranzystorów które na powierzchni blisko 400 mm^2 tworzą strukturę całego procesora.
Intel wyposażył McKinley w 6 jednostek operujących na liczbach całkowitych, a więc o dwie więcej aniżeli ma Itanium. Zabieg ten miał na celu zwiększenie wydajności procesora w operacjach arytmetyczno-logicznych, gdzie Itanium nie najlepiej sobie radził, w odróżnieniu od operacji zmiennoprzecinkowej, w których układ ten osiągał wręcz rewelacyjne wyniki. Łącznie McKinley ma 11 jednostek wykonawczych, a więc o dwie więcej aniżeli Itanium-Merced. McKinley pracuje też w trybie wielowątkowości drobnoziarnistej. Podczas gdy procesor wykonuje fragment jednego z wątków, do pamięci cache ładowany jest już fragment kolejnego wątku, który wykonany będzie z chwilą zakończenia pierwszego. Taki tryb praktycznie eliminuje chybienia pamięci cache instrukcji, a więc znacząco zwiększa wydajność procesora. Jednak, by praca w trybie wielowątkowym była rzeczywiście skuteczna, procesor musi mieć zapewnioną wystarczającą przepływność danych pomiędzy nim a pamięciami komputera. Dlatego konstruktorzy McKinley'a wyposażyli go w nową, 128 bitową, 400 MHz szynę do komunikacji z otoczeniem. Jej przepustowość dochodząca do 6,4 Gb/sec jest kilkukrotnie wyższa od tej oferowanej przez szynę Itanium i z pewnością wystarczy do obsługi jego następcy. Intel oczekuje, iż McKinley będzie od Itanium od 50-100 % wydajniejszy, co potwierdzają już zresztą pierwsze testy wykonane za pomocą programu SPECint200, w którym to McKinley jest o 70% wydajniejszy od swego poprzednika.
Intel Pentium 4 4 Extreme Edition
Podczas nie tak dawno zakończonego Intel Developer Forum Fall 2003, firma Intel przedstawiła wszystkim swoje nowe ciekawe zamiary. Otóż niedługo zobaczymy specjalna wersję układów Pentium 4 przeznaczona dla pasjonatów sprzętu i gier. W odpowiedzi na układ konkurencji AMD Athlon 64, Intel wypuścił linię Pentium 4 Extreme Edition, oczywiście z 800MHz-ową szyną Quad Pumped Bus, zegarem 3.20GHz i zaimplementowaną technologią Hyper-Threading. Ale główną bronią w walce z konkurencją tego układu będzie jego pojemność pamięci cache L3 równa 2MB !
Procesor zbudowany jest ze 168 milionów tranzystorów, czyli trzy razy więcej niż obecny rdzeń "Northwood". Oczywiście liczba ta obejmuje dodatkowe 2MB pamięci. Nowe ekstremalne układy Pentium 4 Extreme Edition bazują na rdzeniu Xeon'a "Gallatin" z nieco zmienioną i dostosowaną do potrzeb P4 mikroarchitekturą. Nam trafiła się znakomita okazja, aby jeszcze przed oficjalną premierą przetestować pierwszy w Polsce komputer GeoPC wyprodukowany przez firmę Komputronik, wyposażony w ten "nietypowy" procesor. Niestety, jak na razie nie znamy jeszcze ceny nowego układu, ale można się domyślać, że nie przerazi ona tylko najbardziej "extremalnych" graczy.
Procesor Extreme Edition posiada taką samą budowę i pasuje w to samo złącze Socket 478 co klasyczny Pentium 4. Podstawowa różnica to dodatkowa pamięć podręczna trzeciego poziomu: aż 2 MB. Ta specjalna wersja procesora Pentium 4 bardzo przypomina teraz niezwykle drogie procesory Intel Xeon MP wyposażane w dodatkową pamięć L3.
INLET Itanium 2
Wyjątkowa architektura procesora Intel® Itanium® 2 z pamięcią podręczną jest specjalnie dostosowana do wymagających aplikacji biurowych i technicznych. Platformy z procesorem Itanium® 2 zapewniają firmom i przedsiębiorstwom lepszy zwrot kosztów inwestycji, dzięki najwyższej wydajności uzyskanej przy niższych nakładach, i większym możliwościom wyboru niż technologie firmowe oparte na procesorze RISC. Procesory Itanium 2 są obsługiwane przez oparte na standardach otwartych rozwiązania pochodzące od ponad 40 wiodących dostawców sprzętu i przez ponad pięć systemów operacyjnych, w tym Windows* Server 2003, HP-UX i Linux* oraz setki aplikacji i narzędzi. Ponadto procesory Itanium 2 są binarnie zgodne z istniejącym oprogramowaniem opartym na procesorze Itanium, zapewniając użytkownikom ochronę dokonanych inwestycji. Aplikacje oparte na 32 bitowej architekturze Intel® Architecture-32 są obsługiwane przez rodzinę procesorów Itanium, a w przyszłości ta obsługa zostanie rozszerzona na architekturę Intel® Architecture-32 Execution Layer.
Mikroarchitektura procesora Itanium 2 obsługuje szybki dostęp do wbudowanej pamięci podręcznej o wysokiej przepustowości przesyłania danych z procesora do pamięci i innych ważnych zasobów wykonawczych, przyspieszając wykonywanie instrukcji i zwiększając ogólną przepustowość.
Procesor Inlet 2 z 6MB pamięcią podręczną L3 do dwu- i wieloprocesorowych serwerów i stacji roboczych.
|
Procesor Inlet Itanium 2 1,4GHz z pamięcią podręczną poziomu trzeciego L3 o wielkości 1,5MB
|
3.3. Procesory VIA
Via C3 Ezra 933Mhz
VIA C3 933 MHz jest jak dotąd najmocniejszą jednostką z rdzeniem Ezra. Początkowo miał mieć nazwę Cyrix III, jednak ze względu na nienajlepszą reputację marki Cyrix, VIA nadała mu własną nazwę, a mianowicie C3. Tak jak jego poprzednicy, jest on skierowany na rynek Value, czyli komputerów biurowych oraz dla użytkowników nie wymagających olbrzymiej mocy obliczeniowej. Dużym plusem tych procesorów jest jednoczesna obsługa instrukcji MMX ale także 3DNow!. Minusem natomiast jest brak możliwości wykorzystania dwóch procesorów jednocześnie, czyli rdzeń Ezra nie umożliwia pracy w trybie wieloprocesorowym.
Cechy charakterystyczne:
> Taktowanie rdzenia - 933MHz
> Mnożnik - x7
> Magistrala FSB - 100 oraz 133 Mhz
> Napięcie procesora - 1.35V
> Instrukcje multimedialne MMX
> Instrukcje multimedialne 3D-Now!
> Cache pierwszego i drugiego poziomu (64-KB kazdy, 4-way)
> 64-KB dodatkowo w cache pierwszego poziomu
> Bardzo mały rozmiar rdzenia na powierzchni (52 mm2 w technologii 0.13ľ - TSMC)
> Prędkość FSB do 133 MHz
Architektura procesora Via C3 Ezra jest rozwinięciem VIA C3 Samuel (znanego jako VIA Cyrix III). VIA jako pierwsza wyprodukowała procesor w technologii 0,13 mikrona, a być pierwszym, zaszczyt miał procesor VIA C3T (Ezra) 800MHz.
Rdzeń, dzięki zastosowaniu nowego procesu technologicznego produkcji można było wyprodukować na bardzo małej powierzchni (zajmuje 52 mm2). Procesor dzięki temu nie grzeje się nadmiernie a i pozwala to na uzyskanie dość dużych wartości zegara taktującego. Bardzo niskie wydzielanie ciepła spowodowało, że zastosowanie wiatraczka na radiatorze jest absolutnie zbędne. Jednostka działa stabilnie z zamontowanym samym radiatorem. Oczywiście jest to idealne rozwiązanie problemu głośności komputera. Można montować bezgłośne zestawy, lub komputery dla większych organizacji (szkoły, biura), gdzie przeszkadzałoby mnóstwo hałasujących wiatraczków. To właśnie jest głównym punktem na którym skupia się promocja procesorów z serii C3.
Schemat blokowy rdzenia Ezra :
VIA C3 korzysta z gniazda Socket370, czyli można go zamontować na bardzo szerokiej gamie płyt głównych z następującymi chipsetami :
VIA : VIA693A, VIA694X, VIA694Z, PM133, PLE133, PL133, Pro266
Intel : i440BX,i810, i810E, i815, i815E, i815EP
SIS : SiS620, SiS630E
VIA C3 współpracuje z naprawdę dużą ilością chipsetów (pod Pentium III i Celerona) dostępnych na rynku więc kompatybilność z różnymi płytami głównymi ma zapewnioną. Pozostaje jedynie kwestia BIOS, lecz to już jest w gestii producentów płyt głównych. Dzięki temu można sobie tanio zmodernizować komputer. Jeżeli ktoś dawno kupił sobie Celerona i teraz mu nie wystarcza lub chce mieć wreszcie trochę ciszy wokół komputera, to za naprawdę niewielkie pieniądze może uzyskać drobny przypływ mocy a ogromny odpływ hałasu wydobywającego się z obudowy.
4. OVERCLOCKING
4.1. Zmiana częstotliwości zegara systemowego
Komputer szybszy jest komputerem lepszym. A spośród dwóch komputerów jednakowo szybkich lepszym jest... tańszy, oczywiście. Aby stwierdzić, który komputer jest szybszy: trzeba porównać, z jaką szybkością pracują procesory.
Procesor decyduje z jaką szybkością komputer będzie pracował. Aby przyspieszyć własny PC wyjąć procesor (z jego gniazda w płycie głównej motherboard) włożyć do tego samego gniazda szybszy procesor i powinno dać efekt natychmiastowy. Jednak to nie procesor decyduje, z jaką szybkością będzie on sobie pracował. Szybkość procesora nie jest zakodowana, czy zaprogramowana, w samym procesorze. O szybkości, z jaką procesor pracuje w danym komputerze decyduje specjalne urządzenie. Tym urządzeniem jest zegar systemowy (system clock) wbudowany w płytę główną (motherboard). Aby nie było wątpliwości: sama wymiana procesora na szybszy niczego nie załatwi. Nowy procesor będzie pracował dokładnie z taką samą prędkością, z jaką pracował poprzedni procesor. Regulowanie szybkości procesora dokonuje się, bowiem poprzez manipulowanie wspomnianym zegarem systemowym.
Zegar systemowy właściwie w niczym nie przypomina zegara. Zegar systemowy jest prostym układem elektrycznym, którego jedynym zadaniem jest wysyłanie impulsów. Te impulsy są kierowane do procesora oraz do niektórych innych urządzeń w PC. W przypadku prostego zegara systemowego (system clock) piękna jest regularność z jaką te impulsy są wysyłane. Setki milionów impulsów są generowane przez ten zegar w każdej sekundzie, ale odstępy czasu pomiędzy impulsami są identyczne. Na każdy impuls elektryczny otrzymany od tego zegara procesor. Po każdym takim impulsie procesor sięga po następne polecenie programu komputerowego; po polecenie na które właśnie przyszła pora. Polecenie jest analizowane, czyli rozszyfrowywane, jaką to operację trzeba tym razem wykonać. Po rozszyfrowaniu polecenia zapisanego w programie komputerowym procesor uruchamia mechanizmy PC niezbędne dla wykonania tego polecenia. Może to spowodować przesunięcie jakieś liczby z jednego obszaru pamięci RAM do innego obszaru, może odczytanie czegoś z dysku, a może wydrukowanie. A po wykonaniu polecenia programu procesor zamiera. Przez następną chwilę procesor dosłownie nie robi nic. Ta chwila jest zresztą bardzo krótka, ale lenistwo jest pełne. I dopiero wtedy gdy procesor poczuje następny impuls elektryczny przysłany z zegara systemowego, wtedy bierze się za wykonanie następnego polecenia; rozszyfrowuje je, po czym uruchamia urządzenia które wykonają zapisane w programie polecenie. A po wykonaniu procesor znowu zamiera. Impuls, wykonanie polecenia, chwila lenistwa, impuls, wykonanie polecenia, chwila lenistwa, impuls... i tak bez końca. To znaczy dopóki się program nie skończy, albo dopóki PC nie zostanie wyłączony.
4.2. Zwiększamy taktowanie FSB
Producenci procesorów z oczywistych względów bronią się przed nadmierną popularnością ich podkręcania. Za skuteczne uznali blokowanie lub ograniczanie możliwości zmiany mnożnika. Jednak, bardziej zaawansowani użytkownicy szybko znaleźli nowy sposób - zmiana częstotliwości FSB (Front Side Bus), czyli głównej magistrali systemowej. Wszystko zaczynało się od "legendarnego" Celerona 300A, gdzie w wyprowadzeniach na slocie wystarczyło zakleić jeden pin, aby procesor pracował z 33 % większą magistralą - 100 MHz. Producenci płyt, najwyraźniej okazali się przychylni overclockerom, udostępniając produkty dające coraz to większą swobodę w manipulowaniu szczegółowymi ustawieniami magistrali oraz pamięci.
Dzisiaj w nawet przeciętnym pececie znajdziemy w biosie płyty różne tego typu ustawienia. Jest to bardzo wygodny i skuteczny sposób na zyskanie dodatkowej wydajności, pod warunkiem, że do całej operacji będziemy przystępować z odpowiednim zapasem wiedzy.
Czy warto podkręcać?
Na pewno warto! Zależy to jednak od platformy, którą to zamierzamy podkręcać. W przypadku Celeronów i Pentium III, szansa podkręcenia magistrali FSB jest ogromna. Wiąże się to z prostą architekturą szyny danych dla wszystkich tych procesorów, która pracuje z zegarem równym zegarowi głównej magistrali na płycie. Koniec jej możliwości wykracza dużo dalej niż oficjalna, maksymalna specyfikacja, czyli 133 MHz. Teoretycznie jest możliwe o wiele więcej, co osoby zajmujące się podkręcaniem, dosyć ekstremalnie, wykorzystały nawet do osiągnięcia wyników rzędu 180 MHz. Pamiętajmy jednak zawsze, że we wszystkich procesorach Intela mnożnik jest tradycyjnie już zablokowany, jednak dotyczy to także jego ewentualnego obniżania. Jest to ogromnym ograniczeniem w podkręcaniu topowych modeli z danej serii, bo trudno np. w przypadku Celerona 766 MHz z mnożnikiem 11.5 liczyć na wysokie podkręcenie do magistrali 100 MHz i więcej. W takich przypadkach, potencjału bardzo szybko zabraknie wyśrubowanemu rdzeniowi procesora. Bardzo ciekawym polem do zastosowania informacji, które będą przedstawione dalej jest natomiast najświeższa, kolejna już seria Pentium III, czyli nowe procesory z rdzeniem 0.13 mikrona - Tualatin. Pierwsze testy dowodzą, że ma on ogromny potencjał, którego na pewno nie ujawni pierwszy model taktowany 8.5 x 133 MHz, czyli 1 133 MHz. Uzyskanie lepszych rezultatów jest możliwe tylko, tradycyjnie dla Intela, poprzez zwiększanie częstotliwości pracy magistrali.
W przypadku, bardzo ostatnio popularnych procesorów AMD, Athlona i Durona sytuacja jest inna. Obsługiwane są one przez znacznie bardziej nowoczesną szynę EV6, zapożyczoną z procesorów (nawiasem mówiąc kupionej ostatnio przez Intela) firmy Alpha. Charakteryzuje się ona przesyłem po obu zboczach sygnału, czyli w trybie 2x, co ogranicza możliwości podwyższania jej taktowania. Początkowo, wszystkie płyty obsługujące tę szynę maksymalnie pracowały z częstotliwością 100 MHz, a możliwości podkręcania były nieporównywalnie niższe, niż w przypadku Intela. Jeżeli mamy tego typu platformę, to lepiej skorzystać ze znacznie bardziej atrakcyjnej dla procków AMD metody overclockingu, czyli zwiększania mnożnika. Z kolei dla nowszych płyt obsługujących 133-megahercową magistralę w trybie DDR, AMD natychmiast wprowadziło Athlony, które ją wykorzystywały. Kolejną sprawą jest fakt, że obecnie najwyższą wydajność Athlonów uzyskamy przy wykorzystaniu pamięci DDR, te niestety są na razie najczęściej bardzo oporne na zwiększanie ich zegara, dlatego dalej skoncentruję się tylko na platformach SDR. Dla Duronów podkręcanie za pomocą FSB rysuje się już znacznie lepiej. Procesory te pozostają cały czas przy taktowaniu 100 MHz dla magistrali, więc bardzo prosto kupując dobre pamięci SDR i nowoczesną płytę, przeznaczoną raczej pod Athlony, lecz oczywiście cały czas kompatybilną, zmusić je do pracy z charakterystyczną obecnie dla starszego brata magistralą 133 MHz.
Niezależnie, jaką posiadamy platformę, to zawsze ze zwiększenia magistrali będziemy mieli dodatkowe korzyści, ogromnego "kopa" dostaje cały system. W szczególności dotyczy to transferu do pamięci, który w grach, czy też w profesjonalnym renderowaniu skomplikowanej grafiki 3D odgrywa często rolę większą, niż sama szybkość procesora. Transfer do pamięci rośnie niemal proporcjonalnie do wzrostu częstotliwości magistrali, w szczególności dotyczy to rozwiązań pozbawionych buforów pomiędzy szyną procesora i pamięci, jak np. starsze chipsety Intela - BX/ZX/EX itd. Dowodem niech będzie ten wykres, bazujący na wynikach z Sandry 2001te na komputerze z klasyczną płytą na układzie BX.
Dotyczy to nie tylko transferu pomiędzy jednostką stałoprzecinkową (ALU) a pamięcią, ale oczywiście również transferu FPU (jednostka zmiennoprzecinkowa) - pamięć.
4.3. Podkręcanie
Podstawową rzeczą o jakiej musimy pamiętać decydując się na podkręcenie procesora zwiększając częstotliwość taktowania magistrali jest fakt, że zwiększamy tym samym wszystkie nominalne częstotliwości pracy innych szyn systemowych, zależnych bezpośrednio od głównej magistrali. Generalnie, im większą kontrolę nad opisywanymi niżej parametrami daje nam płyta główna tym lepiej, jeżeli rzeczywiście mamy zamiar osiągnąć wysoki wynik w podkręcaniu, to wystrzegajmy się konstrukcji automatycznie wybierających standardowy tryb pracy dla procesora (np. firmowe płyty Intel). Prezentowane w poniższej tabelce dzielniki występują we wszystkich nowoczesnych płytach na wszystkie platformy systemowe zarówno AMD, Intela czy też nowego układu VIA - C3. W przypadku Intela pamiętajmy jednak, że wszystkie starsze chipsety, czyli głównie klony popularnego BX'a oficjalnie nie obsługują magistrali 133 MHz, co wiąże się z brakiem dzielnika 1/2 dla magistrali AGP. Zależnie od modelu płyty możemy być także pozbawieni dzielnika 1/4 dla PCI.
FSB |
AGP |
PCI |
66 MHz |
1/1 = 66 MHz |
1/2 = 33 MHz |
83 MHz |
1/1 = 83 MHz |
1/2 = 41.5 MHz |
100 MHz |
2/3 = 66 MHz |
1/3 = 33 MHz |
|
1/1 = 100 MHz |
|
124 MHz |
2/3 = 82.6 MHz |
1/3 = 41.3 MHz |
|
|
1/4 = 31 MHz |
133 MHz |
1/2 = 66 MHz |
1/4 = 33 MHz |
|
2/3 = 86.6 MHz |
|
143 MHz |
2/3 = 95.3 MHz |
1/4 = 35.75 MHz |
150 MHz |
2/3 = 100 MHz |
1/4 = 37.5 MHz |
|
1/2 = 75 MHz |
|
155 MHz |
2/3 = 103 MHz |
1/4 = 38.75 MHz |
|
1/2 = 77.5 MHz |
|
166 MHz |
1/2 = 83 MHz |
1/4 = 41.5 MHz |
Jak widać, we wszystkich przypadkach overclockingu zegar PCI oraz AGP wzrasta. Jeżeli chodzi o AGP, to przetaktowanie będzie w 100 % nieszkodliwe dla wszystkich, w miarę nowoczesnych, kart graficznych. Problemy ze stabilnością niektórych urządzeń możemy spotkać jedynie w okolicach 100 MHz, gdzie pomocne może być obniżenie trybu transferu, odpowiednio z 4x na 2x lub, dla kart 2x, na jednokrotny mnożnik. Oznaczać to będzie ograniczenie przepustowości tejże magistrali, jednak czasami taka jest cena stabilności przy wyśrubowanych ustawieniach. Można tego dokonać z poziomu, w niektórych płytach, BIOS lub karty graficznej albo też odpowiedniego narzędzia. Warto też dodać parę słów o magistrali PCI. Osiągnięcie około 40 lub więcej MHz dla tej magistrali może oznaczać śmiertelne niebezpieczeństwo dla urządzeń na niej pracujących. Stosunkowo niewrażliwe pozostają karty rozszerzeń, jednak pamiętajmy, że w ogromnej większości płyt kontroler ATA dysków twardych obsługiwany jest właśnie przez PCI. Jest wielce prawdopodobne, że praca w tym przypadku z częstotliwościami wyróżnionymi w tabeli na czerwono zakończy się utratą danych i koniecznością ponownego spartycjonowania dysku, a w skrajnym przypadku nawet uszkodzeniem HDD lub kontrolera. Nie warto tutaj eksperymentować, a taką możliwość dają niektóre płyty główne, np. SoftMenu "overclockerskich" konstrukcji ABIT'a, czy też wszystkie modele, gdzie parametry te ustawiamy ręcznie na zworkach. Przykład takiego menu widoczny jest na zdjęciu poniżej, wszystkie parametry są prawidłowo skonfigurowane dla magistrali 150.
Ta niekorzystna sytuacja zmienia się przy płytach, gdzie za obsługę kontrolera dysku nie odpowiada już magistrala PCI, tylko kolejny, oprócz klasycznych mostków północnych i południowych, układ jak, np. w nowych konstrukcjach Intela z serii 815. Bazując na tego typu płycie możemy teoretycznie stworzyć nawet system zdolny do zniesienia taktowania 166 MHz, jeżeli tylko pozwolą na to urządzenia na szynie PCI, ale z reguły nie ma z nimi takich problemów jak z kontrolerem dysku.
4.4.Pamięć
Trzeba koniecznie zadbać o odpowiednie pamięci, ponieważ bez tego nasz wynik będzie mógł być ewentualnie zrzutem ekranu z WCPUID, ale na pewno nie osiągniemy stabilnej pracy. Najbardziej podatne na zwiększanie taktowania są uznane za "przestarzałe", ale wciąż bardzo atrakcyjne, szczególnie cenowo, moduły SDR.
Jeżeli płyta główna nie umożliwia nam asynchronicznego taktowania pamięci względem FSB, to jesteśmy zmuszeni do dostosowania parametrów posiadanej pamięci do zegara magistrali. Taktowanie asynchroniczne jest przy podkręcaniu niezwykle przydatne, o ile umożliwia ograniczenie, a nie tylko zwiększenie częstotliwości pracy pamięci. Możemy wtedy zastosować wysokie FSB, np. 166, ale przy proporcji FSB/pamięć 133:100, pamięci pozostaną na pewnym i bezpiecznym dla PC133 pułapie 124 MHz. Oczywiście, będzie oznaczać to ograniczenie transferu do pamięci, ale pozostanie korzyść z wydatnego podkręcenia procesora. Więc, jeżeli posiadamy płytę, która ma dostępną taką możliwość i niezbyt szybkie pamięci, będzie to najlepszym rozwiązaniem. Jeżeli, jednak nasza płyta obsługuje tylko synchroniczny transfer lub po prostu zależy nam na zwiększeniu wydajności, to jesteśmy zmuszeni zadbać o odpowiednie moduły DIMM. Posiadanie modułów wyposażonych w kości oznaczone jako PC133, jeżeli podkręcamy procesor, który wyjściowo działa na takiej magistrali, nie będzie wystarczające. Często też oznaczenie to okazuje się nieadekwatne do rzeczywistych możliwości modułów. Tak więc, w wyborze odpowiedniej pamięci najlepiej kierować się czasem dostępu, który to wyznacza maksymalne częstotliwości pracy.
czas dostępu [ns] |
8 |
7.5 |
7 |
6.5 |
6 |
opóźnienie CAS2 |
100 MHz |
100 MHz |
125 MHz |
133 MHz |
144 MHz |
opóźnienie CAS3 |
125 MHz |
133 MHz |
143 MHz |
154 MHz |
166 MHz |
Jak widać w tabeli, pamięci o tym samym czasie dostępu mogą pracować z różnymi częstotliwościami. Wynika to z faktu dostępności w większości BIOS'ów płyt głównych dodatkowych opcji, dostępnych najczęściej z poziomu menu kontrującego pracę chipsetu płyty. Podawany tutaj parametr wewnętrznego opóźnienia CAS określa po ilu cyklach zegarowych od wyznaczenia odpowiedniej kolumny pamięci poprzez chwilowe przyłożenie wysokiego poziomu napięcia, informacje zostaną przesłane z pamięci na szynę. Warto mieć nad tymi opcjami manualną kontrolę, gdyż jak widać jeżeli zależy nam na zwiększeniu FSB ustawienie CAS na 3 daje najlepsze rezultaty. Niektóre płyty główne umożliwiają jeszcze bardziej głęboką ingerencję w wewnętrzne opóźnienia na modułach pamięci. I tak, zwiększając częstotliwość taktowania ustawmy CAS to RAS latency na 3 oraz RAS latency również na 3 cykle zegarowe.
W przypadku, kiedy możemy dostosować opóźnienie pomiędzy poszczególnymi operacjami odczytu i zapisu, wybierzmy maksymalne wartości (R (read) - 7, W (write) - 9). Wszystko to spowoduje ograniczenie szybkości transferu o kilka procent, ale za to umożliwi zwiększenie częstotliwości pracy pamięci. Możemy też spróbować zwiększyć napięcie I/O na płycie (o ile oczywiście jest taka opcja w naszym BIOS'ie) z 3.3V do MAKSYMALNIE 3.6 V. Większość SDR'ów wytrzyma takie napięcie zasilające, a jest szansa, że stabilność ulegnie poprawie.
Kolejnym faktem, który warto podkreślić jest to, że nie powinniśmy sztywno trzymać się powyższej tabelki i koniecznie szukać modułów 6 ns, gdyż w Polsce ich znalezienie graniczy się niemal z cudem, ale już 7 ns moduły przy niektórych konfiguracjach będą mogły pracować stabilnie przy częstotliwości 150 MHz przy zwiększonym napięciu. Przewagę mają też płyty wyposażone w różnego rodzaju, choćby najmniejsze bufory, nad rozwiązaniami typowo synchronicznymi. Taki sam moduł DIMM najczęściej wytrzyma dużo więcej np. przy asynchronicznym układzie i8xx, czy modeli VIA, niż prostych, lecz za zarazem wymagających pod tym względem, Intelach z serii BX. Jedyną drogą na otrzymanie doskonałych rezultatów jest eksperymentowanie, ale jeżeli chcemy osiągnąć dużo to trzeba zapomnieć i modułach 8 ns, a tym bardziej wolniejszych. Przy obecnych cenach zdecydowanie warto wymienić takie kości na lepsze. W wielu, szczególnie zachodnich sklepach internetowych, producenci markowych modułów rozumieją wymagania overclockerów i dostarczają bardzo dobre moduły PC150 czy nawet PC166 po stosunkowo niskich, w porównaniu z modułami DDR, a tym bardziej Rambus, cenach. Dla przykładu, doskonały produkt firmy Kingmax w nowatorskiej, niskoprofilowej obudowie TinyBGA.
4.5. Skutki overclockingu
Pisząc o overclockingu nie sposób nie wspomnieć o jego skutkach. Jak wszyscy wiemy, procesory poddawane overclockingowi grzeją się bardziej niż ich nie podrasowani bracia.. A co za tym idzie:
- procesor dużo szybciej się "zużywa" (występuje większe zjawisko dyfuzji, która sprawia że procesor działa mniej sprawnie, a po przekroczeniu pewnej granicy procesor umiera)
- procesora rozgrzanego do 50C nie poddamy overclockingowi tak dużemu jak temu, który pracuje pod 30C
- komputer będzie się znacznie rzadziej wieszał. Po overclockingu komputer będzie dużo częściej "stawał".
Nie jest napisane, że koniecznie temu i temu procesorowi po o/c będzie potrzebne lepsze chłodzenie. Istnieją egzemplarze "lepsze" i "gorsze" (jednak KAŻDY powinien chodzić pod swoją oryginalną częstotliwością dobrze). Weźmy za przykład Pentium II 400, który podkręci się na 533mhz bez żadnej zmiany chłodzenia i podwyższania napięcia, podczas gdy inny ledwo będzie działał pod 450Mhz. Podwyższanie napięcia, mimo że związane jest z techniką overclockingu, jest bardzo mocno zależne od chłodzenia. Podwyższenie napięcia powoduje znaczny wzrost wydzielanego ciepła i czasami to nie pokrywa się ze wzrostem stabilności.
Zamieszczam bardzo ciekawy film pokazujący zalety technologii produkcji mikroprocesorów stosowanej przez firmę Intel w porównaniu do technologii firmy AMD.
Film został zamieszony przez portal Tom's Hardware Guide i pokazuje zagrożenie jakie niesie ze soba zbliżenie się do granicy norm dopuszczalnych w procesie produkcji materiałów półprzewodnikowych oraz udowadnia, że technologia stosowana przez firmę Intel dzięki wbudowanym zabezpieczeniom termicznym i odpowiedniemu zapasowi bezpieczeństwa pozwala na budowanie niezawodnych komputerów.
Film ten nie jest dowodem na to, iż procesory firmy Intel są "lepsze" niż procesory AMD. Daje jednak wiele do myślenia na temat różnego rodzaju "niespodzianek", na które mogą napotkać użytkownicy sprzętu "z niższych półek". Bezawaryjność jest jednym z najważniejszych czynników, jakimi kierujemy się przy doborze podzespołów do zestawów komputerowych TRON PC
(klikniecie na ikonę spowoduje uruchomienie filmu)
Testowane były następujące procesory:
Intel Pentium 4 2 GHz
Intel Pentium III 1 GHz
AMD Athlon 1.4 GHz (z rdzeniem 'Thunderbird')
AMD Athlon MP 1.2 GHz (z nowym rdzeniem 'Palomino').
Zdjęcie przedstawia cztery procesory przed testami
Zdjęcie po testach. Tylko dwa "przeżyły", procesory AMD po prostu się spaliły.
4.6. Chłodzenie procesora
Na rynku mamy do wyboru dużą ilość sposobu chłodzenia procesora: chłodzeniu radiatorami, chłodzeniu wodą, chłodzeniu "lodówkowym" (pompa cieplna i inne. Jednak wszystkie to po prostu chłodzenie powietrzem które jest mniej lub bardziej skomplikowane.
Podstawowe elementy którymi chłodzimy CPU:
1. Pasta termoprzewodząca, która jest odpowiedzialna za przeprowadzenie ciepła z CPU do układu chłodzącego. Jest wiele rodzajów past, od najprostszych silikonowych (najtańszych) do tych lepszych (np. HTCP, HTSP) i najlepszych (najdroższych) na bazie srebra/miedzi.. Oprócz pasty istnieją takie rzeczy jak "paski termoprzewodzące", które działają identycznie jak pasta.
2. Radiator z wentylatorem. Obecnie wszystkim procesorą wystarczy takie połączenie. Radiator radiatorowi nie równy. Najlepsze są te o dużej powierzchni i wykonane z miedzi, ewentualnie aluminiowe z "heatspreader" co nie znaczy że aluminiowe są niedobre. Wręcz przeciwnie, niektóre radiatory aluminiowe są lepsze od miedzianych, jednak te pierwsze będą się gorzej sprawować z procesorami z małymi heatslug tzn. późniejszymi PII, PIII, AMD Athlon, Celeron II i inne mniej popularne. Radiatory występują w dwóch wersjach: "socketowe" i "slotowe" przy czym te pierwsze z reguły można założyć na te drugie, gorzej na odwrót. Z natury rzeczy radiatory SLOT będą większe i wydajniejsze, jednak zabierają więcej miejsca i są droższe. Firmy, które stoją w czołówce produkcji radiatorów to m.in. Thermaltake, 4MAXCool, Collermaster, Zelman, PC choler, Dynatron itd.
3. Peltiery - to pompy cieplne, które są oparte na półprzewodnikach. Ogniwo Peltiera, to dwie cienkie płytki z termoprzewodzącego materiału izolacyjnego, między którymi naprzemiennie umieszczono półprzewodniki typu "p" i "n". Wykonane z tellurku bizmutu, domieszkowanego odpowiednio antymonem i selenem, "słupki" połączone są, dzięki miedzianym ścieżkom na wewnętrznych powierzchniach płytek obudowy ceramicznej, w układ szeregowy. Całość ma imponujące możliwości - potrafi wytworzyć różnicę temperatur rzędu 60-70 K, a przede wszystkim "przepompowywać" ciepło od powierzchni chłodzonej do podgrzewanej ze sprawnością ponad 50 procent. Instalując ogniwo peltiera należy wiedzieć, że całkowita moc jaką teraz będzie trzeba rozproszyć będzie sumą ciepła wydzielanego przez cpu i peltiera. Jako że nie posiadają żadnych ruchomych elementów ich trwałość jest bardzo duża, jeśli nie są przegrzane. Prawidłowo używany peltier może obniżyć temperaturę procesora o dobre 20C, czasami więcej, jednak wymagane jest wtedy dobre chłodzenie. Z drugiej strony wszelki błąd w stosowaniu peltierów, uszkodzenie wentylatora na radiatorze, zgaszenie pompy, założenie go na odwrót, nie wykryte od razu spowoduje niechybne spalenie procesora!
4. Watercooling - chłodzenie wodą Chłodzenie wodą ma to do siebie że współczynnik wydajności do ceny jest bardzo korzystny. Za watercoolera o wydajności koło 200-300W trzeba zapłacić raptem 120-300zl, w zależności od naszej pomysłowości i posiadanych materiałów. Przy odpowiedniej konstrukcji można osiągnąć do -15C. Aby chłodzić cieczą potrzebujemy:
a) zbiornik o pojemności wystarczającej aby woda schłodziła się do temperatury pokojowej zanim zostanie ponownie zassana przez pompkę do wymiennika ciepła.
b) pompkę wodną trochę większą niż od akwarium
c) odpowiednie przewody, rurki
d) wymiennik ciepła
e) narzędzia i materiały aby to wszystko podłączyć
5. Freonowe - jest to chłodzenie przy pomocy urządzeń firmy CryoTech lub ASETEK http://www.hardocp.com/reviews/cooling/vapochill/index.html Przerobione obudowy ATX z wbudowanymi agregatami chłodzącymi procesor do temperatur od -20 do nawet - 40c, wygląda to bardzo ciekawie dopóki nie spojrzy sie na cenę: słabsze modele tanszej firmy ASETEK zaczynają się od około 600 $ czyli prawie 3000zl! Schemat takiego urządzenia:
Kompresora: zasysa on freon z parownika (niebieska "rurka" ) do tłoka gdzie zostaje on sprężony w skutek czego zmniejsza się jego objętość a znacznie zwiększa się ciśnienie i temperatura. Czerwoną rurką freon trafia do skraplacza (chłodnicy) gdzie jest schładzany. Schładzając się freon powraca do stanu ciekłego oddając znaczne ilości ciepła. Ze skraplacza już jako ciecz o temperaturze około 30-40c czynnik przepływa do filtra. Filtr ma za zadanie zatrzymanie wszelkich resztek lutu użytego do montowania instalacji oraz co ważniejsze "wchłonięcia" jakichkolwiek pozostałości wody jaka pozostała w instalacji po jej uszczelnieniu. Z filtra freon trafia do Termostatycznego Zaworu Rozprężnego - jego zadaniem jest kontrolowanie temperatury w chłodnicy oraz takie sterowanie ciśnienia i temperatury w układzie żeby ciekły freon nie powrócił do kompresora gdyż szybko spowodowało by to jego awarie. Powracający gaz musi mieć określoną temperaturę gdyż ma on za zadanie dodatkowo schładzać kompresor. Fioletową rurką freon trafia do parownika gdzie jak sama nazwa wskazuje zaczyna gwałtownie parować pochłaniając znaczne ilości ciepła i obniżając temperaturę. To właśnie chłodnica znajduje się na procesorze i schładza go do tak niskiej temperatury. Po opuszczeniu parownika freon już w postaci dosyć zimnego gazu powraca do kompresora chłodząc go i tu cykl zaczyna sie ponownie.
Ostatnia metoda to chłodzenie ciekłymi gazami, np. azotem. Dzieki tym metodom można swobodnie obniżyc temperature do -90C i wykonać naprawdę maksymalny Overclocking.
5. Bibliografia
Strony internetowe:
Książki:
„Sam naprawiam i rozbudowuje swój komputer PC” L.Śliwa i J. Pawelec
Czasopisma:
„ENTER”
„CHIP”
„Komputer Świat”
Technologia Hyper-Threading wymaga systemu z procesorem Intel® Pentium® 4 obsługującego technologię Hyper-Threading, chipsetu i
systemu BIOS, które wykorzystują tę technologię i systemu operacyjnego zoptymalizowanego pod kątem tej technologii
2