Pod adresem: http://www.tomshardware.com znajduje się znakomite źródło informacji na temat przetaktowywania. Oprócz różnych innych danych, zawarto na niej naprawdę szczegółowy zestaw pytań i odpowiedzi oraz cały czas powiększający się zbiór relacji użytkowników, którzy próbowali przetaktować swoje procesory (czasami bez powodzenia). Należy zwrócić uwagę na fakt, że wiele nowszych procesorów firmy Intel jest wyposażonych w blokadę mnożnika częstotliwości, który skutecznie uniemożliwia lub w pewnym stopniu zmniejsza możliwości przetaktowywania. Niestety, takie ograniczenie może być ominięte poprzez wykonanie prostej modyfikacji w konstrukcji procesora, co spowodowało, że wiele firm trudniących się podrabianiem procesorów sprzedaje je jako układy znakowane (już przetaktowane).
Pamięć podręczna (Cache)
Pomimo że wciąż zwiększano częstotliwości pracy rdzenia procesora, to jednak szybkości pamięci nie rosły w takim samym tempie. W jaki sposób sprawić, aby bez znacznego spadku ogólnej wydajności procesor, mógł pracować z większą szybkością niż pamięć, z której są przez niego pobierane dane? Odpowiedzią na to pytanie była pamięć Cache. Według najprostszej definicji pamięć podręczna (ang. Cache) jest buforem pracującym z dużą szybkością, w którym tymczasowo są przechowywane dane pobierane przez procesor, przez co mogą one być do niego przekazane o wiele szybciej niż miałoby to miejsce w przypadku pamięci operacyjnej. Poza pełnieniem roli prostego bufora pamięć Cache pełni jeszcze jedną funkcję, a mianowicie jest inteligentna. Pamięć podręczna jest buforem wyposażonym w „mózg".
W buforze są przechowywane przypadkowe dane zazwyczaj umieszczane w nim na zasadzie „pierwszy wchodzi — pierwszy wychodzi" (ang. first in.first out — FIFO). Poza tym pamięć Cache gromadzi dane, na które prawdopodobnie w najbliższym czasie zostanie zgłoszone zapotrzebowanie ze strony procesora. Tym sposobem procesor może cały czas pracować z pełną lub jej bliską szybkością bez konieczności czekania na dane, które są pobierane z wolniejszej pamięci operacyjnej. Pamięć podręczna zazwyczaj jest zbudowana z układów pamięci statycznej RAM (SRAM) zainstalowanych na płycie głównej lub zintegrowanych z procesorem.
► ► Zajrzyj do punktu „SDRAM" znajdującego się na stronie 535.
W najnowszych komputerach są stosowane dwa poziomy pamięci podręcznej procesora lub pamięci operacyjnej. Są to: Level 1 (LI) oraz Level 2 (L2). Niektóre procesory serwerowe, takie jak z serii Itanium firmy Intel, posiadają też pamięć Cache Level 3 (L3). Obydwa typy pamięci Cache oraz zasady ich działania zostaną omówione w dalszej części rozdziału.
Wewnętrzna pamięć Cache Level 1
Wszystkie nowsze procesory — począwszy od modelu 486 — są wyposażone w zintegrowaną pamięć Cache LI i kontroler. Pojemność zintegrowanej pamięci Cache LI w różnych procesorach jest inna i w oryginalnym modelu 486DX było to 8 kB, natomiast w ostatnich wersjach procesorów jest to 32 kB lub 64 kB.
Aby uświadomić sobie znaczenie pamięci podręcznej, konieczna jest znajomość względnej częstotliwości procesora i pamięci systemowej. Związany z tym problem polega na tym, że częstotliwość pracy procesora zwykle jest wyrażana w megahercach lub gigahercach (milionach lub miliardach cykli na sekundę), natomiast szybkość działania pamięci jest określana w nanosekundach (miliardowa część sekundy w ciągu cyklu). W przypadku większości nowszych typów pamięci ich szybkość jest wyrażana w MHz lub megabajtach na sekundę (MB/s) określających przepustowość pamięci.
Tak naprawdę, w obu przypadkach są to jednostki miary dotyczące czasu i częstotliwości, a ich porównanie zostało zawarte w tabeli 6.3 znajdującej się w rozdziale 6., „Pamięć". Na jej podstawie można stwierdzić, że szybkość procesora taktowanego zegarem 233 MHz odpowiada 4,3 nanosekundom, co oznacza, że aby umożliwić procesorowi o częstotliwości równej 200 MHz pracę bez opóźnień, konieczne by było zastosowanie pamięci operacyjnej o czasie dostępu wynoszącym 4 ns. Należy również zwrócić uwagę na to. że płyta główna współpracująca z procesorem taktowanym zegarem 233 MHz pracuje z częstotliwością 66 MHz, co odpowiada prędkości wynoszącej 15 ns/cykl, a zatem wiąże się z użyciem pamięci o czasie dostępu równym 15 ns. Ostatnia uwaga dotyczy pamięci operacyjnej o czasie dostępu równym 60 ns (powszechnie stosowanej w systemach klasy Pentium), która odpowiada prędkości zegara w przybliżeniu wynoszącej 16 MHz. A zatem, w standardowym systemie z procesorem Pentium, pracującym z częstotliwością 233 MHz (4,3 nanosekundy na cykl), znajduje się płyta główna taktowana zegarem 66 MHz (15 nanosekund na cykl) oraz pamięć operacyjna działająca z częstotliwością 16 MHz (60 nanosekund na cykl). Przytoczony przykład może wydawać się zdezaktualizowany, ale za chwilę przekonasz się, że podane w nim wartości ułatwiły mi wyjaśnienie zasad działania pamięci podręcznej.
Ze względu na fakt, że pamięć Cache LI jest zawsze wbudowana w procesor, jej szybkość jest równa częstotliwości pracy rdzenia procesora. Chcę przez to powiedzieć, że pamięć Cache jest taktowana wewnętrzną częstotliwością pracy procesora, a nie zegarem jego magistrali znajdującej się na płycie głównej. Tego typu pamięć podręczna stanowi obszar bardzo szybkiej pamięci zintegrowanej z procesorem i mającej za zadanie przechowywanie aktualnie przetwarzanego zestawu instrukcji i danych. Ze względu na pracę z pełną szybkością rdzenia procesora, dostęp do pamięci Cache nie wymaga ustawiania żadnych cykli oczekiwania.
Zastosowanie pamięci podręcznej zredukowało wpływ ogólnie znanego systemowego „wąskiego gardła" spowodowanego tym, że pamięć RAM jest o wiele wolniejsza od procesora. Różnica w wydajności pamięci i procesora w przypadku nowszych komputerów stała się wyjątkowo duża. Dzięki zastosowaniu pamięci podręcznej procesor nie jest zmuszony do czekania na instrukcje i dane przekazywane przez wolniejszą pamięć operacyjną, a tym samym zwiększa się wydajność systemu. Bez zastosowania pamięci podręcznej LI procesor byłby zmuszony do częstszego czekania na wczytanie danych z pamięci systemowej.
W nowoczesnych systemach pamięć Cache pełni nawet jeszcze ważniejszą rolę, ponieważ często jest jedynym typem pamięci w komputerze, która w pełni może być wykorzystana przez procesor. Większość nowszych typów procesorów opiera się na mnożniku częstotliwości, co oznacza, że są taktowane częstotliwością, która tak naprawdę jest wielokrotnością częstotliwości, z jaką pracuje płyta główna. Przykładowo, procesor Pentium 4 2,8 GHz pracuje z częstotliwością, która jest wynikiem pomnożenia rzeczywistej częstotliwości pracy płyty głównej równej 533 MHz przez wartość mnożnika wynoszącą 5,25. Pamięć główna pracuje z dwukrotnie mniejszą szybkością (266 MHz), ponieważ procesor Pentium 4 korzysta z magistrali pamięci działającej w trybie Quad Pumped. Ze względu na fakt występowania pamięci operacyjnej na płycie głównej może ona pracować tylko z szybkością 266 MHz. Jedyną pamięcią pracującą z pełną szybkością procesora wynoszącej 2,8 GHz jest zintegrowana z nim pamięć Cache LI i L2. W tym przypadku procesor Pentium 4 2,8 GHz jest wyposażony w 20 kB wbudowanej pamięci podręcznej LI (bufor danych 8 kB i bufor ETC o pojemności 12 kB) oraz 512 kB pamięci Cache L2 pracujących z pełną szybkością rdzenia procesora.
► ► Zajrzyj do punktu „Szybkość modułów pamięci" znajdującego się na stronie 564.
Jeśli żądane przez procesor dane znajdują się już w wewnętrznej pamięci podręcznej, wtedy nie musi on na nie czekać. Jeśli jednak tak nie jest, procesor musi je pobrać z pamięci Cache L2 lub za pośrednictwem magistrali systemowej (w mniej zaawansowanych rozwiązaniach), czyli bezpośrednio z pamięci operacyjnej.
Zasada działania pamięci podręcznej
Aby zrozumieć zasady działania pamięci Cache LI posłużymy się następującą analogią.
Historia dotyczy osoby (w tym przypadku Ciebie) pełniącej rolę procesora żądającego i przetwarzającego dane przekazane z pamięci, którymi są składniki przygotowanej dla Ciebie kolacji. Kuchnia, w której jest przygotowywany posiłek, jest pamięcią operacyjną RAM (SIMM lub DIMM). Kelner jest kontrolerem pamięci, natomiast pamięć Cache LI odpowiada stołowi, przy którym zasiądziesz.
Po tym krótkim wprowadzeniu, załóżmy, że odtąd każdego dnia o tej samej porze zaczynasz chodzić na kolacje do ulubionej restauracji. Po przyjściu i wybraniu stolika zamawiasz hot-doga. Dla nadania całej historii pewnej precyzji, założymy, że zwykle jesz w tempie jednego kęsa (bajta?) w ciągu czterech sekund (233 MHz odpowiada około 4 nanosekundom na cykl). Poza tym, czas przygotowania w kuchni każdego zamówionego przez Ciebie składnika dania wynosi 60 sekund (pamięć operacyjna o czasie dostępu równym 60 ns).
A zatem, gdy po raz pierwszy zasiadłeś przy stole i zamówiłeś hot-doga, zanim zacząłeś jeść, musiałeś poczekać na niego jeszcze 60 sekund. Po pojawieniu się kelnera z zamówionym daniem zaczynasz jeść swoim normalnym tempem. Po krótkiej chwili hot-doga już nie ma, a więc wzywasz kelnera i zamawiasz tym razem hamburger. Po upłynięciu kolejnych 60 sekund otrzymujesz hamburger, którego zjadasz tak szybko, jak tylko potrafisz. Po zjedzeniu hamburgera zamawiasz porcję frytek. Po minięciu kolejnej minuty otrzymujesz zamówione danie, które zjadasz równie szybko jak poprzednio. Wreszcie postanawiasz zakończyć posiłek i zamawiasz na deser sernik. Po upłynięciu kolejnych 60 sekund możesz przystąpić do spożycia sernika. Ogólne wrażenia wyniesione z pobytu w restauracji składają się głównie z czekania na zamówione dania i krótkich chwil związanych z szybkim ich spożywaniem.
Po dwukrotnym pojawieniu się w tej samej restauracji przez ostatnie dwa wieczory dokładnie o 18-tej i zamówieniu każdorazowo tego samego zestawu — dodatkowo w tej samej kolejności —już za trzecim razem kelner dochodzi do następującego wniosku: „Wiem, że ten klient pojawi się tutaj o 18-tej i zamówi hot-doga. hamburger, frytki i na końcu sernik. Może tym razem zrobię mu niespodziankę i przygotuję od razu wszystkie zamawiane przez niego dania, a wtedy otrzymam jakiś większy napiwek?". Tak też się stało, a więc gdy pojawiasz się w restauracji i zamawiasz hot-doga, okazuje się, że kelner natychmiast przynosi go bez konieczności czekania ani sekundy! Po zjedzeniu hot-doga już zamierzasz zamówić hamburgera i w tym momencie pojawia się kelner z hamburgerem na talerzu. Reszta kolacji przebiega w podobny sposób i w efekcie zjadasz wszystkie dania w normalnym tempie (jeden kęs co cztery sekundy) nie czekając przy tym na ich przygotowanie. Tym razem Twoje doświadczenia związane z ostatnią kolacją zawierają tylko chwile spożywania kolejnych dań bez żadnych wspomnień dotyczących czekania na ich przygotowanie. Jest to głównie zasługa kelnera, który wykazał się troską i domyślnością.
Powyższa analogia dokładnie odpowiada zasadom funkcjonowania pamięci Cache LI znajdującej się w procesorze. Pamięć podręczna LI jest stołem, na którym znajduje się jedno lub kilka dań. Bez obecności kelnera powierzchnia stołu pełni rolę prostego bufora zawierającego potrawy. Gdy jest on pełny, wtedy możesz jeść aż do momentu jego opróżnienia, ale zdaje się, że nikt się nie domyśli, aby na nim coś nowego postawić. Funkcję takiego kontrolera pamięci Cache pełni kelner, który wprowadza element inteligencji i podejmuje decyzje dotyczące rodzaju potraw, które powinny odpowiednio wcześniej — zanim o nie poprosisz — pojawić się na stole. Podobnie jak ma to miejsce w przypadku prawdziwego kontrolera pamięci Cache, również kelner wykorzystuje swoje doświadczenie w celu dosłownego odgadnięcia, jakie dania zostaną przez Ciebie zamówione jako następne. W sytuacji, gdy jego przypuszczenia okażą się trafne, nie będziesz zmuszony do dodatkowego czekania.
Załóżmy teraz, że za czwartym razem pojawiasz się w restauracji dokładnie o tej samej porze i tradycyjnie zamawiasz hot-doga. Kelner tym razem zupełnie pewny siebie czeka już z przygotowanym daniem, a więc nie musisz na nie czekać.
Po zjedzeniu hot-doga, kelner natychmiast pojawia się z hamburgerem na talerzu, na widok którego Ty mówisz: „Ojej, tak naprawdę teraz chciałbym tylko smażoną kiełbasę, a poza tym ja tego nie zamawiałem". Kelner się pomylił i w efekcie tym razem konieczne będzie poczekanie dodatkowej minuty na przygotowanie zamówionej kiełbasy. Taka sytuacja jest określana terminem chybienia (ang. Cache miss), w przypadku którego kontroler pamięci podręcznej przekazał do niej niewłaściwe dane, które miały być przekazane następnie do procesora. Rezultatem takiego chybienia jest dodatkowe oczekiwanie lub w przypadku prostego systemu opartego na procesorze Pentium 233 MHz obniżenie częstotliwości pracy do 16 MHz (czyli częstotliwości pamięci operacyjnej).
Według firmy Intel, w przypadku większości jej procesorów skuteczność pamięci Cache LI wynosi w przybliżeniu 90% trafień (niektóre procesory takie jak Pentium 4 osiągają jeszcze lepszy wynik). Oznacza to, że pamięć podręczna przez 90% czasu pracy otrzymuje właściwe dane i w konsekwencji przez identyczny okres czasu procesor pracuje z pełną szybkością, w tym przypadku wynoszącej 233 MHz. Przez pozostałe 10% czasu pracy, kontroler pamięci Cache się myli, wskutek czego procesor musi czekać na przekazanie danych ze znacznie wolniejszej pamięci operacyjnej. W takich sytuacjach następuje obniżenie częstotliwości pracy systemu do wartości, z jaką działa pamięć operacyjna, w tym wypadku wynosząca 60 ns lub 16 MHz.
W powyższej analogii przykładowy procesor był 14 razy szybszy niż pamięć operacyjna. W przypadku najnowszych komputerów częstotliwość pracy pamięci została zwiększona z początkowej 16 MHz (60 ns) do 333 MHz (3,0 ns) lub nawet wyższej, ale w tym samym czasie wzrosła również częstotliwość pracy procesorów do 3 GHz lub wyższej, wskutek czego w najnowszych rozwiązaniach zastosowana pamięć nadal jest 7,5 lub więcej razy WOLNIEJSZA od procesora. Pamięć podręczna pozwala zmniejszyć tę różnicę.
Główną cechą pamięci Cache LI było to, że zawsze była zintegrowana z rdzeniem procesora, przez co działała z tą samą co on szybkością. Uwzględnienie 90-procentowej lub wyższej skuteczności trafień sprawiło, że pamięć podręczna LI ma decydujący wpływ na wydajność systemu.
Pamięć Cache Level 2
W celu zmniejszenia znacznego spadku wydajności za każdym razem, gdy w pamięci podręcznej LI nastąpiło chybienie, zastosowano pamięć Cache L2.
Korzystając z analogii związanej z restauracją która została przytoczona celem wyjaśnienia zasad działania pamięci Cache LI, w tym miejscu przyrównam pamięć podręczną L2 do pojemnika wypełnionego dodatkowymi potrawami umieszczonego w odpowiednim miejscu restauracji. Dzięki niemu kelner może skrócić czas dostarczenia zamówionych potraw z 60 sekund — w przypadku dostarczania z kuchni — do jedynych 15 sekund. W przykładowym systemie klasy Pentium (gniazdo Socket 7), pamięć Cache L2 jest instalowana na płycie głównej, co oznacza, że pracuje z jej częstotliwością czyli 66 MHz lub inaczej 15 ns. Jeśli teraz zamówisz kolejne danie, którego kelner nie postawił jeszcze na stole, zamiast wykonywania po nie długiej wędrówki do kuchni (zajmującej kolejną minutę) najpierw sprawdzi zawartość pojemnika, w którym umieścił dodatkowe potrawy. Jeśli zamówione danie jest wśród nich, wtedy kelner wróci z powrotem w ciągu zaledwie 15 sekund. W przypadku rzeczywistego systemu, uzyskany efekt polega na tym, że zamiast obniżania częstotliwości z 233 MHz do 16 MHz — wynikającego z konieczności czekania na pobranie danych z pamięci operacyjnej o czasie dostępu wynoszącym 60 ns — dane mogą być wczytane z pamięci Cache L2 charakteryzującej się czasem dostępu równym 15 ns (66 MHz). Wynikiem tego jest zmniejszenie częstotliwości pracy systemu z 233 MHz do 66 MHz.
Nowsze typy procesorów są zintegrowane z pamięcią podręczną L2, która dzięki temu pracuje z szybkością jego rdzenia, a tym samym równie szybko jak pamięć Cache LI. Nawiązując do analogii z restauracją w celu znalezienia w niej odpowiednika dla zintegrowanej pamięci podręcznej L2, porównamy ją z pojemnikiem, który został postawiony przez kelnera bezpośrednio obok stołu, przy którym zasiadłeś. W tej sytuacji, jeśli zamówionej przez Ciebie potrawy nie ma aktualnie na stole (chybienie pamięci Cache LI), wtedy sięgnięcie po stojący obok pojemnik — czyli inaczej pamięci Cache L2 — zajmie dosłownie chwilę w porównaniu z koniecznością zajrzenia do kuchni (co zajmie przynajmniej 15 sekund), jak miało to miejsce w poprzednich przypadkach.
Wydajność i architektura pamięci podręcznej
Podobnie jak w przypadku pamięci Cache LI, większość typów pamięci Cache L2 charakteryzuje się podobną 90-procentową skutecznością trafień. A zatem, jeśli spojrzymy na system jako jedną całość, wtedy okaże się, że przez 90% czasu związanego z pobieraniem danych z pamięci podręcznej LI system pracuje z pełną częstotliwością procesora (w tym wypadku 233 MHz). Przez pozostałe 10% czasu związanego z odczytywaniem danych z pamięci Cache L2 następuje spadek wydajności. 90% procent czasu procesora jest związana z przetwarzaniem danych pobranych z pamięci podręcznej L2, natomiast pozostała część czasu jest poświęcona na odczytywanie danych z wolniejszej pamięci operacyjnej spowodowane chybieniami, które wystąpiły w pamięci Cache L2. Po połączeniu obydwu typów pamięci podręcznej okazuje się, że przykładowy system przez 90% czasu pracuje z pełną szybkością procesora (w tym przypadku 233 MHz), przez 9% czasu (90% z 10%) z szybkością płyty głównej (w tym przypadku 66 MHz), natomiast przez pozostały 1% czasu (10% z 10%) z szybkością pamięci RAM (w tym przypadku 16 MHz). W oczywisty sposób można zauważyć, jak istotną rolę odgrywają oba typy pamięci podręcznej. Bez nich system o wiele częściej używałby pamięci operacyjnej, która jest znacznie wolniejsza od procesora.
Można również dojść do innych interesujących wniosków. Jeśli mógłbyś sobie pozwolić na wydanie większej kwoty na podwojenie wydajności pamięci operacyjnej (RAM) lub pamięci Cache L2, którą z nich byś wybrał? Biorąc pod uwagę to, że pamięć operacyjna jest bezpośrednio wykorzystywana tylko przez około 1% czasu, jeśli dokonałbyś podwojenia jej wydajności, to w efekcie zwiększyłbyś dwukrotnie wydajność całego systemu tylko przez l% jego czasu pracy! Nie jest to na pewno spodziewany wzrost wydajności po poniesieniu sporych wydatków. Jeśli jednak zdecydowałbyś się podwoić wydajności pamięci Cache L2, w efekcie poprawiłbyś wydajność całego systemu stanowiącą 9% czasu jego pracy, a jednocześnie cechującą się większym wzrostem. Osobiście wolałbym zwiększyć wydajność pamięci podręcznej L2 niż pamięci RAM.
Projektanci procesorów i systemów pracujący w firmie Intel i AMD też są tego świadomi, dlatego opracowali metody mające na celu zwiększenie wydajności pamięci Cache L2. W systemach klasy Pentium (P5) pamięć podręczna L2 zazwyczaj była umieszczona na płycie głównej, a zatem musiała pracować z jej częstotliwością. Firma Intel poprzez przeniesienie pamięci Cache L2 z płyty głównej bezpośrednio do procesora wpłynęła na znaczny wzrost jej wydajności. Moduły pamięci podręcznej produkowanej przez firmę Intel były razem z układem procesora montowane w tej samej obudowie. Takie rozwiązanie okazało się zbyt kosztowne, dlatego też, począwszy od procesora Pentium II. firma Intel rozpoczęła montować moduły pamięci Cache L2 wytwarzane przez innych dostawców takich jak Sony. Toshiba, NEC, Samsung i innych. Ze względu na fakt. że tego typu układy pamięci podręcznej były dostarczane w zamkniętej obudowie, a nie w postaci samych płytek, firma Intel montowała je obok procesora na płytce drukowanej. Było to powodem zastosowania w procesorach Pentium II nowej obudowy w postaci kasety (ang. cartridge).
Pojawił się problem związany z szybkością dostarczanych przez innych producentów modułów pamięci podręcznej. Najszybsze dostępne na rynku pamięci Cache charakteryzowały się czasem dostępu równym 3 ns lub nawet mniejszym, co odpowiada częstotliwości wynoszącej 333 MHz lub wyższej. Ponieważ procesory były taktowane znacznie wyższymi częstotliwościami, z którymi ogólnie dostępne pamięci Cache L2 nie były w stanie pracować, w przypadku procesorów Pentium II i pierwszych modeli Pentium III firma Intel była zmuszona do taktowania ich z częstotliwością stanowiącą połowę szybkości procesora. Podobnie postąpiła firma AMD. która w niektórych modelach procesora Athlon była zmuszona do obniżenia szybkości pamięci Cache L2 nawet do 2/5 lub 1/3 częstotliwości pracy procesora. Było to spowodowane koniecznością utrzymania częstotliwości pamięci podręcznej L2 poniżej 333 MHz, ponieważ na tyle pozwalały moduły ogólnie dostępne na rynku.
W późniejszym okresie nastąpił technologiczny przełom, który po raz pierwszy został wykorzystany w procesorze Celeron 300A i droższych modelach. Zastosowano w nich pamięć Cache L2 o pojemności 128 kB, ale nie znajdowała się na płytce drukowanej procesora. Podobnie jak w przypadku pamięci Cache LI została ona zintegrowana bezpośrednio z rdzeniem procesora. W konsekwencji, zarówno pamięć Cache LI, jaki i L2 pracowały teraz z częstotliwością procesora i co istotniejsze ich szybkość w przyszłości mogła rosnąć równomiernie wraz ze wzrostem szybkości procesorów. W nowszych modelach procesora Pentium III jak również w przypadku wszystkich modeli procesorów Xeon i Celeron, pamięć podręczna L2 działa z pełną szybkością rdzenia, co oznacza, że wskutek chybienia, które nastąpiło w pamięci Cache LI, nie dochodzi do spadku wydajności lub czekania na dane. Firma AMD w swoich nowszych modelach procesorów Athlon i Duron również zastosowała zintegrowaną pamięć podręczną pracującą z pełną szybkością rdzenia. Zastosowanie zintegrowanej pamięci podręcznej powoduje znaczny wzrost wydajności, ponieważ przez 9% czasu pracy procesora związanego z wymianą danych z pamięcią Cache L2 operacja ta odbywa się teraz z jej pełną szybkością, a nie dopiero po obniżeniu jej do połowy lub nawet mniejszej wartości, a co gorsza do częstotliwości pracy płyty głównej wyposażonej w gniazdo Socket 7. Kolejną korzyścią wynikającą z zastosowania zintegrowanej pamięci podręcznej L2 jest jej koszt, który, ze względu na użycie mniejszej ilości części, jest niższy.
Powróćmy do analogii związanej z restauracją, stosując ją w przypadku procesora Pentium 4 taktowanego zegarem 2 GHz. Teraz jeden kęs następowałby co pół sekundy (2 GHz = 0,5 ns w ciągu cyklu). Ponieważ pamięć Cache LI działałaby również z taką częstotliwością, dlatego mógłbyś zjeść dowolną potrawę znajdującą się na stole w tym samym tempie (stół odpowiada pamięci Cache LI). Prawdziwy przyrost wydajności nastąpi jednak w momencie, gdy zapragniesz potrawy, której nie ma na stole (chybienie pamięci Cache LI). W takim wypadku kelner zajrzy do pojemnika (który jest postawiony obok stołu) i, powiedzmy, że na dziewięć z dziesięciu prób uda mu się znaleźć w nim żądaną potrawę w czasie równym pół sekundy (prędkość pamięci podręcznej L2 = 2 GHz lub 0,5 ns w ciągu cyklu). W przypadku tego typu systemu przez 99% czasu będzie on pracował z częstotliwością 2 GHz (po zsumowaniu skuteczności trafień pamięci Cache LI i L2) i z szybkością pamięci operacyjnej (czas oczekiwania na przygotowanie dania w kuchni) przez pozostały 1% czasu pracy procesora. Jeśli zostanie zastosowana szybsza pamięć pracująca z częstotliwością 400 MHz (2,5 ns), wtedy będzie to odpowiadało czasowi oczekiwania na przygotowanie dania w kuchni wynoszącemu tylko 2,5 sekundy. Oby tylko wydajność restauracji zwiększyła się w takim stopniu, jak to miało miejsce w przypadku procesora!
Budowa pamięci podręcznej
Jak zapewne wiesz, w pamięci podręcznej przechowywane są kopie danych pochodzących z różnych obszarów pamięci głównej. Ponieważ pamięć Cache nie jest w stanie jednocześnie pomieścić danych pobranych ze wszystkich obszarów pamięci RAM, konieczne było określenie metody pozwalającej stwierdzić, spod jakich adresów pamięci głównej pochodzą umieszczone w danej chwili w buforze dane. Dzięki niej po pojawieniu się zapotrzebowania na dane znajdujące się pod określonymi adresami mogą zostać pobrane z pamięci Cache zamiast z pamięci RAM. Metoda obsługiwana jest przez układy dodatkowej pamięci tag RAM. Znajdują się one w pamięci Cache i przechowują indeks adresów, spod których przekopiowano dane do bufora. Każdemu wierszowi pamięci Cache odpowiada znacznik zawierający adres pamięci głównej, spod którego pobrano dane umieszczone w danej chwili w określonym wierszu. Jeśli wymagane są dane znajdujące się pod określonym adresem pamięci RAM, kontroler pamięci Cache może — przeszukując szybko znaczniki adresów — stwierdzić, czy żądane dane znajdują się aktualnie w buforze (trafienie), czy też nie (chybienie). Jeżeli dane zostaną znalezione, można je wczytać z szybszej pamięci Cache. W przeciwnym razie konieczne będzie pobranie ich ze znacznie wolniejszej pamięci głównej.
Na sposób pracy pamięci Cache mają wpływ różne metody organizacji lub odwzorowywania znaczników. Ze względu na sposób odwzorowywania można wyróżnić pamięć Cache bezpośrednio mapowaną (direct-mapped cache), w pełni asocjacyjną (fully associative cache) lub częściowo asocjacyjną (set associative cache).
Gdy w przypadku w pełni asocjacyjnej pamięci Cache pojawi się żądanie pobrania danych spod określonego adresu pamięci RAM, adres porównywany jest z zawartością wszystkich znaczników zawartych w układzie tag RAM bufora. Jeśli żądany adres pamięci głównej zostanie znaleziony w znaczniku (trafienie), uzyska się odpowiednią lokalizację danych w pamięci Cache. W przeciwnym razie wystąpi chybienie i dane będą musiały — zamiast z pamięci podręcznej — zostać pobrane spod adresu pamięci RAM.
W przypadku bezpośrednio mapowanej pamięci Cache wybrane adresy pamięci głównej są wcześniej przypisywane określonym lokalizacjom wierszy bufora, w których będą przechowywane. A zatem układ Tag RAM może korzystać z mniejszej liczby bitów, ponieważ gdy znany jest żądany adres pamięci głównej, konieczne będzie sprawdzenie tylko jednego znacznika. Ponadto każdy znacznik musi przechowywać tylko takie adresy, które określony wiersz może zawierać. Dzięki temu wzrasta wydajność, jako że dla określonego adresu pamięci musi zostać sprawdzony tylko jeden znacznik.
Częściowo asocjacyjna pamięć Cache jest zmodyfikowaną wersją bezpośrednio mapowanej pamięci podręcznej. Tego typu pamięć posiada tylko jeden blok przypisań pamięci. Oznacza to, że określony adres pamięci może być przypisany lub odwzorowany tylko na wybraną lokalizację wiersza pamięci Cache. 2-ścieżkowa asocjacyjna pamięć podręczna posiada dwa bloki, dlatego określony adres pamięci może znajdować się w jednej z dwóch lokalizacji. Z kolei 4-ścieżkowa asocjacyjna pamięć podręczna może przechowywać określony adres pamięci w czterech różnych lokalizacjach lub blokach wiersza bufora. Wzrost stopnia asocjacji bloków zwiększa szanse odszukania wartości. Jednak zajmie to trochę więcej czasu, ponieważ przy szukaniu w pamięci podręcznej określonej lokalizacji sprawdzona musi zostać większa liczba znaczników. W zasadzie każdy blok n-ścieżkowej pamięci asocjacyjnej spełnia funkcję bufora podrzędnego powiązanego z każdym adresem pamięci głównej. Wraz ze wzrostem liczby bloków lub buforów podrzędnych ostatecznie pamięć podręczna stanie się w pełni asocjacyjną. W takiej sytuacji każdy adres pamięci może być przechowywany w dowolnej lokalizacji wiersza pamięci Cache. n-ścieżkowa acocjacyjna pamięć podręczna stanowi kompromis między w pełni asocjacyjną i bezpośrednio mapowaną pamięcią Cache.
Zwykle bezpośrednio mapowana pamięć podręczna pozwala najszybciej zlokalizować i pobrać z niej dane. Wynika to stąd. że dla określonego adresu pamięci tego typu bufor musi poszukać tylko jednego konkretnego znacznika. Jednak w porównaniu z innymi typami pamięci Cache w przypadku tej pamięci występuje więcej chybień. Najwyższy współczynnik trafień posiada w pełni asocjacyjna pamięć podręczna. Ze względu na to, że tego typu bufor musi przeszukać znacznie więcej znaczników, lokalizowanie i pobieranie danych trwa jednak najdłużej, n-ścieżkowa asocjacyjna pamięć podręczna stanowi kompromis między optymalną szybkością bufora i współczynnikiem trafień. Mimo to zwiększanie stopnia asocjacji wymaga zastosowania większej liczby układów sprzętowych (układy tag RAM, obwody komparatora itp.), co podnosi koszt pamięci Cache. Oczywiście architektura pamięci podręcznej jest szeregiem kompromisów. To, co sprawdza się najlepiej w jednym przypadku, może już nie wypaść tak dobrze w innym. Środowiska wielozadaniowe, takie jak system Windows, są dobrym przykładem środowisk, w których procesor musi jednocześnie korzystać z różnych obszarów pamięci, dlatego n-ścieżkowa pamięć podręczna może zwiększyć ich wydajność.
W przypadku pamięci podręcznej stosowanej w procesorach 486 i Pentium MMX jej budowa była określana terminem 4-ścieżkowej pamięci asocjacyjnej (four-way set associative cache), co oznaczało, że taka pamięć została podzielona na cztery bloki, z których każdy składa się z 128 lub 256 wierszy o pojemności 16 bajtów. W poniższej tabeli przedstawiono stopień asocjacji pamięci Cache LI i L2 stosowanych w różnych procesorach.
Procesor |
Asocjacja pamięci LI |
Asocjacja pamięci L2 |
486 |
4-ścieżkowa |
Brak pamięci w procesorze |
Pentium (bez instrukcji MMX) |
2-ścieżkowa |
Brak pamięci w procesorze |
Pentium MMX |
4-ścieżkowa |
Brak pamięci w procesorze |
Pentium Pro/II/III |
4-ścieżkowa |
4-ścieżkowa (poza rdzeniem) |
Pentium 111/4 |
4-ścieżkowa |
8-ścieżkowa (zintegrowana ze rdzeniem) |
W celu zagwarantowania, że procesor przetwarza aktualny zestaw danych, zawartość pamięci podręcznej zawsze musi być zsynchronizowana z zawartością pamięci operacyjnej. Z tego też powodu wewnętrzna pamięć podręczna wykorzystywana w procesorach 486 pracowała w trybie write-through. Tryb pracy write-through oznacza, że w momencie, gdy procesor pobiera dane z pamięci podręcznej, jednocześnie są one również usuwane z pamięci operacyjnej.
Dla porównania, procesor Pentium i nowsze modele były wyposażone w wewnętrzną pamięć podręczną pracującą w trybie write-back, co oznacza, że zarówno operacje odczytu, jak i zapisu są buforowane, przez co jest zwiększana ogólna wydajność. Nawet pomimo to, że wewnętrzna pamięć podręczna stosowana w procesorach 486 pracowała w trybie write-through, system w celu zwiększenia wydajności mógł wykorzystywać zewnętrzną pamięć Cache pracującą w trybie write-back. Ponadto procesor 486 potrafił przed właściwą operacją zapisu danych w pamięci RAM zbuforować do 4 bajtów danych, przez co w sytuacji, gdy pamięć operacyjna była zajęta, następował wzrost wydajności.
Kolejna funkcja poszerzonej architektury pamięci podręcznej określana jest terminem nonblocking. Jest to metoda redukcji lub ukrywania opóźnień pamięci polegająca na wykorzystaniu powtarzających się operacji procesora związanych z dostępem do danych. Pamięć podręczna posiadająca funkcję nonblocking umożliwia kontynuowanie wykonywania programu równocześnie z występującymi chybieniami tak długo, aż nie zostaną zaobserwowane związane z nią ograniczenia. Mówiąc inaczej, pamięć podręczna może sobie o wiele lepiej poradzić z chybieniem i umożliwić procesorowi wykonywanie operacji niezależnej od danych z tym trafieniem związanych.
Kontroler pamięci podręcznej, wbudowany w procesor, w przypadku zastosowania procesorów nadrzędnych (ang. bus masters) będących pod kontrolą systemu jest również odpowiedzialny za sprawowanie nadzoru nad magistralą pamięci. Tego typu operacja nadzoru magistrali nosi nazwę nasłuchu magistrali (ang. bus snooping). Jeśli urządzenie współpracujące z magistralą nadrzędną dokonuje operacji zapisu danych w obszarze pamięci, które aktualnie znajdują się również w pamięci podręcznej procesora, wtedy zawartość obu pamięci przestaje być spójna. Kontroler pamięci podręcznej oznacza wtedy takie dane jako nieważne i w trakcie następnej operacji dostępu do pamięci ponownie wprowadza dane do pamięci Cache, dzięki czemu zapobiega naruszeniu integralności systemu.
W przypadku wszystkich architektur procesorów przeznaczonych dla komputerów PC korzystających z pamięci podręcznej obecny jest bufor translacji adresowej TLB (translation lookaside buffer). Jego zadaniem jest usprawnianie procesu przywracania po wystąpieniu chybień w pamięci Cache. Bufor TLB jest tabelą znajdującą się w procesorze, przechowującą informacje na temat lokalizacji ostatnio używanych adresów I pamięci. Bufor TLB przyspiesza translację adresów wirtualnych na fizyczne adresy pamięci. Aby zwiększyć | wydajność bufora, w kilku nowszych procesorach zwiększono liczbę jego wpisów. Postąpiła tak firma AMD przy przechodzeniu w przypadku procesora Athlon z rdzenia Thunderbird na rdzeń Palomino. Układy Pentium 4 wyposażone w technologię hiperwątkowości dla każdego watka wirtualnego procesora posiadają oddzielną instrukcję TLB (iTLB).
^ ^ Zajrzyj do punktu „Technologia hiperwątkowości", znajdującego się na stronie 119.
Wraz ze wzrostem częstotliwości zegara następuje obniżenie czasu trwania cyklu. W nowszych systemach pamięć podręczna nie jest już instalowana na płytach głównych, ponieważ są stosowane szybsze typy pamięci takie jak DDR-SDRAM lub RDRAM współpracujące z procesorami Pentium 4, Celeron lub Athlon, które mogą pracować z częstotliwością płyty głównej. W przypadku wszystkich nowszych typów procesorów pamięć Cache L2. podobnie jak pamięć Cache LI, jest z nimi zintegrowana. Ze względu na fakt, że jest ona częścią rdzenia procesora, może pracować z jego szybkością. Szybkość pamięci Cache zawsze jest bardziej istotnym parametrem niż jej pojemność. Ogólna zasada mówi, że mniej pojemna, ale za to szybsza pamięć podręczna jest lepsza niż pamięć wolniejsza o większej pojemności. W tabeli 3.16 przedstawiono szybkości i zastosowanie pamięci Cache LI i L2 wykorzystywanej w nowoczesnych systemach.
Jak można zauważyć, zastosowanie dwupoziomowej pamięci podręcznej znajdującej się pomiędzy bardzo szybkim procesorem i wolną pamięcią operacyjną pozwala zminimalizować wszelkie cykle oczekiwania, na które w przeciwnym razie procesor musiałby się natknąć. Uzyskane korzyści są szczególnie widoczne w przypadku procesora ze zintegrowaną pamięcią Cache L2, w którym możliwa jest ciągła praca z częstotliwością bliskąjego częstotliwości rzeczywistej.
Funkcje procesorów
Wraz z wprowadzaniem do sprzedaży kolejnych procesorów ich architektura jest wciąż poszerzana o nowe możliwości mające na celu poprawienie różnych aspektów począwszy od wydajności w określonego typu aplikacjach, a skończywszy na stabilności procesora jako całości. W następnych kilku punktach przyjrzymy się wybranym technologiom takim jak SMM (System Management Mode\ Superscalar Execution, MMX, SSE, 3DNow! i HT Technology.
Tabela 3.16. Porównanie szybkości procesorów z szybkościami pamęci Cache, RAM i płyty głównej
Typ procesora |
Pentium |
Pentium Pro |
Pentium II |
AMD K6-2 |
Częstotliwość procesora |
233 MHz |
200 MHz |
450 MHz |
550 MHz |
Czas dostępu pamięci Cache LI |
4,3 ns (233 MHz) |
5,0 ns (200 MHz) |
2,2 ns (450 MHz) |
1,8 ns (550 MHz) |
Pojemność pamięci Cache LI |
16 kB |
32 kB |
32 kB |
64 kB |
Typ pamięci Cache L2 |
Umieszczona na płycie głównej. |
Umieszczona na płytce drukowanej |
Umieszczona na płytce drukowanej |
Umieszczona na płycie głównej. |
Dzielnik szybkości pamięci Cache L2 |
2/7 |
1/1 |
1/2 |
2/11 |
Czas dostępu pamięci Cache L2 |
15 ns (66 MHz) |
5 ns (200 MHz) |
4,4 ns (225 MHz) |
10 ns (100 MHz) |
Pojemność pamięci Cache L2 |
Zmienna1 |
256 kB2 |
512kB |
Zmienna1 |
Częstotliwość magistrali procesora |
66 MHz |
66 MHz |
100 MHz |
100 MHz |
Częstotliwość magistrali pamięci |
60 ns (16 MHz) |
60 ns (16 MHz) |
10 ns (100 MHz) |
10 ns (100 MHz) |
1 Pamięć podręczna znajduje się na płycie głównej, a jej pojemność jest zależna od typu zastosowanej płyty i ilości modułów.
SMM (Zarządzanie energią)
Firma Intel, kierując się głównie dążeniem do wprowadzania do sprzedaży coraz szybszych i wydajniejszych procesorów przeznaczonych dla komputerów przenośnych, opracowała układ odpowiedzialny za zarządzanie energią. Układ pozwala procesorom oszczędzać zużycie energii, a tym samym przedłużać żywotność baterii. Rozwiązanie to zostało początkowo zastosowane w procesorze Intel 486 SL, który jest rozszerzoną wersją procesora 486DX. W późniejszym okresie funkcje związane z zarządzaniem energią stały się w większym stopniu uniwersalne i zostały wykorzystane we wszystkich procesorach Pentium (o częstotliwości 75 MHz i większej) i nowszych układach. Zestaw takich funkcji jest określany skrótem SMM, który wywodzi się od słów system management mode (tryb zarządzania systemem).
Układ SMM jest fizycznie zintegrowany z procesorem, ale w celu kontrolowania, w oparciu o poziom aktywności procesora, zużytej przez niego energii funkcjonuje niezależnie. Układ SMM umożliwia użytkownikowi określenie przedziałów czasu, po upłynięciu których nastąpi częściowe lub całkowite odcięcie zasilania procesora. Obsługiwana jest również funkcja Suspend/Resume (wstrzymania/ponowienia), która pozwala na natychmiastowe przywrócenie lub odcięcie zasilania. Funkcja ta jest wykorzystywana głównie w komputerach przenośnych. Ustawienia związane z zarządzaniem energii są zwykle kontrolowane za pośrednictwem systemu BIOS.
Wykonywanie superskalarne
Procesory Pentium piątej generacji i nowsze są wyposażone w potoki pozwalające na jednoczesne przetwarzanie wielu instrukcji. Procesor 486 i wszystkie poprzednie modele były w stanie wykonywać jednocześnie tylko jedną instrukcję. Firma Intel określa możliwość przetwarzania w tym samym czasie więcej niż jednej instrukcji mianem technologii superskalarnej (ang. superscalar). Technologia ta wpływa na wzrost wydajności.
^ Zajrzyj do punktu „Procesory Pentium" znajdującego się na stronie 171.
AMD K6-3 |
Pentium III |
Athlon XP |
Athlon 64 |
Pentium 4 |
450 MHz |
1,4 GHz |
2,2 GHz |
2,4 GHz |
4,0 GHz |
2,2 ns (450 MHz) |
0,71 ns (1,4 GHz) |
0,45 ns (2,2 GHz) |
0,42 ns (2,4 GHz) |
0,25 ns (4,0 GHz) |
64 kB |
32 kB |
128 kB |
128 kB |
128 kB |
Umieszczona w procesorze. |
Umieszczona w procesorze |
Umieszczona w procesorze |
Umieszczona w procesorze |
Umieszczona w procesorze |
1/1 |
1/1 |
1/1 |
1/1 |
1/1 |
2,2 ns (450 MHz) |
0,71 ns (1,4 GHz) |
0,45 ns (2,2 GHz) |
0,42 ns (2,4 GHz) |
0,25 ns (4,0 GHz) |
256 kB |
512 kB |
512kB |
1024 kB |
1024 kB |
100 MHz |
133 MHz |
400 MHz |
400 MHz |
800 MHz |
10 ns (100 MHz) |
7,5 ns (133 MHz) |
2,5 ns (400 MHz) |
2,5 ns (400 MHz) |
2,5 ns (400 MHz)3 |
1 Procesor Pentium Pro byl również dostępny w wersjach z pamięcią Cache L2 o pojemności 512 kB lub 1024 kB.
3 Pamięć dwukanalowa korzysta jednocześnie z chvóch banków, dzięki czemu podwajana jest przepustowość.
Architektura superskalarna zwykle jest kojarzona z komputerami wyposażonymi w procesory RISC (ang. Redu-ced [nstruction Set Computer — komputer o zredukowanej liście instrukcji). Procesor RISC posiada prostszy zestaw instrukcji, których dodatkowo jest mniej. Chociaż każda taka instrukcja powoduje wykonanie mniejszej liczby czynności, to jednak ogólna szybkość pracy może być wyższa, co tym samym zazwyczaj oznacza większą wydajność. Procesor Pentium jest jednym z pierwszych układów o architekturze CISC (ang. Comple.x [nstruction Set Computer — komputer o pełnej liście instrukcji) uważanej za superskalarna. Procesory CISC posiadają bogatszy zestaw bardziej złożonych instrukcji charakteryzujący się większymi możliwościami. Jako przykład, załóżmy, że chcesz nauczyć robota wkręcania żarówki. Przy użyciu instrukcji CISC wyglądałoby to następująco:
Podnieś żarówkę.
Włóż ją do oprawki.
Obracaj zgodnie z ruchem wskazówek zegara aż do wyczucia oporu.
Zastosowanie instrukcji RISC będzie się wiązało z większą ilością wierszy:
Opuść rękę.
Chwyć żarówkę.
Podnieś rękę.
Włóż żarówkę do oprawki.
Obróć ją tylko raz zgodnie z ruchem wskazówek zegara.
Sprawdź, czy żarówka jest wkręcona mocno? Jeśli nie, powtórz krok 5.
Koniec.
Przeważnie do wykonania określonego zadania jest wymagana większa ilość instrukcji RISC, ponieważ każda z nich jest prostsza (zredukowana) i obejmuje mniej operacji. Ich zaletą jest mniejsza całkowita ilość poleceń, które robot (lub procesor) musi wykonać i są one szybciej wykonywane, a tym samym w wielu przypadkach całkowite zadanie (lub program) również jest realizowane szybciej. Trwa debata, w której próbuje się ustalić, która z obu architektur jest lepsza, ale tak naprawdę nie ma czegoś takiego jak procesor zbudowany w architekturze tylko RISC lub tylko CISC. Wszystko jest zależne od zastosowanej definicji, w której umiejscowienie rozgraniczenia obu architektur jest ustalane w sposób arbitralny.
Procesory firmy Intel oraz kompatybilne są uważane za układy o architekturze CISC, chociaż w przypadku piątej i szóstej generacji można zauważyć elementy architektury RISC i wewnętrzny rozbiór instrukcji CISC na odpowiadające im instrukcje RISC.
MMX
Skrót MMX, zależnie od tego, kogo o to się zapyta, swoje początki bierze od słów multimedia extensions (rozszerzenie multimedialne) lub matrix math extensions (rozszerzenie o operacje macierzowe). Firma Intel oficjalnie potwierdza, że właściwie nie jest to żaden skrót i nie odpowiada niczemu innemu poza trzema literami MMX (brak wymogu tworzenia skrótu od istniejącego terminu mógł być konieczny w celu uznania go za znak handlowy), ale prawdopodobnie został stworzony przez pracowników firmy na podstawie jednego z wymienionych terminów. Rozszerzenie MMX zostało zastosowane w ostatnich modelach procesorów Pentium piątej generacji jako swoistego rodzaju dodatek zwiększający wydajność takich operacji jak kompresja i dekompresja plików wideo, przetwarzanie grafiki, szyfrowanie, operacje wejścia-wyjścia wykorzystywanych w różnego typu aplikacjach dostępnych w sprzedaży.
MMX wykorzystuje dwa usprawnienia architektury procesora. Pierwsze z nich jest bardzo proste, mianowicie wszystkie procesory wyposażone w rozszerzenie MMX posiadają wewnętrzną pamięć Cache LI o większej pojemności niż ich zwykle odpowiedniki. Wynikiem tego jest poprawa wydajności dowolnego uruchomionego programu, niezależnie od tego, czy wykorzystuje on nowe instrukcje MMX.
Druga innowacja związana z rozszerzeniem MMX polega na poszerzeniu zestawu instrukcji procesora o 57 nowych rozkazów lub instrukcji oraz o nową funkcję oferowaną przez instrukcje MMX określaną terminem SIMD (ang. single instruction, multiple data —jedna instrukcja, wiele danych).
Najnowsze aplikacje multimedialne i komunikacyjne często wykonują wielokrotnie te same pętle, które, mimo że stanowią 10% lub mniej całego przetwarzanego kodu programu, to jednak mogą zajmować do 90% całkowitego czasu jego działania. Funkcja SIMD umożliwia wykonywanie przez jedną instrukcję tej samej funkcji przetwarzającej wiele różnych danych w sposób podobny do tego, w jaki nauczyciel — zamiast zwracać się indywidualnie do każdego ucznia—jednocześnie prosi ich wszystkich o zajęcie swoich miejsc. Funkcja SIMD pozwala zredukować ilość pętli wykorzystywanych powszechnie w aplikacjach zajmujących się przetwarzaniem animacji, grafiki, dźwięku i obrazu wideo znacznie obciążających procesor.
Firma Intel dodała również 57 nowych instrukcji specjalnie przeznaczonych do bardziej wydajnego przetwarzania obrazu wideo, dźwięku i grafiki. Instrukcje te są wyjątkowo zorientowane na wykonywanie w trybie równoległym i częste powtarzanie sekwencji (ang. highly parallel), co jest typową sytuacją w aplikacjach multimedialnych. Termin highly parallel odnosi się do sytuacji, w której operacja przetwarzania — tak jak w przypadku obróbki zdjęcia —jest wykonywana na wielu danych. Główna wada technologii MMX wynikała stąd, że nowe instrukcje przetwarzały tylko liczby całkowite i wspomagały się koprocesorem, wskutek czego w sytuacji, gdy konieczne było wykonanie operacji na liczbach zmiennoprzecinkowych tracony był dodatkowy czas. Ta niedogodność została usunięta w kolejnej wersji MMX zarówno przez firmę Intel, jak i AMD.
Firma Intel udzieliła licencji na swoją rozszerzenie MMX konkurentom takim jak AMD i Cyrix, dlatego też, dodając do nich rozszerzenie MMX, mogli oni zaktualizować swoje procesory kompatybilne z produktami Intela.
SSE, SSE2 i SSE3
W lutym 1999 r. firma Intel wprowadziła na rynek procesor Pentium III z poszerzoną wersją MMX o nazwie SSE (ang. Streaming SIMD Extensions). Do momentu premiery procesora nowe rozszerzenie było również określane nazwą KNI (ang. Katmai New Instructions), ponieważ początkowo zostało ono dołączone do procesora Katmai, który, zanim stał się procesorem Pentium III, nosił taką właśnie nazwę kodową. Procesory Celeron 533A i jego nowsze modele oparte na rdzeniu procesora Pentium III również wykorzystywały instrukcje SSE. Starsze modele procesora Pentium II i Celeron 533 wraz z jego tańszymi wersjami (opartymi na rdzeniu procesora Pentium II) nie dysponowały rozszerzeniem SSE.
Rozszerzenie SSE różniło się od MMX tym, że zawierało 70 nowych instrukcji służących do przetwarzania grafiki i dźwięku. SSE jest podobne do rozszerzenia MMX. Tak naprawdę, oprócz nazwy KNI, było również przez niektórych jeszcze przed wprowadzeniem do sprzedaży określane jako MMX-2. Poza tym, że dodano więcej instrukcji, podobnych znanych z MMX, SSE zostało opracowane z myślą o operacjach wykonywanych na liczbach zmiennoprzecinkowych i w tym celu wykorzystuje oddzielny moduł znajdujący się w procesorze. Dzięki niemu nie jest konieczne stosowanie standardowego koprocesora, co miało miejsce w przypadku instrukcji MMX.
Rozszerzenie SSE2 zostało zaprezentowane w listopadzie 2000 r. wraz z pojawieniem się procesora Pentium 4. Zawiera 144 dodatkowe instrukcje SIMD. Poza tym SSE2 dysponuje wszystkimi poprzednimi instrukcjami MMX i SSE.
Rozszerzenie SSE3 pojawiło się w lutym 2004 r. wraz z procesorem Pentium 4 opartym na rdzeniu Prescott. Oferuje 13 nowych instrukcji SIMD usprawniających złożone obliczenia matematyczne i graficzne, a także kodowanie wideo i synchronizację wątków. Rozszerzenie SSE3 zawiera też wszystkie instrukcje poprzednich technologii, takich jak MMX, SSE i SSE2.
Rozszerzenie SSE2 zawiera nowe instrukcje, włączając w to instrukcje zmiennoprzecinkowe SIMD, dodatkowe instrukcje całkowitoliczbowe SIMD oraz instrukcje umożliwiające kontrolowanie pamięci podręcznej. Do niektórych aplikacji, które korzystają z rozszerzenia SSE2, należą: zaawansowane przetwarzanie obrazu i grafiki trójwymiarowej, transmisja obrazu i dźwięku w trybie strumieniowym (odtwarzanie płyt DVD) oraz rozpoznawanie mowy. Wśród korzyści płynących z zastosowania SSE można wymienić:
wyższą rozdzielczość i jakość obrazów przeglądanych oraz przetwarzanych za pomocą aplikacji graficznych,
wysokiej jakości dźwięk i obraz wideo w formacie MPEG2 oraz możliwość jednoczesnego kodowania i dekodowania plików MPEG2 wykorzystywanych w aplikacjach multimedialnych,
zmniejszone obciążenie procesora, jak również większą dokładność i krótszy czas odpowiedzi w przypadku stosowania aplikacji służących do rozpoznawania mowy.
Instrukcje SSE i SSE2 są szczególnie przydatne w przypadku dekodowania plików zapisanych w formacie MPEG2, który jest standardem wykorzystywanym przy produkcji płyt DVD. Procesory wyposażone w rozszerzenie SSE powinny być w stanie wykonywać dekodowanie plików w formacie MPEG2 z pełną prędkością bez konieczności zastosowania dodatkowej karty dekodera sprzętowego MPEG2. W przypadku wykorzystywania aplikacji służących do rozpoznawania mowy tego typu procesory w porównaniu ze starszymi modelami są o wiele lepsze i szybsze.
Jedną z głównych korzyści wynikających z zastosowania SSE, w porównaniu z rozszerzeniem MMX, jest brak zmiennoprzecinkowych operacji SIMD o pojedynczej dokładności, które były powodem spadku wydajności w przypadku przetwarzania grafiki trójwymiarowej. Podobnie jak w przypadku MMX, nowe instrukcje SIMD pozwalają w czasie wykonywania przez procesor pojedynczej instrukcji przetwarzać wiele operacji. Ściśle mówiąc, rozszerzenie SSE umożliwia wykonanie w ciągu jednego cyklu maksymalnie czterech operacji zmiennoprzecinkowych. Oznacza to, że pojedyncza instrukcja może jednocześnie przetwarzać cztery różne bloki danych. Instrukcje zmiennoprzecinkowe SSE mogą współpracować z instrukcjami MMX bez zauważalnego spadku wydajności. Rozszerzenie SSE jest również wyposażone w mechanizm wczytywania danych z wyprzedzeniem (ang. prefetching), który polega na wprowadzaniu danych do pamięci podręcznej, zanim nastąpi żądanie ich odczytu.
Należy zauważyć, że aby wykorzystać możliwości oferowane przez dowolną instrukcję SSE, używane oprogramowanie musi ją obsługiwać, a zatem należy poszukać aplikacji z zaimplementowaną obsługą SSE. Większość producentów tworzących najnowsze aplikacje służące do przetwarzania grafiki i dźwięku dodało do nich obsługę rozszerzenia SSE, dzięki czemu można wykorzystać zalety nowego rozwiązania. Przykładem zaawansowanej aplikacji wykorzystującej instrukcje SSE służącej do obróbki grafiki jest program Adobe Photoshop. Dzięki tej aplikacji uruchomionej w systemach z procesorem oferującym SSE można uzyskać jeszcze lepszą wydajność. Firma Microsoft zaimplementowała obsługę SSE w kolejnej wersji DirectX 6.1. Ponadto rozwijane są najnowsze sterowniki kart graficznych i dźwiękowych, które zostały dołączone do najnowszych wersji systemów operacyjnych takich jak Windows 98 Second Edition, Windows Me, Windows NT 4.0 (z zainstalowanym pakietem Service Pack 5 lub nowszym), Windows 2000 i XP.
SSE jest rozszerzeniem MMX, SSE2 — rozszerzeniem SSE, natomiast SSE3 — rozszerzeniem SSE3. A zatem procesory obsługujące instrukcje SSE3 również wykorzystują instrukcje SSE2. Układy z rozszerzeniem SSE2 zgodne są też z instrukcjami SSE, a procesory z technologią SSE obsługują oryginalne instrukcje MMX. Oznacza to, że aplikacje z zaimplementowaną obsługą rozszerzenia MMX uruchomione w procesorze oferującym, poza MMX, dodatkowe instrukcje i tak ich nie wykorzystają.
3DNow!, Enhanced 3DNow! i 3DNow! Professional
3DNow! jest odpowiedzią firmy AMD na rozszerzenie SSE zastosowane w procesorach firmy Intel. Właściwie rozwiązanie to pojawiło się już w procesorach K6, które zostały wprowadzone do sprzedaży, zanim firma Intel zaprezentowała procesor Pentium III z rozszerzeniem SSE. W późniejszym okresie firma AMD dodała do procesorów Athlon i Duron nowe rozwiązanie o nazwie Enhanced 3DNow!. Najnowsza technologia 3DNow! Professional została zastosowana w pierwszych modelach procesora Athlon XP. AMD zakupiło od firmy Intel licencję na MMX, dlatego też wszystkie modele z serii K6, Athlon, Duron i nowsze typy procesorów w pełni je wykorzystywały. Ze względu na fakt, że firma AMD nie zamierzała nabyć licencji na rozszerzenie SSE opracowane przez Intela, jako pierwsza zaprojektowała odmienny (w porównaniu z MMX) zestaw instrukcji o nazwie 3DNow!. Zarówno 3DNow! zastosowane w maju 1998 r. w procesorze K.6-2, jak i jego ulepszona wersja Enhanced 3DNow!, która została wykorzystana we wprowadzonym do sprzedaży w czerwcu 1999 r. w procesorze Athlon, są zestawami instrukcji poszerzającymi multimedialne możliwości procesorów firmy AMD, które pojawiły się już po zastosowaniu MMX. Nowe rozszerzenia zwiększają wydajność aplikacji multimedialnych oraz służących do przetwarzania grafiki trójwymiarowej i wykonywania innych operacji intensywnie wykorzystujących koprocesor.
3DNow! jest zestawem 21 instrukcji wykorzystujących operacje SIMD, które zamiast pojedynczych elementów przetwarzają tablice danych. Enhanced 3DNow! w porównaniu z rozszerzeniem 3DNow! zawiera dodatkowo 24 instrukcje (19 instrukcji SSE i 5 instrukcji wykorzystywanych w komunikacji i cyfrowym przetwarzaniu sygnałów), co daje w sumie 45 nowych instrukcji. Traktowane jako ulepszenie rozszerzenia MMX jest podobne do rozszerzenia SSE zastosowanego przez firmę Intel w procesorach Pentium III i Celeron. Według firmy AMD rozszerzenie 3DNow!, porównywane z MMX, w przybliżeniu prezentuje ten sam poziom rozwoju co SSE, z tym. że osiągnięto to przy wykorzystaniu mniejszej ilości instrukcji cechujących się większą prostotą. Chociaż oba rozwiązania oferują podobne możliwości, to jednak wykorzystują odmienny zestaw instrukcji, dlatego też oprogramowanie stworzone z myślą o wykorzystaniu SSE nie obsługuje rozszerzenia 3DNow! i vice versa. Najnowsza wersja technologii 3DNow! o nazwie 3DNow! Professional poszerza rozszerzenie 3DNow! Enhanced o 51 instrukcji SSE. Oznacza to, że aktualnie technologia 3DNow! Professional obsługuje wszystkie instrukcje SSE, czyli właściwie układy firmy AMD dysponują możliwościami technologii SSE. Niestety instrukcje SSE2 zostały przez firmę AMD umieszczone tylko w 64-bitowych procesorach, takich jak Athlon 64, 64 FX i Opteron.
Podobnie jak w przypadku SSE, 3DNow! oferuje również zmiennoprzecinkowe instrukcje SIMD o pojedynczej dokładności i pozwala na wykonanie w ciągu cyklu maksymalnie czterech operacji zmiennoprzecinkowych. Instrukcje zastosowane w 3DNow! mogą współpracować z instrukcjami MMX bez wystąpienia zauważalnego spadku wydajności. Ponadto rozszerzenie 3DNow! umożliwia wczytywanie danych z wyprzedzeniem.
Podobnie jak w przypadku SSE, obsługa 3DNow! jest powszechnie zaimplementowana w oprogramowaniu takim jak Windows 9x, Windows NT 4.0 i we wszystkich nowszych wersjach systemu firmy Microsoft. Jeśli dysponuje się procesorem Athlon XP lub Athlon 64, wymóg obsługi technologii 3DNow! nie jest już tak istotny, ponieważ układy te dzięki technologii 3DNow! Professional są obecnie w pełni zgodne z rozszerzeniem SSE.
Dynamie Execution (Dynamiczne wykonywanie)
Zastosowane po raz pierwszy w procesorach P6 szóstej generacji dynamiczne wykonywanie (ang. dynamie execution) umożliwia równoległe wykonywanie przez procesor większej ilości instrukcji, wskutek czego zadania są kończone w znacznie krótszym czasie. To innowacyjne rozwiązanie składa się z trzech następujących elementów:
Przewidywanie z uwzględnieniem wielu rozgałęzień (ang. multiple branchprediction) — przy użyciu kilku rozgałęzień przewiduje sposób wykonania programu.
Analiza przepływu danych (ang. dala flow analysis) — niezależnie od kolejności kolejkowania.
w oryginalnym programie, instrukcji gotowych do wykonania, planuje kolejność ich przetworzenia.
♦ Wykonywanie spekulatywne (ang. speculative execution) — na podstawie wcześniejszego sprawdzenia licznika programu i oceny prawdopodobieństwa wykorzystania instrukcji zwiększa szybkość ich przetwarzania.
Przewidywanie rozgałęzień
Przewidywanie rozgałęzień (ang. branch prediction) jest właściwością wcześniej wykorzystywaną tylko w procesorach drogich komputerów przemysłowych. Pozwala ona procesorowi na utrzymywanie pełnej zawartości potoku instrukcji przy pracy z dużą prędkością. Specjalna jednostka pobierająca i dekodująca dane procesora wykorzystuje wysoko zoptymalizowany algorytm przewidywania rozgałęzień służący do przewidywania kierunku lub wyniku uzyskanego po wykonaniu instrukcji wykonywanych na wielu poziomach rozgałęzień, wywołań i wartości zwracanych. Jego działanie jest podobne do działań podejmowanych przez szachistę, który w trakcie gry, przewidując kilka kolejnych ruchów przeciwnika, opracowuje różne strategie, którymi może się posłużyć. Przewidując wynik działania instrukcji, można spowodować, że będą one wykonywane natychmiastowo.
Analiza przepływu danych
Analiza przepływu danych dotycząca przepływu danych przez procesor ma na celu określenie szans wykonania instrukcji ustawionych w kolejności niezależnej od oryginalnego kodu. Specjalna jednostka szeregująco-wykonawcza procesora monitoruje wiele instrukcji i może je wykonać w takiej kolejności, która, w przypadku zastosowania wielu jednostek zajmujących się przetwarzaniem superskalarnym, jest optymalna. Ustawiona kolejność wykonywania instrukcji może spowodować, że jednostki wykonawcze będą nadal zajęte nawet wtedy, gdy chybienie pamięci podręcznej oraz innego typu instrukcje operujące na danych mogłyby wstrzymać cały proces.
Wykonywanie spekulatywne
Wykonywanie spekulatywne jest zdolnością procesora do wykonania instrukcji, zanim licznik programu osiągnie odpowiednią wartość. Jednostka szeregująco-wykonawcza procesora, w celu wykonania wszystkich dostępnych w puli instrukcji, wykorzystuje analizę przepływu danych, a następnie zapisuje wyniki w rejestrach tymczasowych. Jednostka wycofująca szuka następnie w puli instrukcji wykonanych, od których nie jest uzależnione wykonanie innych instrukcji lub takich, wobec których algorytm przewidywania rozgałęzień nie był skuteczny. Jeśli żadna wykonana instrukcja nie zostanie odnaleziona, wtedy wyniki są zapisywane w pamięci przez jednostkę wycofującą lub odpowiedzialny za tę operację inny element standardowej architektury procesorów Intel w takiej kolejności, w jakiej zostały do niej przekazane. Następnie takie instrukcje są wycofywane z puli.
Dynamiczne wykonywanie instrukcji właściwie powoduje usunięcie ograniczeń i powiązań z liniowym kolejkowaniem instrukcji. Zastosowanie niezależnej kolejności wykonywania instrukcji może spowodować, że jednostki przetwarzające, zamiast czekać na pobranie danych z pamięci, będą cały czas aktywne. Chociaż wykonanie instrukcji może zostać przewidziane lub zrealizowane w sposób nieuporządkowany, to jednak wyniki są zapisywane w pierwotnej kolejności, co zapobiega przerwaniu lub modyfikacji wykonywanego programu. W ten sposób procesory P6 są w stanie wykonywać programy oparte na istniejącej już architekturze procesorów Intel dokładnie tak samo jak w przypadku procesorów P5 (Pentium) i starszych modeli, z tą różnicą, że o wiele szybciej!
Architektura DIB
Architektura DIB (ang. Dual Independent Bus Architecture — architektura dwóch niezależnych magistral) została po raz pierwszy zastosowana w procesorach szóstej generacji zarówno firmy Intel, jak i AMD. Została opracowana w celu zwiększenia przepustowości i wydajności magistrali procesora. Zastosowanie dwóch niezależnych magistral danych wejścia-wyjścia (I/O) pozwala procesorowi, zamiast na pojedynczy odczyt sekwencyjny (jak w przypadku systemu zjedna magistralą), na jednoczesny i równoległy dostęp do danych obu magistral. Pierwsza i podstawowa magistrala procesora (często określana terminem front-side) stanowi interfejs pomiędzy procesorem a płytą główną lub jej chipsetem. Druga magistrala (back-side) procesora pracującego w architekturze DIB współpracuje z pamięcią Cache L2, dzięki czemu może ona pracować ze znacznie wyższą szybkością niż miałoby to miejsce w przypadku wykorzystania podstawowej magistrali procesora.
Dwie magistrale tworzące architekturę DIB — magistrala pamięci podręcznej L2 i główna magistrala procesora, często są określane skrótem FSB (ang. front-side bus). Procesory klasy P6 począwszy od modelu Pentium Pro, a skończywszy na procesorach Celeron, Pentium II/III/4 oraz Athlon/Duron mogą jednocześnie korzystać z obu magistral, eliminując tym samym związane z nimi „wąskie gardło". Architektura podwójnej magistrali pozwala obecnej w nowszych typach procesorów zintegrowanej z rdzeniem pamięci Cache L2 pracującej z jego pełną szybkością na wykorzystanie niezależnej magistrali, dzięki czemu odciążona magistrala podstawowa (FSB) może zająć się normalną obsługą danych wchodzących i wychodzących z procesora. Magistrale pracują z różną częstotliwością. Magistrala główna FSB jest taktowana częstotliwością płyty głównej, natomiast magistrala back-side współpracująca z pamięcią Cache L2 używa częstotliwości pracy rdzenia procesora. Wraz ze wzrostem częstotliwości procesora zwiększa się częstotliwość pracy pamięci podręcznej L2.
Elementem decydującym o zastosowaniu architektury DIB było przeniesienie pamięci Cache L2 z płyty głównej do procesora. Pamięć Cache LI zawsze stanowiła jego integralną część, natomiast pamięć Cache L2 ze względu na swoje rozmiary początkowo musiała być umieszczona poza nim. Po przeniesieniu pamięci podręcznej L2 do procesora mogła pracować z podobną częstotliwością co pamięć Cache LI i o wiele szybciej niż płyta główna lub magistrala procesora.
Architektura DIB pozwala również magistrali systemowej na wykonywanie wielu jednoczesnych transakcji (zamiast sekwencyjnie wykonywanych pojedynczych transakcji), a tym samym umożliwia przyspieszenie przepływu informacji w systemie, poprawiając ogólną wydajność. Podsumowując, architektura DIB, w porównaniu z architekturą opartą na jednej magistrali, oferuje do trzech razy wyższą przepustowość.
Technologia hiperwątkowości
Komputery z dwoma lub większą liczbą procesorów oraz systemem operacyjnym obsługującym wiele układów, takim jak Windows NT 4.0/2000/XP Professional lub Linux, od dawna pod względem wydajności przewyższały systemy jednoprocesorowe. Jednak płyty i komputery dwuprocesorowe zawsze były droższe od porównywalnych rozwiązań jednoprocesorowych. Wyposażenie komputera obsługującego dwa procesory w drugi układ może nie być łatwe, ponieważ wymagane jest dopasowanie obu procesorów pod względem szybkości i parametrów. Nowa technologia hiperwątkowości (Hyper-Threading Technology) opracowana przez firmę Intel umożliwia jednemu procesorowi obsługiwanie w tym samym czasie dwóch niezależnych zestawów instrukcji. Zasadniczo technologia HT zamienia jeden fizyczny układ w dwa wirtualne procesory.
Początkowo (marzec 2002 r.) technologia hiperwątkowości została przez Intela zastosowana w jego procesorach z serii Xeon, przeznaczonych dla serwerów. Technologia HT sprawia, że systemy wieloprocesorowe mogą zachowywać się tak, jakby były wyposażone w dwukrotnie większą liczbę układów. Technologia ta została użyta w procesorach Xeon (magistrala systemowa o częstotliwości 533 MHz) stworzonych z myślą o wydajnych stacjach roboczych, a następnie — w listopadzie 2002 r. — w procesorach Pentium 4 o szybkości 3,06 GHz, stosowanych w komputerach PC. Technologia hiperwątkowości jest też obecna we wszystkich procesorach Pentium 4 współpracujących z magistralą systemową o szybkości 800 MHz (częstotliwości od 2,4 do 3,4 GHz).
Zasada działania technologii
Wewnątrz procesor zgodny z technologią HT posiada dwa zestawy uniwersalnych rejestrów, rejestrów sterujących i innych komponentów architektury. Jednak oba wirtualne procesory współużytkują tę samą pamięć Cache, jednostki wykonawcze i magistrale. W trakcie pracy każdy wirtualny procesor obsługuje pojedynczy wątek (rysunek 3.2).
Rysunek 3.2.
Procesor
z technologią HT
jest w stanie
wykorzystać
czas bezczynności
na realizowanie
drugiego procesu,
dzięki czemu możliwe
jest usprawnienie
wielozadaniowości
i zwiększenie
wydajności
wiel owątkowej
aplikacji
Choć współużytkowanie określonych komponentów procesora oznacza, że ogólna szybkość komputera z technologią HT nie jest tak duża, jak systemu z dwoma fizycznymi układami, po uruchomieniu wielu aplikacji lub jednej wielowątkowej możliwe jest uzyskanie przyrostu szybkości rzędu 25% lub więcej.
Wymagania technologii HT
Pierwszym procesorem Intela z technologią hiperwątkowości był Pentium 4 o szybkości 3,06 GHz. Wszystkie układy Pentium 4 o tej i wyższej częstotliwości obsługują technologię HT. Podobnie jest w przypadku wszystkich modeli procesorów o częstotliwości 2,4 GHz i wyższej, korzystających z magistrali o szybkości 800 MHz. Jednak sam procesor Pentium 4 wyposażony w technologię HT nie jest w stanie udostępnić komputerowi jej zalet. W tym celu konieczne jest spełnienie następujących wymagań:
Zgodnaptyta główna (chipset). Może być wymagana aktualizacja BIOS.
BIOS umożliwiający włączenie lub wyłączenie technologii HT. Jeśli system operacyjny nie obsługuje tej technologii, powinno się ją wyłączyć.
Zgodny system operacyjny, taki jak Windows XP w wersji Home lub Professional. Po włączeniu technologii hiperwątkowości w tego typu systemach w menedżerze urządzeń będą widoczne dwa procesory.
Nowsze chipsety Intela przeznaczone dla procesorów Pentium 4 obsługują technologię hiperwątkowości. Szczegółowe informacje na ten temat zawarto w rozdziale 4. Jeśli jednak płyta główna lub komputer zostały wyprodukowane przed pojawieniem się technologii HT, to — aby było możliwe ich użycie — konieczne będzie uzyskanie aktualizacji BIOS-u od producenta płyty lub komputera. Choć system Windows NT 4.0 i Windows 2000 zaprojektowano z myślą o obsłudze wielu fizycznych układów, to aby technologia HT mogła w nich poprawnie funkcjonować, konieczne jest wykonanie w systemie operacyjnym określonych optymalizacji. Technologia HT obsługiwana jest też przez dystrybucje Linuksa oparte na jądrze w wersji 2.4.18 lub nowszej.
Wytwarzanie procesorów
Procesory są produkowane głównie z krzemu, który jest drugim najczęściej występującym pierwiastkiem na Ziemi (tylko tlen występuje w większych ilościach). Chociaż krzem jest podstawowym składnikiem piaszczystych plaż, to jednak w takiej postaci nie jest wystarczająco czysty, aby mógł być stosowany do produkcji procesorów.
To, w jaki sposób krzem jest zamieniany do postaci procesora jest długotrwałym procesem. Rozpoczyna się od działań określanych mianem metody Czohralskiego (wywodzącej się od nazwiska wynalazcy procesu) i polegających na „hodowli" kryształów zawierających czysty krzem. W metodzie tej za pomocą elektrycznych pieców łukowych jest dokonywana zamiana surowców (głównie wydobywanych w kopalniach kwarcu) do postaci wytopionego krzemu. Następnie, w celu usunięcia pozostałych zanieczyszczeń, krzem jest zamieniany do postaci płynnej, destylowany, a następnie przyjmuje postać prętów z osadzonym półprzewodnikiem, który jest w czysty 99,999999%. Pręty są następnie mechanicznie rozbijane do postaci odkuwek i umieszczane w kwarcowych tyglach, które są wstawiane do elektrycznych pieców służących do „wyciągania" monokryształów. Krzemowe odkuwki są topione w temperaturze przekraczającej 1400 °C. Aby uniknąć deformacji kryształów, piece są zwykle montowane na bardzo grubych betonowych blokach. Dodatkowo, w celu wyeliminowania drgań, które mogłyby uszkodzić formowany kryształ, są podwieszane.
Po roztopieniu krzemu jest do niego wkładany niewielki słupek i wolno obracany (rysunek 3.3). Po wyjęciu słupka z roztopionego krzemu, część krzemu na nim pozostaje i krzepnie, tworząc kryształ. Dzięki precyzyjnej kontroli prędkości wyciągania (10-40 mm na godzinę) oraz temperatury (w przybliżeniu 1400 °C), kryształ rozpoczyna formowanie od wąskiej szyjki, a następnie powiększa się aż do osiągnięcia żądanej średnicy. W zależności od typu produkowanego procesora każdy wlewek ma 200 lub 300 milimetrów średnicy, ponad 1,5 metra długości i waży kilkadziesiąt kilogramów
.Rysunek 3.3.
Wzrost czystego wlewka krzemu w piecu, w którym panuje wysoka temperatura i ciśnienie
Wlewek jest następnie szlifowany do postaci idealnego cylindra o średnicy 200 lub 300 milimetrów. Po jego jednej stronie jest wykonywane niewielkie płaskie nacięcie służące do zachowania dokładności i ułatwienia dalszej obróbki. Każdy wlewek jest następnie cięty bardzo precyzyjną diamentową piłą na ponad tysiąc okrągłych płytek, z których każda jest grubości nie przekraczającej jednego milimetra (rysunek 3.4). Każda taka płytka jest następnie polerowana do osiągnięcia powierzchni podobnej do tej, jaką ma lustro.
Rysunek 3.4.
Cięcie diamentową piłą krzemowego wlewka na płytki — wafle
Procesory są wytwarzane z wafli w procesie zwanym fotolitografią. W trakcie procesu fotolitografii w półprzewodniku są tworzone tranzystory i ścieżki, co polega na nakładaniu kolejnych — wykonanych z różnego materiału — oddzielonych od siebie warstw. W momencie, gdy przetną się dwa określone obwody można utworzyć przełącznik lub tranzystor.
Proces fotolitografii rozpoczyna się w momencie, gdy w wyniku przeprowadzonego procesu naparowywania próżniowego warstwa izolacyjna wykonana z dwutlenku krzemu pojawi się na waflu. Następnie nakładana jest powłoka wykonana z emulsji światłoczułej, po czym za pośrednictwem maski na światłoczułą powierzchnię jest rzucana struktura procesora.
Domieszkowanie jest terminem służącym do opisania chemicznego procesu dodawania do krzemu (który oczywiście nie jest przewodnikiem) zanieczyszczeń, w wyniku którego powstaje materiał o właściwościach półprzewodnika. Naświetlarka stosuje specjalnie wykonaną maskę, która właściwie jest negatywem warstwy procesora wytrawionego w chromowej lub kwarcowej płytce. Nowsze typy procesorów składają się z ponad 20 nałożonych i częściowo wytrawionych (każda warstwa wymaga zastosowania maski) warstw materiału oraz z sześciu lub więcej warstw zawierających metalowe połączenia.
Po przejściu światła przez maskę jest ono skupiane na powierzchni wafla, dzięki czemu następuje naświetlenie materiału fotolitograficznego obrazem struktury procesora. Każdy taki obraz jest określany mianem płytki (ang. die). Urządzenie o nazwie stepper przesuwa następnie wafel o niewielką odległość, a ta sama maska dokonuje odbicia kolejnej płytki procesora sąsiadującej z poprzednio wykonanym. Po zapełnieniu powierzchni całego wafla warstwą materiału i emulsji światłoczułej, za pomocą żrącego roztworu są wypłukiwane miejsca, w których światło naświetliło emulsję światłoczułą i pozostawiło odbity obraz pojedynczych płytek zawierających ścieżki i elementy elektroniczne. W dalszej kolejności jest nakładana na wafel następna warstwa materiału półprzewodnika z większą ilością emulsji światłoczułej na wierzchu, po czym za pomocą maski jest naświetlana i trawiona kolejna warstwa obwodów. Przy użyciu tej metody, warstwy i komponenty każdego procesora są kolejno nakładane na wierzch poprzedniej warstwy, co jest powtarzane aż do zakończenia tworzenia całego procesora.
Niektóre maski mają za zadanie dodanie warstw metalicznych (ang. metallization), które tworzą metalowe połączenia występujące pomiędzy tranzystorami i pozostałymi elementami. W większości procesorów do wykonywania takich połączeń stosuje się aluminium, chociaż w roku 2002 w wielu z nich zastosowano miedź. Pierwszym ogólnie dostępnym procesorem przeznaczonym dla komputerów PC i wykorzystującym miedź był, wykonany w technologii 0,18 mikrona, Athlon wyprodukowany w fabryce firmy AMD znajdującej się w Dreźnie. Firma Intel po raz pierwszy zastosowała miedź w procesorze Pentium 4 (nazwa kodowa Northwood) opartym na technologii 0,13 mikrona (rysunek 3.5). Miedź jest lepszym przewodnikiem niż aluminium, a ponadto pozwala uzyskać połączenia o obniżonych rozmiarach i rezystancji, co oznacza, że dzięki niej można produkować mniejsze i szybsze procesory. Powody, dla których miedź do tej pory nie była stosowana, były związane z trudnościami w usunięciu w procesie produkcyjnym korozji elementów z niej wykonanych, co w przypadku aluminium nie było aż tak skomplikowane. W chwili obecnej tego typu problemy zostały rozwiązane i na pewno będzie wytwarzanych coraz więcej procesorów wykorzystujących połączenia wykonane z miedzi.
Rysunek 3.5.
Wafel o średnicy 200 mm zawierający płytki procesorów Pentium 4 wykonane w technologii 0,13 mikrona
W procesorach Pentium III I Celeron o nazwie kodowej Coppermine — wykonanych w technologii T^i 0,18 mikrona — wbrew temu, co uważa większość osób, zastosowano połączenia aluminiowe, a nie miedziane. W rzeczywistości nazwa kodowa tych procesorów nie ma nic wspólnego z metalem.
Wywodzi się ona od nazwy rzeki Coppermine River położonej na północno-zachodnim obszarze Kanady. Firma Intel przez długi okres czasu miała skłonność do stosowania nazw kodowych wywodzących się od nazw rzek (a czasami form geologicznych), a zwłaszcza tych położonych w północno-zachodnich rejonach Ameryki Północnej. Przykładowo, starszy model procesora Pentium III (wykonanego w technologii 0,25 mikrona) miał nazwę kodową Katmai wywodzącą się od nazwy rzeki na Alasce. Nazwy kodowe stosowane przez firmę Intel brzmią podobnie jak kolejne miejsca na trasie pokonywanej przez entuzjastów spływu nurtem spienionej rzeki — Deerfield, Foster, Northwood, Tualatin, Gallatin, McKinley i Madison, które są nazwami rzek położonych w stanach: Oregon, Kalifornia, Alaska, Montana, a w przypadku rzeki Deerfield — Massachusetts i Vermont.
Na gotowym waflu w kształcie kola znajduje się tyle odbitych płytek procesorów, ile jest w stanie się na nim pomieścić. Ze względu na fakt, że każdy procesor jest zazwyczaj w kształcie kwadratu lub prostokąta, na powierzchni wafla — w pobliżu jego krawędzi — znajdują się niewykorzystane obszary. Pomimo to, za wszelką cenę dąży się do zagospodarowania każdego milimetra kwadratowego powierzchni wafla.
W branży półprzewodników zajmującej się produkcją procesorów zaszło kilka zmian. Obowiązująca tendencja opiera się na stosowaniu jak największych wafli i technologii wytwarzania jak najmniejszych płytek procesorów. Pojęcie technologii jest związane z wymiarem i odległością poszczególnych obwodów i tranzystorów procesora. Pod koniec 2001 r. i na początku 2002 r. rozpoczęto wytwarzanie płytek procesorów w technologii 0,13 mikrona (zamiast 0.18). Ponadto metalowe połączenia zaczęto wykonywać zamiast z aluminium z miedzi, natomiast średnica wafli została zwiększona z 200 do 300 milimetrów. Tylko same wafle o większej średnicy wynoszącej 300 mm (w porównaniu z poprzednio stosowanymi o średnicy 200 mm) pozwalały na wytwarzanie blisko dwukrotnie większej ilości procesorów. Nowsza technologia 0,13 mikrona pozwala na wyższy stopień upakowania tranzystorów na płytce procesora, przy zachowaniu rozsądnych rozmiarów i dających wystarczający zysk. Oznacza to, że tendencja zmierzająca do integrowania z procesorem pamięci podręcznej o coraz większej pojemności będzie w dalszym ciągu kontynuowana, natomiast około roku 2010 liczba zastosowanych tranzystorów w jednym procesorze osiągnie miliard lub nawet więcej.
Aby posłużyć się przykładem pokazującym, jaki może mieć to wpływ na określony typ procesora, przyjrzyjmy się procesorowi Pentium 4. Średnica standardowego wafla wykorzystywanego przez wiele lat przez, producentów półprzewodników do produkcji procesorów wynosiła 200 mm. Dawało to wafel o polu powierzchni równym około 31 416 mm2. Pierwsza wersja procesora Pentium 4 z rdzeniem Willamette opartym na technologii 0,18 mikrona wykorzystywała aluminiowe połączenia. Poza tym, pole powierzchni płytki procesora wynosiło 217 mm2. Pentium 4 składał się z 42 milionów tranzystorów i był wykonany z wafla o średnicy 200 mm, a zatem mogło się na nim zmieścić maksymalnie 145 płytek tego typu procesorów.
Nowsze procesory Pentium 4 oparte na rdzeniu Northwood wytwarzane są w technologii 0,13 mikrona. W przypadku tych procesorów miedziane połączenia znajdują się na płytce o powierzchni 131 mm2, zawierającej 55 milionów tranzystorów. W porównaniu z rdzeniem Willamette rdzeń Northwood zintegrowany jest z pamięcią Cache L2 o podwójnej pojemności wynoszącej 512 kB. Z tego właśnie powodu tak znacznie zwiększyła się liczba tranzystorów. Nawet przy większej ich liczbie zastosowanie technologii 0,13 mikrona pozwoliło uzyskać płytkę ponad 60% mniejszą. Dzięki temu na identycznym waflu o średnicy 200 mm zawierającym tylko 145 płytek rdzenia Willamette mogło się pomieścić do 240 płytek rdzenia Northwood.
Począwszy od roku 2002 firma Intel rozpoczęła produkcję rdzenia Northwood przy wykorzystaniu wafla o średnicy 300 mm, którego pole powierzchni wynosiło 70 686 mm2. Pole powierzchni tego typu wafli, w porównaniu z ich mniejszą wersją o średnicy 200 mm, było 2,25 razy większe, dzięki czemu z jednego wafla można było uzyskać ponad dwukrotnie większą ilość procesorów. W przypadku procesora Pentium 4 z rdzeniem Northwood na waflu o średnicy 300 mieściło się maksymalnie 540 płytek procesorów. Po połączeniu technologii wytwarzania płytek o mniejszych rozmiarach z waflem o większej średnicy produkcja procesora Pentium 4 od momentu, gdy został po raz pierwszy zaprezentowany, wzrosła więcej niż 3,7 raza. Jest to jedyny powód, dla którego nowsze typy procesorów, w porównaniu ze starszymi modelami, są coraz tańsze i pojawiają się w większych ilościach.
W 2004 r. w branży rozpoczęto przechodzenie na technologię 0,09 mikrona (90 nanometrów), umożliwiającą wytwarzanie jeszcze mniejszych i szybszych układów. W 2007 r. można spodziewać się przejścia na technologię 0,065 mikrona (65 nanometrów), a w 2010 r. pojawi się technologia 0,045 mikrona (45 nanometrów). Efektem takiego postępu technologicznego będzie możliwość wyprodukowania w 2010 r. procesorów zawierających miliard tranzystorów! Nadal będą one wytwarzane z wafla o średnicy 300 mm, ponieważ następny przełom w tej technologii jest planowany nie wcześniej niż w 2013 r., gdy prawdopodobnie zostaną zastosowane wafle o średnicy 450 mm. W tabeli 3.17 zebrano kolejne zmiany technologii wytwarzania procesorów.
Tabela 3.17. Minione, aktualne i przyszłe zmiany technologii wytwarzania procesorów
Data: |
1989 |
1991 |
1993 |
1995 |
1997 |
1999 |
2001 |
2004 |
2007 |
2010 |
2013 |
2016 |
Technologia (mikrony): |
1,0 |
0,8 |
0,5 |
0,35 |
0,25 |
0,18 |
0,13 |
0,09 |
0,065 |
0,045 |
0,032 |
0,022 |
Technologia (nanometry): |
1000 |
800 |
500 |
350 |
250 |
180 |
130 |
90 |
65 |
45 |
32 |
22 |
Należy zauważyć, że nie wszystkie procesory znajdujące się na waflu będą wykonane prawidłowo, szczególnie wtedy, gdy uruchamiana jest linia produkcyjna. W miarę doskonalenia technologii wytwarzania określonego typu procesora lub linii produkcyjnej coraz więcej procesorów będzie wykonana poprawnie. Współczynnik określający stosunek poprawnie wykonanych do nieudanych procesorów znajdujących się na waflu nosi nazwę uzysku (ang. yield). Chociaż uzysk o wartości sporo poniżej 50% jest normalnym wynikiem w przypadku, gdy jest uruchamiana produkcja nowego procesora, to już przy końcu jego wytwarzania wartość ta przeważnie wzrasta do 90%. Większość producentów procesorów nie ujawnia osiąganych wartości uzysku i utrzymuje tego typu informacje w ścisłej tajemnicy, ponieważ dla konkurencji stanowiłyby sporą wartość. Niski poziom uzysku w konsekwencji powoduje, w przeliczeniu na jeden procesor, podniesienie kosztu produkcji oraz opóźnienia w dostawach partii zamówionych przez odbiorców. Jeśli producent procesorów zdobędzie informacje na temat coraz lepszych wartości uzysku konkurencji, w efekcie może tak dostosować cenę i plan produkcyjny, aby w krytycznym momencie uzyskać wyższy udział na rynku.
Po zakończeniu wypełniania wafla płytkami procesorów, specjalne urządzenie sprawdza każdą z nich i celem późniejszego odrzucenia oznacza wadliwe egzemplarze. Procesory są następnie wycinane z wafla przy użyciu lasera wysokiej mocy lub piły diamentowej.
Po zakończeniu operacji wycinania, płytki procesorów są ponownie testowane, zamykane w obudowie i jeszcze raz sprawdzane. Operacja zamykania procesora w obudowie jest określana również terminem spajania (ang bonding). Wynika to stąd, że płytka jest umieszczana na podstawce, na której następnie specjalne urządzenie dokonuje połączenia cienkimi złotymi przewodami płytki z końcówkami znajdującymi się w obudowie. Płytka procesora jest zamknięta w obudowie, której zadaniem jest szczelne oddzielanie jej od środowiska zewnętrznego.
Po wykonaniu połączeń i zamknięciu płytki w obudowie realizowana jest ostateczna faza testów mająca na celu sprawdzenie poprawności działania procesora, jak i określenie częstotliwości jego pracy. Procesory pochodzące z tej samej partii często pracują z różnymi szybkościami. Specjalnie przeznaczone do tego urządzenia poddają każdy procesor testom sprawdzającym poprawność pracy przy różnych ciśnieniach, temperaturach, częstotliwościach i określają punkt, w którym przestają działać. Po jego wyznaczeniu rejestrowana jest maksymalna częstotliwość, z którą procesor działa poprawnie i następnie jest on umieszczany w odpowiednim pojemniku, w którym znajdują się egzemplarze o podobnej częstotliwości. Przykładowo, procesory Pentium 4 2,0A. 2,2, 2.26. 2.4 i 2,53 zawierają dokładnie taką samą płytkę — dopiero przy końcu procesu produkcyjnego zostały one posortowane według częstotliwości pracy.
Z wytwarzaniem procesorów związana jest pewna ciekawostka, a mianowicie: wraz z udoskonalaniem linii montażowej określonego typu procesora i zdobywania coraz większego doświadczenia, w przypadku produkcji wersji procesorów taktowanych wyższymi częstotliwościami, wartość uzysku wzrasta. A zatem, z wszystkich procesorów wyprodukowanych z jednego wafla po testach może trochę ponad 75% pracuje z wyższymi częstotliwościami, natomiast tylko 25% lub mniej jest oznaczana jako egzemplarze taktowane niższymi częstotliwościami. Cały paradoks polega na tym, że firma Intel często wprowadza do sprzedaży o wiele więcej tańszych i wolniejszych procesorów, a więc wynika z tego, że po prostu umieszcza je w pojemniku przeznaczonym na szybsze egzemplarze, później oznacza je jako wolniejsze i w takiej postaci sprzedaje. Wiele osób odkryło, że mnóstwo wolniejszych procesorów tak naprawdę pracowało z częstotliwościami znacznie wyższymi niż na to by wskazywała informacja producenta. W ten sposób rozpoczęła się moda na przetaktowy-wanie procesorów.
Fałszowanie procesorów
W związku z różnymi częstotliwościami procesorów pojawił się dość interesujący problem, mianowicie nieuczciwi sprzedawcy rozpoczęli fałszowanie procesorów, co polegało na zmienianiu na tańszych modelach informacji dotyczącej częstotliwości i sprzedawaniu takich procesorów jako szybszych. Często może być tak. że różnica w cenie pomiędzy tymi samymi procesorami taktowanymi różnymi częstotliwościami jest znaczna i wynosi nawet kilkaset złotych, tak więc zmiana kilku cyfr na obudowie procesora może się wiązać ze sporym zyskiem. Ze względu na fakt, że większość procesorów produkowanych przez firmy AMD i Intel charakteryzuje się dużym zapasem bezpieczeństwa, co oznaczą że zazwyczaj mogą one pracować ze znacznie wyższymi częstotliwościami niż zostało to określone przez producenta, sfałszowanie takich procesorów w większości przypadków nie powinno być widoczne. Oczywiście wielu użytkownikom może się przydarzyć sytuacja, że tego typu procesory nie będą zachowywały się stabilnie i spowodują zawieszenie systemu lub okresowe przerwy w działaniu.
Początkowo fałszowanie procesorów po prostu polegało na ścieraniu oryginalnych oznaczeń i umieszczaniu nowych cyfr sprawiających wrażenie oryginalnych. Taka operacja była jednak łatwa do wykrycia. Kolejnym krokiem fałszerzy procesorów było rozpoczęcie produkcji całkowicie nowych typów obudów, w szczególności przeznaczonych dla procesorów opartych na gnieździe Slot 1 i Slot A (produkowanych odpowiednio przez firmę Intel i AMD) i wykonywanych z tworzywa. Chociaż mogłoby się wydawać, że wykonywanie obudów o nietypowym kształcie, a następnie podmienianie ich z oryginalnymi jest kłopotliwe, to jednak ze względu na zapowiedź sporych zysków osoby trudniące się tym procederem uznały to za opłacalne zajęcie. Tego typu działalność przybrała postać zorganizowanej przestępczości i nie ma nic wspólnego z jakimś domorosłym złodziejaszkiem przesiadującym w piwnicy z kawałkiem papieru ściernego i gumową pieczątką.
Firmy AMD i Intel postanowiły powstrzymać zyski fałszerzy procesorów i zaczęły stosować blokadę uniemożliwiającą przetaktowywanie. W przypadku większości nowszych typów procesorów miała ona postać blokady mnożnika. Jest ona zazwyczaj zakładana na etapie spajania lub produkcji obudowy procesora i polega na jego celowej modyfikacji nie pozwalającej na uruchomieniu procesora z szybkością wyższą niż określona przez producenta. Praktycznie wiąże się to z modyfikacją końcówek odpowiedzialnych za częstotliwość pracy szyny (BF) lub ścieżek procesora kontrolujących wewnętrzny mnożnik. Pomimo zastosowania tego typu blokad, niektórzy znaleźli sposób pozwalający na taktowanie płyt głównych częstotliwościami wyższymi od wartości nominalnej, dlatego też niezależnie od zastosowanych w procesorach blokad mnożnika nadal było możliwe uruchamianie ich z częstotliwością wyższą od określonej przez producenta.
Uważaj przy przetaktowywaniu sfałszowanych procesorów Pentium II i III (gniazdo Slot 1)
Jeśli nadal jesteś zainteresowany nabyciem procesora z gniazdem Slot 1, powinieneś być świadomym tego, że niektórzy fałszerze opracowali niewielki układ scalony, który usuwał blokadę mnożnika i pozwalał ustawiać wyższe wartości. Układ był schowany wewnątrz obudowy procesorów Pentium II i III, dzięki czemu możliwe było ich fałszowanie polegające na zawyżaniu parametrów wskazujących, że procesor jest taktowany wyższą częstotliwością. Tego typu nielegalny proceder przybrał o wiele większe rozmiary niż można by przypuszczać. Jeśli nabyłeś komputer lub procesor na lokalnej giełdzie, są spore szanse, że stałeś się posiadaczem sfałszowanego procesora. Osobiście polecam kupowanie procesorów tylko od zaufanych dystrybutorów lub sprzedawców. W celu uzyskania ich listy można zasięgnąć informacji w firmach AMD, Intel lub VIA.
Prawdziwy problem związany z zastosowaną przez firmę Intel i AMD blokadą uniemożliwiającą przetaktowywanie polega na tym, że zawodowi fałszerze często opracowywali metodę jej obejścia, która wiązała się z fizyczną modyfikacją procesora. Procesory zamknięte w obudowie typu Socket są bardziej odporne na działania fałszerzy, ale też mogą paść ich ofiarą zwłaszcza że ślady ingerencji mogą zostać ukryte pod radiatorem. Aby się uchronić przed zakupem sfałszowanego procesora, należy wcześniej sprawdzić oznaczenia i numery seryjne umieszczane przez firmę Intel i AMD. Należy również z rozwagą wybierać miejsce zakupu sprzętu. Nabycie komputera za pośrednictwem internetowej aukcji może być wyjątkowo niebezpieczne, ponieważ w tym przypadku sprzedanie sfałszowanego procesora jest wyjątkowo proste. Oczywiście zaopatrywanie się na różnego typu giełdach komputerowych też może narazić nas na tego typu przypadki. Ostatnią moją radą jest kupowanie procesorów Intel i AMD tylko w wersji pudełkowej (ang. box), zamiast w wersji OEM. Wersja pudełkowa jest szczelnie zapakowana i wyposażona w wysokiej jakości radiator, dokumentację i 3-letnią gwarancję producenta.
Fałszowanie komponentów stosowanych w komputerach nie ogranicza się tylko do procesorów. Osobiście spotkałem się z podrabianymi pamięciami (SIMM czy DIMM), myszami, kartami graficznymi, kartami SCSI, pamięciami Cache oraz systemami operacyjnymi i aplikacjami, a nawet płytami głównymi. Tego typu sprzęt funkcjonuje, ale nie jest takiej jakości, jakiej należałoby się spodziewać. Przykładowo, w pewnym okresie jednym z najczęściej podrabianych komponentów komputera była mysz produkowana przez firmę Microsoft. Oryginał kosztował 35 dolarów, natomiast jego tańsza wersja wytwarzana przez zamorskich producentów była warta zaledwie 2,32 dolara. Nie trzeba zbyt długo myśleć, aby uzmysłowić sobie, że jeśli koszt wyprodukowania myszy wyglądającej jak produkt firmy Microsoft warty 35 dolarów wynosił 2 dolary, to jej sprzedaż za 20 dolarów osobom przekonanym, że po okazyjnej cenie zakupiły oryginalny produkt może przynieść naprawdę spore zyski.
Obudowa PGA
Obudowa PGA (ang. pin grid array) w różnych wersjach przez wiele lat była najczęściej stosowanym typem obudowy procesorów. Po raz pierwszy została ona wykorzystana w 1980 r. w procesorze 286 i po dzień dzisiejszy nadal jest stosowana w procesorach Pentium i Pentium Pro. Nazwa PGA wywodzi się od tablicy końcówek ustawionych na podobieństwo siatki i znajdujących się na spodniej stronie procesora. Procesory w obudowie PGA są zakładane w gnieździe, które często jest wykonane zgodnie ze standardem ZIF (ang. zero insertion force). Gniazda ZIF posiadają dźwignię ułatwiającą instalację i wyjmowanie procesora.
Większość procesorów Pentium wykorzystuje modyfikację obudowy PGA o nazwie SPGA (ang. staggered pin grid array), gdzie na spodzie procesora końcówki — zamiast w standardowych rzędach i kolumnach — są rozmieszczone nierównomiernie. Takie rozwiązanie ma na celu zbliżenie do siebie końcówek, a tym samym, w przypadku konieczności zastosowania dużej ilości końcówek, zmniejszenie całkowitej powierzchni procesora. Na rysunku 3.6 obok starszego procesora Pentium 66 wykorzystującego zwykłą obudowę PGA został pokazany procesor Pentium Pro (po prawej stronie) w obudowie SPGA z podwójnym wzorem rozmieszczenia końcówek. Należy zwrócić uwagę na to, że górna połówka procesora Pentium Pro pokazanego na rysunku jest wyposażona w dodatkowe końcówki rozmieszczone pomiędzy rzędami i kolumnami pozostałych końcówek.
Rysunek 3.6.
Obudowa PGA procesora Pentium 66 (po lewej stronie) i obudowa SPGA (z podwójnym wzorem ułożenia końcówek) procesora Pentium Pro (po prawej stronie)
Obudowy PGA starszego typu były wykorzystywane w przypadku płytek montowanych we wnęce znajdującej się pod podłożem procesora widocznym — po odwróceniu obudowy „do góry nogami" — na górnej powierzchni. Płytka była połączona z obudową za pomocą kilkuset cienkich przewodów wykonanych ze złota. Przewody łączyły ze sobą punkty znajdujące się na krawędzi procesora ze stykami obudowy. Po wykonaniu połączeń, wnęka była szczelnie zamykana przy użyciu metalowej pokrywki. Taka metoda wytwarzania procesorów była kosztowna i czasochłonna, dlatego też opracowano tańsze i bardziej wydajne technologie wykonywania obudów procesorów.
Większość nowszych typów procesorów jest umieszczana w obudowie FC-PGA (ang. flip-chip pin grid array). W tym przypadku nadal jest wykorzystywane gniazdo PGA, ale sama obudowa uległa znacznemu uproszczeniu. W obudowie FC-PGA płytka krzemowa — przy montażu na górnej powierzchni podłoża procesora — jest skierowana górą w dół i — zamiast przewodów — połączenia zostały wykonane w postaci niewielkich wypukłych punktów wykonanych na obwodzie płytki ze stopu lutowniczego. Krawędź płytki jest następnie uszczelniana za pomocą taśmy epoksydowej. W przypadku oryginalnych obudów FC-PGA widoczna była spodnia strona płytki procesora umieszczonej na podłożu.
Niestety, pojawiły się problemy związane z montażem radiatora na obudowie FC-PGA. Radiator był zakładany na wierzchu płytki procesora, która pełniła rolę oparcia. W przypadku, gdy w trakcie montażu radiatora np. w momencie mocowania zatrzasku przypadkowo po jednej z jego stron przyłożono zbyt dużą siłę, wtedy mogło się to skończyć złamaniem krzemowej płytki i w efekcie uszkodzeniem procesora. Problem stał się bardziej dotkliwy wraz z pojawieniem się cięższych i większych radiatorów, w przypadku których do zamocowania zatrzasku wymagane było użycie większej siły.
Firma AMD zmniejszyła ryzyko uszkodzenia procesora poprzez założenie w każdym narożniku podłoża procesora gumowych podkładek, które w czasie montażu radiatora zapobiegały wystąpieniu nadmiernych napięć. Jednakże tego typu amortyzatory nadal mogły ulec ściśnięciu i doprowadzić do uszkodzenia płytki procesora. Obecnie w procesorach Athlon XP stosowana jest obudowa FC-PGA wyposażona w podkładki umieszczone w każdym narożniku podłoża procesora. Kilku mniejszych producentów sprzedaje specjalnie zaprojektowane podkładki oferujące dodatkową ochronę. W przypadku procesora Athlon 64 wykorzystywany jest inaczej wykonany radiator mocowany w zacisku, który jest następnie przykręcany do płyty głównej. Jest to pomocne w ochronie procesora przed uszkodzeniem.
Firma Intel opracowała nowszą wersję obudowy FC-PGA o nazwie FC-PGA2 wykorzystywaną w procesorach Pentium III i wszystkich modelach procesora Pentium 4. Jest ona wyposażona we wbudowaną ochronną metalową pokrywę nazywaną rozpraszaczem ciepła umieszczoną na wierzchu płytki procesora. Jej zadaniem jest ułatwienie montażu większych i cięższych radiatorów bez ryzyka uszkodzenia rdzenia procesora. Zabawne jest jednak to, że pierwszy procesor z rodziny K6 przeznaczony dla komputerów PC wyposażony w rozpraszacz ciepła wykonany został przez firmę... AMD.
Projekty obudów, które zostaną zastosowane w najbliższej przyszłości nawiązują do rozwiązania nazwanego BBUL (ang. bumpless build-up layer). W tym przypadku płytka procesora jest całkowicie schowana w obudowie. Kolejne warstwy obudowy BBUL będą wykonane wokół górnej powierzchni płytki, dzięki czemu będzie ona w niej ukryta. Wskutek osadzenia płytki procesora w obudowie, instalacja radiatora będzie możliwa na zupełnie płaskiej powierzchni. Poza tym wewnątrz obudowy będzie możliwe wykonanie krótszych połączeń.
Obudowy SEC i SEPP
Firmy AMD i Intel w swoich procesorach produkowanych w latach 1997 - 2000 stosowały obudowy kasetowe z płytką drukowaną. Tego typu rozwiązania określano terminem SECC (ang. single edge contact cartridge) lub SEPP (ang. single edge processor package). Obudowy takie składały się z procesora i oddzielnych układów pamięci Cache L2 montowanych na płytce drukowanej. Wyglądem przypominało to instalowane w gnieździe trochę większe moduły pamięci. W niektórych przypadkach płytka drukowana była umieszczana w kasecie wykonanej z tworzywa sztucznego.
Kaseta SEC jest zmodyfikowanym, choć trochę nieporęcznym typem obudowy, w której jest umieszczona magistrala back-side i pamięć Cache L2. Tego typu obudowa była wykorzystywana jako mniej kosztowna metoda integracji pamięci Cache L2 z procesorem, do momentu, gdy opracowano technologię umieszczania jej bezpośrednio wewnątrz procesora.
Mniej kosztowna wersja obudowy SEC nosi nazwę SEP (ang. single edge processor). Obudowa SEP wykorzystuje taką samą płytkę drukowaną co obudowa SEC, na której jest umieszczony procesor i pamięć podręczna (opcjonalna), ale jest pozbawiona plastikowej pokrywy. Początkowo była głównie stosowana w tańszych procesorach Celeron. Obudowa SEP jest instalowana w identycznym gnieździe Slot 1 używanym w przypadku procesorów Pentium II i III. Montaż radiatora umożliwiają cztery otwory znajdujące się na płytce drukowanej.
Gniazdo Slot 1 znajdujące się na płycie głównej i posiadające 242 końcówki zostało pokazane na rysunku 3.7. Firma AMD wykorzystywała gniazdo o identycznej konstrukcji, ale obrócone o 180 stopni i nazwane Slot A. Procesor wykorzystujący obudowę SEC lub SEP jest instalowany w gnieździe i zabezpieczany mechanizmem podtrzymującym, którego rolę pełni założony wspornik. W podobny sposób może być zabezpieczony radiator procesora. Na rysunku 3.8 pokazano elementy składowe pokrywy będącej częścią obudowy SEC. Należy zwrócić uwagę na płytkę termiczną o dużych rozmiarach, której zadaniem jest odprowadzanie ciepła wydzielanego przez procesor. Obudowa SEP została zaprezentowane na rysunku 3.9.
Rysunek 3.7.
Wymiary gniazda Slot I procesora Pentium II (miara metryczna i angielska)
Rysunek 3.8.
Elementy składowe obudowy procesora Pentium II
Rysunek 3.9.
Obudowa SEP procesora Celeron (widok z przodu
Wraz z wprowadzeniem do sprzedaży procesora Pentium III firma Intel zastosowała nową wersję obudowy SEC nazwanej SECC2 (ang. single edge contact cartridge version 2). W przypadku tej obudowy plastikową pokrywą jest zasłonięta tylko jedna strona płyty procesora, natomiast zamontowanie radiatora możliwe jest bezpośrednio po jej przeciwnej stronie. Dla polepszenia odprowadzania ciepła posiada również bardziej dostępną płytę termiczną. Tak uproszczona wersja obudowy SEC spowodowała obniżenie kosztów produkcji. W celu utrzymania obudowy SECC2 w gnieździe procesora, konieczne było zastosowanie nowego systemu podtrzymującego o nazwie Universal Retention System wykorzystującego pionowe podpory wykonane z tworzywa sztucznego. System URS był również stosowany w przypadku starszych obudów SEC większości procesorów Pentium II oraz obudów SEP używanych w procesorach Celeron. W ten sposób znaleziono idealny mechanizm SECC2.podtrzymujący sprawdzający się w przypadku wszystkich procesorów wyposażonych w gniazdo Slot 1. Procesory Athlon firmy AMD, oparte na gnieździe Slot A, korzystały z tego samego mechanizmu podtrzymującego co produkty firmy Intel. Na rysunku 3.10 jest widoczna obudowa SECC2.
Rysunek 3.10.
Obudowa SECC2 stosowana w nowszych procesorach Pentium II i III
Podstawowym powodem, dla którego zaczęto stosować obudowy SEC i SEP, była możliwość przeniesienia pamięci Cache L2 z płyty głównej do procesora. Takie rozwiązanie było ekonomicznie opłacalne i rozszerzalne. Poza tym. w tamtym okresie było konieczne, ponieważ nie opracowano jeszcze technologii pozwalającej na bezpośrednie integrowanie pamięci podręcznej z rdzeniem procesora. Gdy stało się to możliwe, dalsze stosowanie obudowy kasetowej okazało się zbędne. Ze względu na fakt, że wszystkie nowsze typy procesorów są wyposażone w zintegrowaną z rdzeniem pamięć Cache L2, postanowiono powrócić do obudów PGA.
Typy gniazd procesorów
Firmy AMD i Intel opracowały dla swoich procesorów szereg różnych gniazd. Każde z nich współpracuje z innymi modelami procesorów. W tabeli 3.18 zawarto parametry różnych gniazd przeznaczonych dla procesora 486 i nowszych układów.
Na rysunku 3.11 zostały pokazane gniazda Socket 1, 2, 3 i 6 procesora 486. Na podstawie rysunku można dokonać porównania wymiarów gniazd i różnic w rozmieszczeniu końcówek. Na rysunku 3.12 pokazano gniazda Socket 4, 5, 7, 8 wykorzystywane przez procesory Pentium i Pentium Pro. Na podstawie rysunku można dokonać porównania wymiarów gniazd i różnice w rozmieszczeniu końcówek. Bardziej dokładne ilustracje każdego z gniazd wraz z ich omówieniem zostały zamieszczone w dalszej części rozdziału.
Podstawka ZIF (Zero Insert i on Force)
Po stworzeniu gniazda Socket 1 producenci procesorów zdali sobie sprawę z tego, że muszą ułatwić użytkownikom przeprowadzanie ich wymiany. Wytwórcy gniazd procesorów zmierzyli, że do zainstalowania procesora w standardowym 169-końcówkowym gnieździe — znajdującym się na płycie głównej — konieczne jest użycie siły odpowiadającej naciskowi 45 kilogramów. Użycie w trakcie instalacji lub demontażu tak dużej siły może z łatwością spowodować uszkodzenie procesora lub gniazda. Z tego powodu niektórzy producenci zaczęli stosować gniazda LIF (ang. Iow insertion force), które do założenia procesora w gnieździe 169-końcówkowym wymagały użycia siły odpowiadającej naciskowi 27 kilogramów. W przypadku zastosowania gniazda standardowego lub LIF osobiście zalecam wyjęcie płyty głównej z komputera, tak aby w momencie instalacji procesora była możliwość podparcia jej od spodu. Działanie na nieodpowiednio zabezpieczoną płytę główną siłą o nacisku wynoszącym od 27 do 45 kilogramów może doprowadzić do jej złamania. W celu demontażu procesora z tego typu gniazd konieczne jest zastosowanie specjalnego narzędzia. Jak się można zorientować, nawet niewielka siła może nie być do tego wystarczająca, dlatego też konieczne było opracowanie rozwiązania, które umożliwi przeciętnemu użytkownikowi dokonanie samodzielnej wymiany procesora.
Tabela 3.18. Typy i parametry gniazd procesorów
Klasa procesora |
Typ gniazda |
Liczba końcówek |
Rozmieszczenie końcówek |
Napięcie zasilania (V) |
Obsługiwane procesory |
Data wprowadzenia |
|
Socket 1 |
169 |
17x17 PGA |
5 |
486 SX/SX2, DX/DX2, DX4 OD |
Kwiecień 1989 |
Intel/AMD klasa 486 |
Socket 2 |
238 |
19x19 PGA |
5 |
486 SX/SX2, DX/DX2, DX4 OD, 486 Pentium OD |
Marzec 1992 |
|
Socket 3 |
237 |
19x19 PGA |
5/3,3 |
486 SX/SX2, DX/DX2, DX4, 486 Pentium OD, AMD 5x86 |
Luty 1994 |
|
Socket 6' |
235 |
19x19 PGA |
3,3 |
486 DX4, 486 Pentium OD |
Luty 1994 |
Intel/AMD klasa 586 |
Socket 4 |
273 |
21x21 PGA |
5 |
Pentium 60/66, OD |
Marzec 1993 |
|
Socket 5 |
320 |
37x37 SPGA |
3,3/3,5 |
Pentium 75 - 133, OD |
Marzec 1994 |
(Pentium) |
Socket 7 |
321 |
37x37 SPGA |
VRM |
Pentium 75 - 233 +, MMX, OD, AMD K5/K6, Cyrix Ml/11 |
Czerwiec 1995 |
klasa Intel 686 (Pentium 11/111) |
Socket 8 |
387 |
DP-SPGA |
Auto VRM |
Pentium Pro, OD |
Listopad 1995 |
|
Slot 1 (SC242) |
242 |
Slot |
Auto VRM |
Pentium II/III, Celeron SECC |
Maj 1997 |
|
Socket 370 |
370 |
37x37 SPGA |
Auto VRM |
Celeron/Pentium III PPGA/FC-PGA |
Listopad 1998 |
|
Socket 423 |
423 |
39x39 SPGA |
Auto VRM |
Pentium 4 FC-PGA |
Listopad 2000 |
klasa Intel Pentium 4 |
Socket 478 |
478 |
26x26 mPGA |
Auto VRM |
Pentium 4/Celeron FC-PGA2 |
Październik 2001 |
|
Socket T (LGA775) |
775 |
30x33 LGA |
Auto VRM |
Pentium 4/Celeron LGA775 |
Czerwiec 2004 |
klasa AMDK7 |
Slot A |
242 |
Slot |
Auto VRM |
AMD Athlon SECC |
Czerwiec 1999 |
|
Socket A (462) |
462 |
37x37 SPGA |
Auto VRM |
AMD Athlon/Athlon XP/ Duron PGA/FC-PGA |
Czerwiec 2000 |
klasa AMD K.8 |
Socket 754 |
754 |
29x29 mPGA |
Auto VRM |
AMD Athlon 64 |
Wrzesień 2003 |
|
Socket 939 |
939 |
31x31 mPGA |
Auto VRM |
AMD Athlon 64 v.2 |
Czerwiec 2004 |
|
Socket 940 |
940 |
31x31 mPGA |
Auto VRM |
AMD Athlon 64 FX, Opteron |
Kwiecień 2003 |
|
Slot 2 (SC330) |
330 |
Slot |
Auto VRM |
Pentium 11/111 Xeon |
Kwiecień 1998 |
klasa procesorów Intel/AMD dla wydajnych stacji roboczych |
Socket 603 |
603 |
31x25 mPGA |
Auto VRM |
Xeon (P4) |
Maj 2001 |
|
Socket 604 |
604 |
31x25 mPGA |
Auto VRM SPGA z podziałem |
Xeon (P4) |
Październik 2003 |
|
Socket PAC418 |
418 |
38x22 |
Auto VRM |
Itanium |
Maj 2001 |
i serwerów |
Socket PAC 611 |
611 |
25x28 |
Auto VRM mPGA |
Itanium 2 |
Lipiec 2002 |
|
Socket 940 |
940 |
31x31 mPGA |
Auto VRM |
AMD Athlon 64 FX, Opteron |
Kwiecień 2003 |
1Projekt gniazda Socket 6 w rzeczywistości nigdy nie został zastosowany praktycznie
FC-PGA — Flip-chip PGA. PPGA — Plastic PGA.
FC-PGA2 — Flip-chip PGA drugiej generacji. SECC — Single edge contact cartridge.
mPGA — Micro PGA. SPGA — Staggered PGA.
PAC — Pin array cartridge. VRM— Yoltage regulator module.
PGA — Pin grid array.
Rysunek 3.11.
Gniazda procesora 486
Rysunek 3.12.
Gniazda procesorów Pentium i Pentium Pro
Technologię ZIF rozpoczęto wykorzystywać w gniazdach Socket I. a począwszy od procesorów opartych na gnieździe Socket 2 była już powszechnie stosowana. Przyjęcie tego rozwiązania było koniecznością w przypadku wszystkich gniazd o dużym zagęszczeniu końcówek, ponieważ w przeciwnym razie siła wymagana do instalacji zgodnych z nimi procesorów byłaby zbyt duża. Gniazda ZIF prawie całkowicie wyeliminowały ryzyko związane z instalacją i demontażem procesorów. Wynikało to stąd, że do zainstalowania procesora nie było konieczne użycie praktycznie żadnej siły oraz przy jego wyjmowaniu specjalnie do tego przeznaczonego narzędzia. Większość gniazd ZIF jest wyposażona w ruchomą dźwignię. Operacja instalacji procesora polega na podniesieniu dźwigni, założeniu procesora w gnieździe i następnie zablokowaniu dźwigni. Zastosowanie dźwigni uprościło proces instalacji i wyjmowanie procesora.
Gniazdo Socket 1
Gniazdo początkowo znane jako OverDrive, a teraz oficjalnie nazywane Socket I jest wyposażone w 169 końcówek. Płyty główne wyposażone w tego typu gniazdo mogą współpracować z procesorami 486SX, DX, DX2 oraz DX2/Overdrive. Gniazdo Socket 1 było montowane w większości płyt głównych przeznaczonych dla procesorów 486 i umożliwiających dokonywanie aktualizacji do procesorów OverDrive. Na rysunku 3.13 przedstawiono rozmieszczenie końcówek gniazda Socket 1
Rysunek 3.13.
Rozmieszczenie końcówek gniazda Socket I firmy Intel
Procesor 486 DX pobiera moc o wartości maksymalnej wynoszącej 4,5 W (przy natężeniu 0,9 A, napięciu 5 V i częstotliwości 33 MHz) lub moc równą 5 W (przy natężeniu 1 A i częstotliwości 50 MHz). Procesor DX2 lub OverDrive pobiera moc o wartości maksymalnej wynoszącej 6 watów (przy natężeniu 1.2 A i częstotliwości 66 MHz). Tak nieznaczny wzrost poboru mocy wiąże się z zastosowaniem radiatora pasywnego wykonanego z aluminiowych żeber i przyklejonego do powierzchni procesora za pomocą przenoszącej ciepło żywicy epoksydowej. Radiatory pasywne nie posiadają mechanicznych elementów takich jak wentylator. Radiatory z zamontowanym wentylatorem lub innego typu urządzenia cechujące się sporym poborem mocy są określane terminem radiatorów aktywnych. Procesory OverDrive taktowane zegarem 40 MHz lub wolniejszym nie wymagają zastosowania radiatora.
Gniazdo Socket 2
W momencie wprowadzenia do sprzedaży procesora 486 DX firma Intel już pracowała nad projektem nowego procesora Pentium. Intel chciał mieć w ofercie 32-bitową pomniejszoną wersją procesora Pentium pełniącego rolę aktualizacji systemów wyposażonych w procesor 486 DX2. Zamiast jedynie zwiększyć częstotliwość pracy, firma Intel stworzyła całkowicie nowy produkt z rozszerzonymi możliwościami zapożyczonymi z procesora Pentium.
Nowy produkt został nazwany Pentium OverDrive i współpracował z gniazdem Socket 2 lub Socket 3. Tego typu gniazda obsługiwały również procesory 486 SX, DX i DX2. Ze względu na to, że Pentium OverDrive jest 32-bitową wersją procesora Pentium (64-bitowego), wiele osób określało go terminem Pentium-SX. Pentium OverDrive był dostępny w wersji 25/63 MHz i 33/83 MHz. Pierwsza liczba oznaczenia wskazuje na częstotliwość pracy płyty głównej, natomiast druga na rzeczywistą szybkość procesora Pentium OverDrive. Jak można wywnioskować, procesor jest taktowany częstotliwością będącą wynikiem pomnożenia częstotliwości pracy płyty głównej przez wartość 2,5. Na rysunku 3.14 przedstawiono rozmieszczenie końcówek gniazda Socket 2.
Rysunek 3.14.
Rozmieszczenie 238 końcówek gniazda Socket 2 firmy Intel
Należy zwrócić uwagę na to, że chociaż nowy procesor wykorzystujący gniazdo Socket 2 nosi nazwę Pentium OverDrive, to nie jest w pełni funkcjonalnym 64-bitowym procesorem Pentium. Firma Intel trochę przedwcześnie wprowadziła na rynek gniazdo Socket 2 i okazało się, że nowy procesor w wielu systemach za bardzo się nagrzewa. Rozwiązanie tego problemu polegało na dodaniu do procesora Pentium OverDrive specjalnego radiatora aktywnego. Jest on połączeniem zwykłego radiatora i wbudowanego elektrycznego wentylatora. W przeciwieństwie do wentylatorów przyklejanych lub przyczepianych do procesora, z którymi się może spotkałeś, wentylator procesora Pentium OverDrive jest zasilany bezpośrednio napięciem pochodzącym z gniazda i wynoszącym 5 V. Z tego też powodu nie jest wymagane zastosowanie żadnych kabli zasilających dysk twardy lub prowadzonych wprost z zasilacza. Zestaw złożony z radiatora i wentylatora jest zamocowany bezpośrednio do procesora i tym samym w przypadku awarii wentylatora upraszcza jego wymianę.
Zastosowanie radiatora aktywnego wymaga utrzymania dodatkowej wolnej przestrzeni. Dla zapewnienia radiatorowi miejsca na obszarze o powierzchni około 3,5 cm2 otaczającym gniazdo procesora nie powinny się znajdować żadne przeszkody. W systemach, w których nie jest spełniony powyższy warunek, instalacja procesora Pentium OverDrive jest utrudniona lub nawet niemożliwa do wykonania.
Kolejny problem pojawiający się w związku z aktualizacją procesora do modelu OverDrive wynika z poboru mocy. Procesor Pentium OverDrive zasilany napięciem 5 V (przy natężeniu 2,5 A) pobiera moc równą 12,5 W (z uwzględnieniem wentylatora), co stanowi ponad dwukrotnie więcej niż w przypadku procesora 486 DX2 taktowanego zegarem 66 MHz (6 W przy natężeniu prądu 1,2 A).
Intel nie sprzedaje już procesorów OverDrive, ale udostępnia informacje techniczne na ich temat (http://www. Intel. com/support/processors/overdrive/index. html).
Gniazdo Socket 3
Wskutek problemów związanych z oryginalną specyfikacją gniazda Socket 2 i znaczną ilością ciepła wydzielanego przez procesor Pentium OverDrive, firma Intel była zmuszona do opracowania jego ulepszonej wersji. Nowy procesor jest identyczny z modelem Pentium OverDrive, z wyjątkiem tego, że jest zasilany napięciem 3,3 V, pobierając maksymalną moc 9,9 W (przy natężeniu 3,0 A). Dodatkowo wentylator procesora jest zasilany napięciem 5 V i pobiera moc wynoszącą 1 W (przy natężeniu 0,2 A), co w sumie daje zużycie równe 10.9 W. W porównaniu z wersją procesora zasilaną napięciem o wartości 5 V, w tej konfiguracji zachowano niewielki zapas. Jeśli nastąpi awaria wentylatora procesora Pentium OverDrive, jego wymiana nie sprawi większych trudności.
Aby umożliwić jednoczesne wykorzystanie zarówno procesora 486 DX4, jak i Pentium OverDrive zasilanych napięciem 3,3 V firma Intel była zmuszona do opracowania nowego gniazda. Oprócz procesorów zasilanych napięciem 3,3 V nowe gniazdo współpracowało ze starszymi 5-woltowymi modelami takimi jak SX, DX, DX2, a nawet Pentium OverDrive. Nowe gniazdo nazwane Socket 3 jest najbardziej odpowiednim rozwiązaniem wykorzystywanym przy aktualizacji systemów klasy 486. Na rysunku 3.15 pokazano rozmieszczenie końcówek gniazda Socket 3.
Rysunek 3.15.
Rozmieszczenie 237 końcówek gniazda Socket 3 firmy Intel
Należy zwrócić uwagę na to, że w porównaniu z poprzednim typem gniazda Socket 3 posiada jedną dodatkową końcówkę i kilka zaślepek. Nowe gniazdo jest wyposażone w lepsze oznaczenia uniemożliwiające użytkownikowi przypadkowe wykonanie niepoprawnej instalacji procesora. W związku z opracowaniem gniazda Socket 3 pojawił się jeden poważny problem, a mianowicie nie jest ono w stanie automatycznie wykryć wartości napięcia, które zostało doprowadzone. Prawdopodobnie na płycie głównej, w pobliżu gniazda, znajdziesz zworkę służącą do ustawiania napięcia o wartości 3,3 lub 5 V.
Ze względu na fakt, że użytkownik musi za pomocą zworki ręcznie ustawić wartość napięcia, może się zdarzyć, że został zainstalowany procesor zasilany napięciem 3,3 V, ale napięcie gniazda jest ustawione na 5 V. W tym przypadku w momencie włączenia zasilania dojdzie do uszkodzenia procesora. Wniosek z tego taki, że użytkownik musi pamiętać o ustawieniu, w zależności od typu zainstalowanego procesora, odpowiedniego napięcia zasilającego gniazdo. Jeśli, przykładowo, zworka została ustawiona na napięcie 3,3 V, a zainstalowany procesor pracuje z napięciem 5 V, wtedy nie dojdzie do uszkodzenia procesora, ale do momentu zmiany wartości napięcia na 5 V system nie będzie funkcjonował prawidłowo.
Gniazdo Socket 4
Socket 4 jest 273-końcówkowym gniazdem współpracującym z pierwszymi wersjami procesora Pentium. Były one taktowane zegarem 60 i 66 MHz oraz posiadały 273 końcówki pozwalające na instalację w gnieździe Socket 4. Socket 4 jest gniazdem zasilanym napięciem o wartości tylko 5 V. Wynika to stąd, że wszystkie pierwsze modele procesora Pentium pracowały z takim napięciem. Oprócz procesorów Pentium 60 i 66 MHz w gnieździe Socket 4 można było też zainstalować model OverDrive. Na rysunku 3.16 pokazano rozmieszczenie końcówek gniazda Socket 4.
Rysunek 3.16.
Rozmieszczenie 273 końcówek gniazda Socket 4 firmy Intel
W pewnym stopniu zadziwiające jest to, że procesor Pentium taktowany zegarem 66 MHz zużywa 16 W mocy (przy natężeniu 3,2 A i napięciu 5 V) i to bez uwzględnienia poboru mocy zwykłego radiatora aktywnego (wentylatora). Procesor Pentium OverDrive 66 MHz, który był jego następcą pobierał maksymalnie 13,5 W (przy natężeniu 2,7 A). Wartość ta uwzględnia pobór mocy wentylatora wynoszący około 1 W. Nawet pierwsza wersja procesora Pentium taktowana częstotliwością 60 MHz zużywała 14,55 W (przy natężeniu 2,91 A i napięciu 5 V). Może się to wydawać dziwne, że procesor w wersji OverDrive, dwukrotnie szybszy, zużywa mniej energii niż pełna wersja Pentium. Wynika to jednak z zastosowania przy produkcji procesorów Pentium i Pentium OverDrive odmiennej technologii.
Chociaż obydwa typy procesorów są zasilane napięciem 5 V, to jednak procesor Pentium został wykonany w technologii 0,8 mikrometra co spowodowało, że w porównaniu z procesorem Pentium OverDrive i nowszymi modelami opartymi na technologii 0,6 mikrometra zużywał więcej energii. Zmniejszenie wymiarów układów scalonych jest jednym z najlepszych sposobów obniżenia zużycia energii. Chociaż wersja OverDrive procesora Pentium przeznaczona dla systemów z nim kompatybilnych zużywała mniej energii niż procesor Pentium, to jednak w związku z zamontowanym na jego górnej powierzchni radiatorem aktywnym wymagane było zapewnienie dodatkowej wolnej przestrzeni. Podobnie jak miało to miejsce w przypadku innych procesorów w wersji OverDrive, również tutaj wbudowany wentylator jest zasilany bezpośrednio z gniazda procesora, dlatego też nie jest wymagane żadne dodatkowe zasilanie. Oczywiście, w razie awarii wentylatora jego wymiana nie sprawi większych trudności.
Gniazdo Socket 5
W chwili, gdy firma Intel wprowadziła do sprzedaży szybsze wersje procesora Pentium taktowane z częstotliwością 75. 90 i 100 MHz, były one wykonane w technologii 0,6 mikrometra i zasilane napięciem 3,3 V. Spowodowało to zmniejszenie poboru mocy do tylko 10,725 W (przy natężeniu 3.25 A i napięciu 3.3 V). Wynika z tego, że procesor Pentium taktowany zegarem 100 MHz zużywał znacznie mniej energii niż pierwsza jego wersja pracująca z częstotliwością 60 MHz. Zastosowanie technologii 0,6 mikrometra wiązało się z mniejszym poborem mocy i zastosowaniem wyższych częstotliwości pracy bez jednoczesnego nagrzewania procesorów.
Pomimo przewidywanej współpracy z gniazdem Socket 5, liczącym 320 końcówek, procesor Pentium 75 i nowsze modele w rzeczywistości dysponują tylko 296 końcówkami. Dodatkowe końcówki są wykorzystywane przez procesory w wersji OverDrive dostępne dla różnych modeli procesora Pentium. Gniazdo Socket 5 posiada 320 nierównomiernie rozmieszczonych końcówek, co ma na celu lepsze wykorzystanie wolnej przestrzeni.
Pojawiło się kilka procesorów w wersji OverDrive przeznaczonych dla pełnych procesorów Pentium. Przeważnie były to nowsze modele wyposażone w zintegrowane stabilizatory napięcia, które pozwalały na pracę z wyższymi napięciami wymaganymi przez starsze wersje procesorów Pentium. Chociaż firma Intel zaprzestała ich sprzedaży, to jednak tacy producenci jak Evergreen i Kingston nadal produkują procesory przeznaczone do aktualizacji starszych komputerów. Na rysunku 3.17 przedstawiono rozmieszczenie końcówek gniazda Socket 5.
Rysunek 3.17.
Rozmieszczenie 320 końcówek gniazda Socket 5 firmy Intel
Procesory Pentium OverDrive dla procesorów Pentium są wyposażone w radiator aktywny (wentylator), który jest zasilany bezpośrednio z gniazda. Procesor ten pobiera moc 14,289 W (przy natężeniu 4,33 A i napięciu 3,3 V), natomiast jego wentylator zużywa 1 W (przy natężeniu 0,2 A i napięciu 5 V). W sumie jest zużywane 15,289 W, co jest mniejszą ilością niż w przypadku procesora Pentium taktowanego zegarem 66 MHz. a procesor w wersji OverDrive jest od niego cztery razy szybszy!
Gniazdo Socket 6
Ostatnie z gniazd współpracujących z procesorami 486 obsługiwało modele DX4 oraz 486 Pentium OverDrive. Nowe gniazdo Socket 6 zostało opracowane jako lekko zmodyfikowana wersja gniazda Socket 3 i dysponowało dwoma dodatkowymi końcówkami służącymi do zapewnienia prawidłowej instalacji procesora. Posiadało 235 końcówek i współpracowało tylko z procesorami 486 lub OverDrive zasilanymi napięciem 3,3 V. Chociaż firma Intel podjęła się trudu związanego z projektowaniem gniazda Socket 6, to jednak ostatecznie nigdy nie zostało ono zastosowane w żadnym systemie. Większość producentów pozostało przy gnieździe Socket 3.
Gniazdo Socket 7 i Super7
Gniazdo Socket 7 właściwie jest gniazdem Socket 5, z tym, że do końcówki znajdującej się w przeciwnym narożniku dodano kolejną końcówkę również ustalającą poprawne położenie procesora. Wynika z tego, że gniazdo Socket 7 posiada 321 końcówek rozmieszczonych w formacie 37 x 37 charakterystycznym dla obudowy SPGA. Jednak rzeczywista nowa cecha gniazda Socket 7 wynika z konieczności zastosowania na płycie głównej modułu stabilizatora napięcia VRM (ang. voltage regulator module).
Moduł VRM jest niewielkim układem (lub ich grupą) zamontowanymą na płycie głównej i mającym za zadanie dostarczanie odpowiedniego napięcia zasilania i regulację mocy pobieranej przez procesor.
Głównym powodem zastosowania przez firmy AMD i Intel modułu VRM było dążenie do obniżenia napięcia zasilającego procesor o wartości 3,3 lub 5 V dostarczanego przez zasilacz do płyty głównej. Zamiast stosować dla każdego typu procesora inny zasilacz, za pomocą stabilizatora napięcia VRM dokonywano zamiany napięcia o wartości 3,3 lub 5 V na wartość wymaganą przez używany procesor. Firma Intel wprowadziła na rynek różne wersje procesorów Pentium i Pentium-MMX zasilane napięciami 3,3 (symbol VR), 3,465 (symbol VRE) lub 2,8 V. Odpowiadające im procesory innych producentów takich jak AMD, Cyrix i innych były zasilane napięciami o wartościach od 3,3 do 1,8 V. Ze względu na różnorodność napięć wykorzystywanych przez procesory, w większości płyt głównych zaczęto montować gniazda z modułem VRM lub dodawać do płyt przeznaczonych dla procesorów Pentium własne stabilizatory napięć.
Na rysunku 3.18 pokazano rozmieszczenie końcówek gniazda Socket 7.
Rysunek 3.18.
Rozmieszczenie końcówek gniazda Socket 7 (widok z góry) współpracującego z procesorem Pentium
Firma AMD razem z firmą Cyrix i kilkoma innymi producentami chipsetów opracowała ulepszoną lub poszerzoną wersję gniazda Socket 7 firmy Intel nazwaną Super Socket 7 lub Super7. Gniazdo Super7 pracowało z procesorami pracującymi z FSB taktowaną częstotliwościami od 66 do 95 i 100 MHz. Dzięki niemu możliwe było tworzenie systemów obsługujących układy o maksymalnej szybkości 500 MHz, które były prawie tak szybkie jak rozwiązania oparte na nowszym gnieździe Slot 1 i Socket 370 współpracujące z procesorami firmy Intel. Systemy oparte na gnieździe Super7 współpracowały również z magistralą AGP, kontrolerami dysków twardych Ultra DMA oraz mechanizmami zaawansowanego zarządzania energią.
Główni producenci chipsetów, tacy jak Acer Laboratories, Inc. (ALi), VIA Technologies i Silicon Integrated Systems (SiS), zaprojektowali własne chipsety przeznaczone dla płyt głównych z gniazdem Super7. Większość ważniejszych producentów płyt głównych wprowadziło do sprzedaży płyty z gniazdem Super7 zarówno w formacie Baby-AT, jak i ATX.
Gniazdo Socket 8
Socket 8 jest specjalnym gniazdem SPGA posiadającym aż 387 końcówek! Zostało ono opracowane z myślą o procesorze Pentium Pro zintegrowanym z pamięcią Cache L2. Dodatkowe końcówki mają na celu umożliwienie chipsetowi sprawowanie kontroli nad pamięcią Cache L2 znajdującą się w procesorze. Na rysunku 3.19 przedstawiono rozmieszczenie końcówek gniazda Socket 8.
Rysunek 3.19.
Rozmieszczenie końcówek gniazda Socket 8, w tym odpowiedzialnych za zasilanie (procesor Pentium Pro)
Gniazdo Socket 370 (PGA-370)
W listopadzie 1998 r. firma Intel zaprezentowała nowe gniazdo przeznaczone dla procesorów klasy P6. Nazwa nowego gniazda Socket 370 lub PGA-370 wynikała z faktu, że posiadało ono 370 końcówek i początkowo zostało przewidziane do współpracy z tańszymi modelami procesorów Celeron i Pentium III wyposażonych w obudowę PGA. Gniazdo Socket 370 zostało zaprojektowane jako rozwiązanie mogące bezpośrednio konkurować na rynku tańszych systemów wyposażonych w gniazdo Super7 produkowane przez firmy AMD i Cyrix. Jednak później Intel zastosował je w przypadku procesora Pentium III. Początkowo procesory Celeron i Pentium III były wytwarzane w formacie SECC i SEPP. Są to płytki drukowane z umieszczonymi na nich procesorem i oddzielnymi modułami pamięci Cache L2 instalowanymi na płycie głównej w gnieździe Slot 1. Tego typu rozwiązanie było konieczne, gdy pamięć Cache L2 była umieszczona na płytce drukowanej, ale nie była z nim bezpośrednio zintegrowana. Firma Intel opracowała dla procesora Pentium Pro obudowę zawierającą wiele modułów, ale okazało się, że koszt jej produkcji, w porównaniu z obudową mieszczącą jeden moduł, jest bardzo wysoki i w efekcie w procesorze Pentium II z niej zrezygnowano, co tłumaczy różnicę w wyglądzie Celerona i procesora Pentium Pro.
Począwszy od procesora Celeron 300A wprowadzonego do sprzedaży w kwietniu 1998 r. firma Intel zaczęła integrować pamięć podręczną z rdzeniem procesora, dlatego też nie pojawiały się one w postaci oddzielnych modułów. Po bezpośrednim zintegrowaniu pamięci Cache L2 z procesorem nie było już potrzeby, stosowania obudowy w formacie SECC lub SEPP. Ze względu na wyższy koszt wyprodukowania obudowy przystosowanej do gniazda Slot 1, firma Intel powróciła do obudów z serii Socket. Efektem tego było obniżenie kosztów ich wytwarzania, zwłaszcza w przypadku procesora Celeron, który w tym czasie rywalizował na rynku tańszych systemów z rozwiązaniami opartymi na gnieździe Socket 7 produkowanymi przez firmę AMD i Cyrix.
Na rysunku 3.20 pokazano rozmieszczenie końcówek gniazda Socket 370 (PGA-370).
W procesorach Celeron przeważnie były stosowane obudowy zgodne z gniazdem PGA-370, chociaż w pewnym okresie były również dostępne w wersji Slot 1. Wszystkie procesory Celeron taktowane z częstotliwością 333 MHz. i niższymi, były dostępne tylko w wersji Slot 1. Nowsze modele pracujące z częstotliwościami od 366 do 433 MHz były dostępne zarówno w wersji Slot 1, jak i Socket 370, natomiast wszystkie procesory Celeron taktowane zegarem od 466 MHz do 1,4 GHz przystosowane były do współpracy z gniazdem Socket 370.
Rysunek 3.20.
Rozmieszczenie końcówek (widok z góry) gniazda Socket 370 (PGA-370) współpracującego z procesorami Pentium III i Celeron
W październiku 1999 r. firma Intel wprowadziła do sprzedaży procesory Pentium III ze zintegrowaną pamięcią podręczną przystosowane do współpracy z gniazdem Socket 370. Procesory były wyposażone w obudowę FC-PGA (ang. flip chip pin grid array), w której płytka procesora jest montowana na podłożu ..do góry nogami". Koszt wykonania procesora Pentium III w wersji Slot 1 był o wiele wyższy i ze względu na fakt zintegrowania pamięci podręcznej z rdzeniem procesora i jego produkcji zaniechano.
Należy zauważyć, że wskutek kilku zmian wartości napięcia zasilania i dodania jednej końcówki, wiele płyt głównych wyposażonych w oryginalne gniazdo Socket 370 nie chciało współpracować z nowszymi wersjami procesorów Pentium III i Celeron w wersji FC-PGA Socket 370. Procesory Pentium III w wersji FC-PGA posiadały dwie końcówki RESET i wymagały stabilizatora napięcia zgodnego ze specyfikacją VRM 8.4. Płyty główne zaprojektowane z myślą o pierwszych wersjach procesora Celeron określano mianem płyt starszych (ang. legacy motherboards). natomiast nowsze modele płyt obsługujące końcówkę RESET i zgodne ze specyfikacją VRM 8.4 nazywano płytami elastycznymi (ang. flexible motherboards). Aby dowiedzieć się, czy Twoja płyta główna należy do drugiej grupy, skontaktuj się z jej producentem. Niektóre płyty główne, takie jak Intel CA810, są zgodne ze specyfikacją VRM 8.4 i dysponują odpowiednimi wartościami napięcia, ale bez obsługi końcówki Vtt, w którą jest wyposażony procesor Pentium III w wersji FC-PGA — po jego instalacji nastąpi przejście w tryb RESETU, a tym samym stanie się bezużyteczny. Najnowsze wersje procesorów Pentium III i Celeron III oparte są na rdzeniu Tualatin, wymagającym do pracy zmodyfikowanego gniazda. Płyty główne współpracujące z takimi procesorami określa się przystosowanymi do rdzenia Tualatin (Tualatin ready). Płyty te — w porównaniu z modelami nie obsługującymi procesorów z rdzeniem Tualatin — wyposażone są w inne chipsety. Firmy zajmujące się sprzedażą aktualizacji procesorów oferują produkty umożliwiające instalację układów Pentium III i Celeron III opartych na rdzeniu Tualatin na płytach głównych oryginalnie nie współpracujących z nimi.
Choć zainstalowanie procesora Pentium III w wersji FC-PGA na płycie głównej starszego typu nie może spowodować jej uszkodzenia, taki los może spotkać sam procesor. Procesory Pentium III wykonane w technologii 0,18 mikrona są zasilane napięciem o wartości 1,60 lub 1,65 V, natomiast procesory Celeron działają przy napięciu 2,00 V. Płyta główna może ulec uszkodzeniu, jeśli jej BIOS nieprawidłowo zidentyfikuje napięcie robocze procesora. Przed rozpoczęciem instalacji procesora, w celu sprawdzenia jego kompatybilności z posiadaną płytą główną skontaktuj się z producentem płyty lub komputera.
Płyta główna wyposażona w gniazdo Slot 1 może współpracować z prawie każdym modelem procesora Celeron, Pentium II lub Pentium III. Aby w tego typu płytach umożliwić zastosowanie procesorów Celeron i Pentium III współpracujących z gniazdem PGA, kilku producentów płyt opracowało niedrogą przejściówkę Slot 1-PGA nazywaną też slot-ket. Jest to właściwie płytka w obudowie zgodnej z gniazdem Slot 1 zawierająca jedynie gniazdo Socket 370, które pozwala zainstalować procesor PGA w gnieździe Slot 1. Przykładowa przejściów-ka slot-ket została pokazana w punkcie „Procesor Celeron" znajdującym się w dalszej części rozdziału.
^ Zajrzyj do punktu „Procesor Celeron" znajdującego się na stronie 200.
Gniazdo Socket 423
Socket 423 jest gniazdem typu ZIF zaprezentowanym w listopadzie 2000 r. i przeznaczonym dla pierwszej wersji procesora Pentium 4. Zostało ono pokazane na rysunku 3.21.
Rysunek 3.21.
Gniazdo Socket 423 z zaznaczoną końcówką numer 1 współpracujące z procesorem Pentium
Gniazdo Socket 423 obsługuje procesory wyposażone w magistralę taktowaną zegarem 400 MHz łączącą je z kontrolerem pamięci MCH (Memory Controller Hub) będącym podstawowym elementem chipsetu płyty głównej, podobnym do mostka północnego stosowanego w starszych chipsetach. Procesory Pentium 4 taktowane z częstotliwością do 2 GHz współpracują z gniazdem Socket 423, natomiast szybsze wersje z gniazdem Socket 478.
W gnieździe Socket 423 została zastosowania unikalna metoda montażu radiatora, która wiąże się z użyciem podpór przymocowanych do obudowy lub do specjalnej płytki zakładanej pod spodem płyty głównej. Takie rozwiązanie ma na celu uwzględnienie większej wagi radiatorów stosowanych w procesorach Pentium 4. Z tego też powodu wiele płyt głównych wyposażonych w gniazdo Socket 423 wymaga użycia specjalnej obudowy posiadającej dodatkowe podpory. Na szczęście konieczność zastosowania podpór została wyeliminowana w nowszych procesorach Pentium 4 zgodnych z gniazdem Socket 478.
W celu współpracy ze stabilizatorem napięcia VRM znajdującym się na płycie głównej i dostarczającym do zainstalowanego procesora odpowiednie wartości napięcia, używanych jest pięć końcówek napięciowych ID (VID). Dzięki nim ustawianie wartości napięcia odbywa się w sposób całkowicie zautomatyzowany i pewny. Większość procesorów Pentium 4 w wersji Socket 423 jest zasilana napięciem 1,7 V. Niewielki trójkątny znak umieszczony na gnieździe, przy końcówce numer 1, wskazuje poprawne położenie instalowanego procesora.
Gniazdo Socket 478
Socket 478 jest zaprezentowanym w październiku 2001 r. gniazdem typu ZIF współpracującym z procesorami Pentium 4 i Celeron 4 (oparte na rdzeniu układów Pentium 4). Zostało specjalnie zaprojektowane z myślą o obsłudze dodatkowych końcówek, w które mają być wyposażone przyszłe wersje procesora Pentium 4 taktowane z częstotliwościami powyżej 2 GHz. W przypadku tego gniazda montaż radiatora różni się od instalacji wykonywanej w gnieździe Socket 423, a ponadto jest możliwe zamocowanie na procesorze radiatora o większych rozmiarach. Na rysunku 3.22 zostało pokazane gniazdo Socket 478.
Rysunek 3.22.
Gniazdo Socket 4 78
z zaznaczoną końcówką numer 1
współpracujące z procesorem Pentium 4
Gniazdo Socket 478 współpracuje z magistralą taktowaną z częstotliwością 400, 533 lub 800 MHz. która łączy procesor z kontrolerem pamięci MCH (ang. memory controler hub), będącym głównym elementem chipsetu płyty głównej.
W gnieździe Socket 478 zastosowano nową metodę mocowania radiatora polegającą na jego bezpośrednim przyczepieniu do płyty głównej, a nie, tak jak w przypadku gniazda Socket 423, do gniazda procesora lub obudowy. W związku z tym może być użyta dowolna obudowa i nie jest wymagane zastosowanie specjalnych podpór koniecznych w przypadku gniazda Socket 423. Nowa metoda mocowania radiatora pozwala uzyskać pomiędzy nim a procesorem o wiele lepszy docisk, który poprawia warunki odprowadzania ciepła.
W celu współpracy ze stabilizatorem napięcia VRM znajdującym się na płycie głównej i dostarczającym odpowiednie wartości napięcia do zainstalowanego procesora, gniazdo Socket 478 używa pięciu końcówek napięciowych VID. Dzięki nim ustawianie wartości napięcia odbywa się w sposób całkowicie zautomatyzowany i pewny. Niewielki trójkątny znak umieszczony na gnieździe przy końcówce numer 1 wskazuje poprawne położenie instalowanego procesora.
Gniazdo Socket A (Socket 462)
Firma AMD w czerwcu 2000 r. zaprezentowała gniazdo Socket A. zwane również Socket 462. Miało ono za zadanie współpracować z procesorami Athlon i Duron wykonanymi w wersji PGA. Gniazdo Socket A miało zastąpić gniazdo Slot A stosowane w przypadku wcześniejszych wersji procesora Athlon. Ze względu na fakt zintegrowania pamięci Cache L2 z rdzeniem procesora i wytwarzania tańszego procesora Duron tylko w wersji z wbudowaną pamięcią podręczną L2 nie było potrzeby kontynuowania produkcji procesorów wyposażonych w kosztowne obudowy kasetowe stosowane w pierwszych wersjach procesora Athlon.
Gniazdo Socket A posiada 462 końcówek i 11 zaślepek rozmieszczonych zgodnie z wymaganiami standardu obudowy SPGA (rysunek 3.23). Chociaż Socket A ma identyczne wymiary i rozmieszczenie końcówek co gniazdo Socket 370, to jednak lokalizacja zaślepek uniemożliwia zainstalowanie w nim procesorów współpracujących z gniazdem Socket 370. Gniazdo Socket A obsługuje 32 wartości napięć w zakresie od 1,00 do 1,85 V zmienianych co 0,025 V i kontrolowanych przez końcówki procesora o oznaczeniach od VlD0 do VID4. Układ scalony automatycznego stabilizatora napięcia zazwyczaj jest umiejscowiony na płycie głównej.
Gniazdo posiada w sumie 11 zaślepek, w tym dwie znajdujące się na zewnątrz końcówki o oznaczeniach Al i ANI. Ich zadaniem jest wymuszenie właściwego ustawienia procesora instalowanego w gnieździe. Na rysunku 3.24 zostało pokazane rozmieszczenie końcówek gniazda Socket A.
Po zaprezentowaniu gniazda Socket A firma AMD przystosowała do współpracy z nim wszystkie modele procesora Athlon (włącznie z serią XP) i zrezygnowała z gniazda Slot A. Dodatkowo firma rozpoczęła sprzedaż wersji procesora Athlon o nazwie Duron, posiadającej mniej pojemną pamięć Cache i korzystającej z gniazda Socket A. Procesor Athlon 64 korzysta z jeszcze innego gniazda o nazwie Socket 754.
Rysunek 3.23.
Układ gniazda Socket A (Socket 462) współpracującego z procesorami Athlon i Duron
Rysunek 3.24.
Rozmieszczenie końcówek (widok z góry) gniazda Socket A (Socket 462) współpracującego z procesorami Athlon i Duron
Sama możliwość instalacji procesora w gnieździe nie oznacza jeszcze, że będzie działał. Nowsze modele procesora Athlon XP zasilane są innymi napięciami niż starsze układy Athlon i Duron oparte na gnieździe Socket A, a ponadto muszą być obsługiwane przez odpowiedni BIOS i chipset. Jak zawsze przed rozpoczęciem instalacji procesora należy upewnić się, czy jest on obsługiwany przez używaną płytę główną.
Gniazdo Socket 603
Gniazdo Socket 603 jest wykorzystywane przez procesory Intel Xeon pracujące w konfiguracjach DP (dwuprocesorowa) i MP (wieloprocesorowa). Są one zazwyczaj stosowane w płytach głównych zaprojektowanych z myślą o sieciowych serwerach plików. Na rysunku 3.25 pokazano gniazdo Socket 603.
Rysunek 3.25.
Gniazdo Socket 603 używane jest prze: procesor Xeon firmy Intel
Gniazdo Socket 754
Gniazdo Socket 754 używane jest przez jedną z wersji procesora Athlon 64. będącego pierwszym 64-bitowym układem firmy AMD przeznaczonym dla zwykłych komputerów stacjonarnych. Gniazdo zgodne jest z niebu-forowanąjednokanałową pamięcią DDR SDRAM. Na rysunku 3.26 pokazano gniazdo w widoku z góry.
Rysunek 3.26.
Gniazdo Socket 754. Lokalizacją końcówki 1 wskazuje bardziej ścięty dolny lewy narożnik
Gniazdo Socket 939 i Socket 940
Gniazdo Socket 939 używane jest przez zgodne z nim wersje procesorów Athlon 64 i 64 FX (rysunek 3.27). Płyty główne wyposażone w to gniazdo obsługują standardowe moduły niebutbrowanej pamięci DDR SDRAM w wersji 1- lub 2-kanałowej. Z kolei płyty główne z gniazdem Socket 940 wymagają zastosowania droższych modułów rejestrowej pamięci przeznaczonej dla serwerów. Gniazda Socket 939 i Socket 940 różnią się rozmieszczeniem końcówek, dlatego nie mogą być stosowane zamiennie.
Gniazdo Socket 940 wykorzystywane jest przez wersję procesora Athlon 64 FX, a także układ Opteron (rysunek 3.28). Płyty główne wyposażone w to gniazdo współpracują tylko z modułami rejestrowej dwukanałowej pamięci DDD SDRAM. Ze względu na inne rozmieszczenie końcówek gniazda Socket 940 zgodnych z nim procesorów nie można umieścić w gnieździe Socket 939 i odwrotnie.
Rysunek 3.27.
Gniazdo Socket 939. Lokalizację końcówki 1 wskazuje ścięty dolny lewy narożnik i trójkąt
Rysunek 3.28.
Gniazdo Socket 940. Lokalizację końcówki 1 wskazuje ścięty dolny lewy narożnik i trójkąt
Gniazdo Socket T
Gniazdo Socket T (LGA775) używane jest przez najnowsze modele procesora Intel Pentium 4 opartego na rdzeniu Prescott. Pierwsza generacja tych układów bazowała na gnieździe Socket 478. Wyjątkowość gniazda Socket T polega na tym, że wykorzystywana jest w nim obudowa LGA (land grid array), dlatego końcówki znajdują się w gnieździe zamiast w procesorze. Pierwszymi procesorami korzystającymi z tej technologii były zaprezentowane w 1997 r. układy Pentium II i Celeron. W procesorach tych obudowa LGA użyta została na potrzeby układu montowanego w kasecie Slot 1.
W obudowie LGA na spodzie podłoża zamiast końcówek stosowanych w obudowach PGA użyto złotych podkładek nazywanych polami (lands). W przypadku gniazda takie rozwiązanie pozwala na uzyskanie znacznie większych sił zaciskających, a zatem większej stabilności i lepszego przekazywania ciepła (chłodzenia). Tak naprawdę obudowa LGA jest tylko odnowioną wersją tego, co kiedyś nazywano obudową LCC (leadless chip carrier). Tego typu obudowa stosowana była w 1984 r. w przypadku procesorów 286. Złote podkładki umieszczone były tylko dookoła jej krawędzi (stosowana była wtedy znacznie mniejsza liczba końcówek). Można też powiedzieć, że obudowa LGA jest po prostu zmodyfikowaną wersją obudowy BGA (bali grid array), w której zamiast lutowanych punktów zastosowano złote pola. Dzięki temu obudowa bardziej nadaje się do zastosowania w gniazdach niż do lutowania. Pierwsze obudowy LCC były ceramiczne, natomiast oryginalne obudowy LGA procesorów Pentium II — plastikowe (obudowę lutowano do podłoża kasety). Obecnie i w przyszłości stosowana będzie wykonana ze związków organicznych obudowa LGA montowana bezpośrednio w gnieździe. Z technicznego punktu widzenia układy Pentium 4 korzystające z obudowy LGA łączą w sobie kilka technologii obudów stosowanych w przeszłości. Na potrzeby podłoża użyto technologii obudowy OLGA (organie land grid array), natomiast do samej płytki procesora zastosowano obudowę C4 FC (controlled collapse chip connection flip-chip).
Gniazda procesorowe
Po wprowadzeniu na rynek procesora Pentium Pro zintegrowanego z pamięcią Cache L2 firma Intel stwierdziła, że zastosowana w jego przypadku obudowa cechuje się wysokim kosztem produkcji. Zastosowanie obudowy kasetowej lub płytki drukowanej jako najlepszego dostępnego rozwiązania było wynikiem poszukiwań firmy Intel zmierzających do opracowania prostej metody integracji z obudową procesora pamięci podręcznej i w miarę możliwości innych elementów. Celem zwiększenia szans akceptacji nowej obudowy przez klientów, firma Intel opracowała dwa typy gniazd z nią współpracującymi i montowanych na płytach głównych.
Gniazdo Slot I posiada 242 końcówki i współpracuje z procesorami Pentium II. Pentium III oraz z większością modeli procesora Celeron. Natomiast Slot 2 jest bardziej zaawansowanym gniazdem wyposażonym w 330 końcówek zaprojektowanym dla procesorów Pentium II i III w wersji Xeon, które przede wszystkim są stosowane w stacjach roboczych i serwerach. Oprócz większej liczby końcówek, oba gniazda różnią się przede wszystkim tym, że gniazdo Slot 2 zostało zaprojektowane z myślą o współpracy na jednej płycie jednocześnie czterech lub nawet więcej procesorów. Gniazdo Slot 1 na jednej płycie może współpracować co najwyżej z drugim gniazdem Slot 1 — pozwala na współpracę maksymalnie 2 procesorów.
Warto zauważyć, że gniazdo Slot 2 określane jest też jako SC330 (slot connector 330 pins). W późniejszym czasie Intel opracował tańsze metody integrowania pamięci Cache L2 z rdzeniem procesora i nie produkuje już układów opartych na gnieździe Slot I lub Slot 2. Obecnie obie wersje procesorów są przestarzałe. Wiele komputerów wyposażonych w nie zostało wycofanych z użycia lub zmodernizowanych przez zastosowanie płyty głównej z gniazdem typu Socket.
Gniazdo Slot 1 (SC242)
Gniazdo Slot 1 określane również symbolem SC242 (ang. slot connector 242 pins) jest wykorzystywane przez procesory Pentium II/III i Celeron wykonane w wersji SEC (rysunek 3.29).
Rysunek 3.29.
Wymiary gniazda Slot I oraz rozmieszczenie końcówek
► ► Zajrzyj do punktu „Obudowy SEC i SEPP" znajdującego się na stronie 127.
Gniazdo Slot 2 (SC330)
Gniazdo Slot 2 określane również symbolem SC330 (slot connector 330 pins) wykorzystywane jest w drogich płytach głównych współpracujących z procesorami Pentium II i III w wersji Xeon. Został on pokazany na rysunku 3.30.
Procesory Pentium II/HI Xeon umieszczane są w obudowie podobnej do tych stosowanych w procesorach Pentium II i III, tyle że jest ona większa. Obudowa procesora Xeon została pokazana na rysunku 3.31.
Płyty główne wyposażone w gniazdo Slot 2 były głównie wykorzystywane w drogich systemach takich jak stacje robocze lub serwery oparte na procesorach Pentium II/III Xeon. W porównaniu ze standardowymi procesorami Pentium II i układami Pentium III opartymi na gnieździe typu Slot, różnią się przede wszystkim tym, że posiadają pamięć Cache L2 pracującą z częstotliwością rdzenia, a w niektórych wersjach ma ona większą pojemność. Dodatkowe końcówki umożliwiają obsługę specjalnych sygnałów wymaganych przez systemy wieloprocesorowe.
Rysunek 3.30.
Wymiary gniazda Slot 2 oraz rozmieszczenie końcówek
Napięcia zasilania procesorów
Dla kogoś, kto na bieżąco śledzi rozwój procesorów, oczywistą tendencją jest ciągle obniżanie napięcia zasilania. Korzyści wynikające z niskiego napięcia są trojakie. Najbardziej oczywistą jest ogólnie mniejszy pobór mocy. Im jest on mniejszy, tym koszty eksploatacji systemu są niższe, ale co ważniejsze — w przypadku komputerów przenośnych przy aktualnych możliwościach stosowanych w nich baterii możliwa jest o wiele dłuższa praca. Na skutek potrzeby wydłużenia żywotności baterii dokonano znacznego postępu w kierunku obniżenia napięcia zasilania, które ma decydujący wpływ na ich trwałość.
Kolejną istotną korzyścią wynikającą z obniżenia napięcia jest mniejsze wydzielanie ciepła. Procesory, które się mniej nagrzewają mogą pracować dłużej i mogą być umieszczane w systemach o mniejszych wymiarach.
Ostatnia z korzyści płynących ze stosowania niższych wartości napięcia jest związana z możliwością uzyskania wyższych częstotliwości pracy procesora. Obniżenie napięcia zasilania miało kluczowe znaczenie w możliwości ciągłego zwiększania szybkości procesorów.
Aż do momentu wprowadzenia przez firmę Intel do sprzedaży procesorów Pentium i Pentium MMX przeznaczonych dla komputerów przenośnych w przypadku większości procesorów zarówno rdzeń, jak i układy wejścia-wyjścia były zasilane napięciem o jednakowej wartości. Początkowo prawie wszystkie procesory były zasilane napięciem o wartości 5 V (rdzeń i układy wejścia-wyjścia). Później, w celu zmniejszenia poboru mocy, zostało ono obniżone do 3,5 lub 3,3 V. W przypadku zasilania rdzenia procesora i zewnętrznej jego magistrali oraz układów wejścia-wyjścia napięciem o jednakowej wartości procesor musi być wyposażony w jednonapięciowy układ zasilania.
Efektem pierwszego projektu procesora Pentium przeznaczonego dla komputerów przenośnych było opracowanie przez firmę Intel rozwiązania, które pozwoliło na znaczne obniżenie zużycia energii przy jednoczesnym zachowaniu kompatybilności z istniejącymi chipsetami, magistralami, pamięcią i innymi komponentami zasilanymi napięciem 3,3 V. Wynikiem prac firmy Intel był projekt układu zasilania z możliwością napięcia dzielonego, w którym układy wejścia-wyjścia nadal były zasilane napięciem 3,3 V, natomiast do rdzenia procesora było doprowadzane napięcie o niższej wartości. Oficjalnie rozwiązanie to przyjęło nazwę technologii redukcji napięcia VRT (ang. voltage reduction technology) i po raz pierwszy zostało zastosowane w procesorach Mobile Pentium wprowadzonych do sprzedaży w 1996 r. W późniejszym okresie podobne rozwiązanie zostało również wykorzystane w procesorach takich jak Pentium MMX przeznaczonych do komputerów stacjonarnych. W tym przypadku rdzeń procesora byl zasilany napięciem 2,8 V, natomiast układy wejścia-wyjścia napięciem 3,3 V. Obecnie większość procesorów, niezależnie od tego, czy są przeznaczone dla komputerów przenośnych czy stacjonarnych, jest wyposażona w układy zasilania z możliwością wykorzystywania napięcia dzielonego. Rdzeń niektórych nowszych modeli procesora Mobile Pentium II jest zasilany napięciem wynoszącym tylko 1,6 V, natomiast układy wejścia-wyjścia (dla zachowania kompatybilności z wykorzystywanymi komponentami) nadal są zasilane napięciem 3,3 V.
W przypadku takich gniazd procesorów jak Socket 370, Socket 478, Socket A, Socket 604, Socket 754, Socket 940, Socket 8 (Pentium Pro) lub Slot 1 (Pentium II), Slot 2 (Pentium II) doprowadzenie do procesorów odpowiednich wartości napięć nie sprawia większego problemu, ponieważ wymienione gniazda dysponują specjalnymi końcówkami VID, które są wykorzystywane przez procesor przy przekazywaniu do płyty głównej informacji dotyczących używanych przez niego napięć. Tym sposobem stabilizatory napięcia wbudowane w płytę główną mogą w chwili instalacji procesora automatycznie ustawić wymagane wartości napięć.
Niestety, funkcja automatycznego ustawiania napięć nie jest dostępna w płytach głównych z gniazdem Socket 7/Super 7, jak również w starszych modelach. W tym przypadku zwykle konieczne jest ręczne ustawienie napięć za pomocą zworek, co jest równoznaczne skonfigurowaniu płyty głównej zgodnie z wymaganiami dotyczącymi napięć instalowanego procesora. Procesory Pentium (Socket 4, 5, 7) zasilane były różnymi napięciami, ale jego najnowsze wersje wyposażone w rozszerzenie MMX są zasilane napięciem 2,8 V. Wyjątkiem jest wersja dla komputerów przenośnych zasilana napięciem o wartości 1,8 V. W tabeli 3.19 zebrano wartości napięć stosowane przez procesory Pentium (bez MMX) w wersji Socket 7, które wykorzystywały jednonapięciowy układ zasilania i układ z możliwością dzielenia napięć. Oznacza to, że zarówno rdzeń, jak i układy wejścia-wyjścia procesora były zasilane tym samym napięciem. Z kolei dwunapięciowy układ zasilania powoduje, że rdzeń i układy wejścia-wyjścia zasilane są różnymi napięciami.
Większość płyt głównych wyposażonych w gniazdo Socket 7 i nowszych dla zachowania kompatybilności z przyszłymi urządzeniami obsługiwało kilka wartości napięć. Były to następujące wartości: 2,5. 2,7, 2,8 i 2.9 V. Stabilizator napięcia, wbudowany w płytę główną
zamienia napięcie dostarczane z zasilacza na kilka różnych wartości wymaganych przez rdzeń procesorów. Aby uzyskać informacje dotyczące właściwej konfiguracji napięć, należy zajrzeć do dokumentacji dołączonej do płyty głównej i procesora.
Tabela 3.19. Napięcia zasilania (układ jednonapięciowy i z możliwością podziału napięć) procesorów z gniazdem Socket 7
Procesory Pentium Pro i Pentium II, wykorzystując wbudowane końcówki VID, automatycznie określają wymagane wartości napięć, które są ustawiane na stabilizatorze napięcia umieszczonym na płycie głównej. Końcówki VID zostaną omówione dokładniej w dalszej części rozdziału.
► ► Zajrzyj do punktu „Procesory Pentium Pro" znajdującego się na stronie 185.
^ ^ Zajrzyj do punktu „Procesory Pentium II" znajdującego się na stronie 189.
Należy zauważyć, że w przypadku ustawienia wartości STD lub VRE (układ jednonapięciowy), napięcie rdzenia i układu wejścia-wyjścia jest jednakowe. Po ustawieniu innych wartości napięcia niż STD lub VRE, następuje przełączenie na układ dwunapięciowy pozwalający ustawić określoną wartość napięcia rdzenia. Napięcie zasilające układ wejścia-wyjścia zawsze ma wartość stałą wynoszącą 3,3 V.
Gniazdo Socket 5 zostało przewidziane do współpracy tylko z ustawieniami STD lub VRE, dlatego też, jeśli określony procesor jest z nimi kompatybilny, może być zainstalowany w gnieździe Socket 5 oraz Socket 7. Starsze gniazda Socket 4 pracują tylko z napięciem 5 V, a ponadto cechują się całkowicie odmiennym układem końcówek (których jest mniej). W efekcie nie jest możliwe zainstalowanie w tego typu gnieździe procesora przeznaczonego dla gniazd Socket 5 i 7.
Większość płyt głównych wyposażonych w gniazda Socket 7 i nowszych dla zachowania kompatybilności z wieloma typami procesorów oferuje kilka wartości napięć. Są to: 2,2 V, 2,4 V, 2,5 V, 2,7 V, 2,8V, 2,9V oraz starsze wartości STD lub VRE. Stabilizator napięcia wbudowany w płytę główną zamienia napięcie dostarczane z zasilacza na różne wartości napięć wymaganych przez rdzeń procesorów. Aby uzyskać informacje dotyczące właściwej konfiguracji napięć, należy zajrzeć do dokumentacji dołączonej do płyty głównej i procesora.
Począwszy od procesora Pentium Pro, wszystkie nowsze układy, takie jak Celeron, Pentium II/III/4, AMD Athlon, Duron i Athlon XP/64, za pomocą wbudowanych końcówek VID automatycznie określają wymagane wartości napięć, które są ustawiane przez stabilizator napięcia umieszczony na płycie głównej.
W celu ułatwienia przetaktowywania procesorów wiele płyt głównych umożliwia zmianę ustawień napięcia i ręczne określenie żądanej wartości. Wiele osób odkryło, że w przypadku przetaktowywania procesora zwiększenie wartości napięcia o jedną dziesiątą wolta często zwiększa szansę powodzenia tej operacji. Oczywiście jednocześnie nastąpi wzrost ilości ciepła wydzielanego przez procesor, które musi zostać odprowadzone przy użyciu odpowiedniego radiatora i chłodzenia obudowy.
Ciepło i problemy z jego odprowadzaniem
W systemach o dużej wydajności wydzielanie ciepła może stanowić spory problem. Szybsze procesory zużywają więcej energii, a zatem wydzielają większą jego ilość. Procesor zazwyczaj jest najbardziej energochłonnym pojedynczym układem scalonym komputera i w większości przypadków bez dodatkowej pomocy wentylatora nie jest w stanie odprowadzić wytwarzanej energii cieplnej.
Aby można było zapewnić stały przepływ powietrza i stałą wydajność, większość procesorów wyposażona jest w określonego typu radiator służący do odprowadzania ciepła. Dodatkowo większość radiatorów wspomaganych jest przez wentylator, dzięki któremu nie są one uzależnione od przepływu powietrza we wnętrzu obudowy. Radiatory z zainstalowanym wentylatorem są określane mianem radiatorów aktywnych (ang. active heatsinks — rysunek 3.32). Tego typu radiatory są oczywiście osobno zasilane. Starsze typy radiatorów aktywnych wykorzystywały wolne złącze kabla zasilającego podłączonego do dysku twardego, natomiast nowsze są podłączane do specjalnie w tym celu zaprojektowanego złącza znajdującego się na płycie głównej.
Rysunek 3.32.
Radiator aktywny przeznaczony dla procesora Pentium 4 korzystającego z gniazda Socket 478
Chłodzeniu procesorów z uwzględnieniem radiatorów poświęcono rozdział 23., „Radykalne modyfikacje — przetaktowywanie, chłodzenie cieczą i udoskonalanie obudów".
Koprocesory (jednostki zmiennoprzecinkowe)
W tym miejscu zostanie omówiony koprocesor FPU (ang. floaing-point unit) znajdujący się w procesorze. Początkowo, za czasów procesora 386 i starszych układów, koprocesor arytmetyczny był oddzielnym zewnętrznym modułem. Starsze modele procesorów firmy Intel (lub kopie innych producentów) współpracowały z zewnętrznym układem koprocesora. Jednak po wprowadzeniu przez na rynek firmę Intel procesora 486DX, koprocesor został z nim zintegrowany. Odtąd każdy kolejny procesor opracowany przez firmy Intel, AMD, Cyrix i inne zawierał w sobie koprocesor. Zadaniem koprocesorów jest sprzętowe wykonywanie operacji zmiennoprzecinkowych, które w przeciwnym razie spowodowałyby nadmierne obciążenie jednostki całkowitoliczbowej procesora. Koprocesor zwiększa wydajność komputera tylko wtedy, gdy jest stosowane oprogramowanie z niego korzystającego. Wszystkie kolejne procesory piątej i szóstej generacji wytwarzane przez firmę Intel i innych producentów, takich jak AMD i Cyrix, są wyposażone w zintegrowaną jednostkę zmiennoprzecinkową.
Układy arytmetyczne, jak czasami mówi się o koprocesorach, są w stanie wykonywać z szybkością od 10 do 100 razy większą od współpracującego z nim procesora operacje arytmetyczne wysokiego poziomu, takie jak np. dzielenie przez liczbę wielocyfrową, funkcje trygonometryczne, obliczanie pierwiastków i logarytmów. Do operacji wykonywanych przez koprocesor zaliczają się wszystkie operacje, które przetwarzają liczby zmiennoprzecinkowe (zawierające część ułamkową). Konieczność przetwarzania liczb, które zawierają ułamek dziesiętny doprowadziła do utworzenia terminu zmiennoprzecinkowe (ang. jloating point). Nazwa wynika z faktu, że w zależności od wykonywanej operacji, kropka (punkt) dziesiętna może zmieniać swoje położenie. Jednostka całkowitoliczbowa procesora zajmuje się wykonywaniem operacji na liczbach całkowitych takich jak dodawanie, odejmowanie i mnożenie. Zadaniem jednostki całkowitoliczbowej jest wykonywanie tego typu, nieprzekazywanych do koprocesora, operacji.
Zestaw instrukcji koprocesora różni się od zestawu instrukcji jednostki całkowitoliczbowej. Aby wykonać instrukcje przeznaczone specjalnie dla koprocesora, wykonujący je program musi wykryć jego obecność. Jeśli tak się nie stanie, wtedy cała rola koprocesora będzie się sprowadzała do zużywania energii. Na szczęście większość nowoczesnych aplikacji wykorzystujących możliwości koprocesora poprawnie go rozpoznaje i z nim współpracuje. Do tego typu programów zaliczają się arkusze kalkulacyjne, aplikacje bazodanowe, statystyczne i graficzne typu CAD (ang. computer aided design — projektowanie wspomagane komputerowo). Edytory tekstu nie mają potrzeby korzystania z możliwości koprocesora, dlatego też nie potrafią z nim współpracować. W tabeli 3.20 przedstawiono koprocesory wykorzystywane w różnych procesorach firmy Intel.
Tabela 3.20. Koprocesory firmy Intel
Typ procesora |
Typ koprocesora |
8086 |
8087 |
8088 |
8087 |
286 |
287 |
386SX |
387SX |
386DX |
387DX |
486SX |
487SX, DX2/OverDrive' |
487SX' |
Zintegrowany |
486SX2 |
DX2/OverDrive2 |
486DX |
Zintegrowany |
486DX2 |
Zintegrowany |
486DX4/5x86 |
Zintegrowany |
Intel Pentium/Pentium MMX |
Zintegrowany |
Cyrix 6x86/MI/MlI |
Zintegrowany |
AMD K5/K6/Athlon/Duron |
Zintegrowany |
Pentium ll/Hl/Celeron/Xeon |
Zintegrowany |
Pentium 4 |
Zintegrowany |
Athlon 64 |
Zintegrowany |
Itanium/Itanium 2 |
Zintegrowany |
1FPU = Floating-point unit.
2Układ 487SXjest wersją procesora 486DX ze zmodyfikowanym rozmieszczeniem końcówek, wyposażoną w koprocesor. Po zainstalowaniu układu 487SX następuje wyłączenie procesora 486SX i przejęcie jego roli przez koprocesor. 2Procesor DX2/OverDrive jest odpowiednikiem układu SXz dodanym koprocesorem.
Chociaż od czasów procesorów z serii 486, prawie wszystkie modele wyposażano w zintegrowany koprocesor, to jednak ich wydajność była różna. Chociaż w najnowszych produktach firm AMD i Cyrix wydajność koprocesorów zrównała się z poziomem osiąganym przez jednostki FPU firmy Intel, to jednak dotąd koprocesory Intela w znacznym stopniuje przewyższały3.
Wraz z pojawieniem się kolejnej wersji koprocesora 8087 jego szybkość się zmieniała. Dodatkowa liczba dołączona do podstawowego oznaczenia koprocesora (tabela 3.21) oznacza maksymalną częstotliwość, z jaką może pracować koprocesor.
Tabela 3.21. Maksymalna częstotliwość pracy koprocesorów
Typ koprocesora |
Częstotliwość |
Typ koprocesora |
Częstotliwość |
8087 |
5 MHz |
287 |
6 MHz |
8087-3 |
5 MHz |
287-6 |
6 MHz |
8087-2 |
8 MHz |
287-8 |
8 MHz |
8087-1 |
10 MHz |
287-10 |
10 MHz |
3 W chwili obecnej to AMD dysponuje w swoich procesorach najwydajniejszym koprocesorem.
Dodatkowa liczba znajdująca się w oznaczeniu koprocesora 387 oraz procesorów 486, 487 lub Pentium zawsze określa maksymalną częstotliwość pracy (wyrażoną w MHz). Przykładowo, procesor 486DX2-66 jest taktowany zegarem 66 MHz. Niektóre procesory wykorzystują mnożnik częstotliwości, co oznacza, że w porównaniu z resztą systemu mogą pracować z inną częstotliwością.
Większość systemów opartych na procesorze 386 lub starszych dysponuje gniazdem pozwalającym na zastosowanie koprocesora, ale nie jest on instalowany jako standardowe wyposażenie. Ze względu na koszt i gabaryty pewna część komputerów dostępnych wtedy na rynku nie była nawet wyposażona w gniazdo koprocesora. Do tego typu systemów zazwyczaj zaliczały się tańsze rozwiązania lub komputery przenośne, takie jak starsze modele laptopów, komputer IBM PS/l i PCjr. Aby uzyskać więcej informacji na temat koprocesorów, należy zapoznać się z treścią punktów znajdujących się w dalszej części rozdziału omawiających układy 8087, 287, 387 i 487SX. W tabeli 3.22 zebrano parametry różnych koprocesorów.
Tabela 3.22. Parametry starszych modeli koprocesorów firmy Intel
Nazwa koprocesora |
Pobór mocy (W) |
Minimalna temperatura obudowy |
Maksymalna temperatura obudowy |
Liczba tranzystorów |
Data wprowadzenia |
8087 |
3 |
0°C,32°F |
85°C, 185°F |
45 000 |
1980 |
287 |
3 |
0°C, 32°F |
85°C, 185°F |
45 000 |
1982 |
287XL |
1,5 |
0°C,32°F |
85°C, I85°F |
40 000 |
1990 |
3875X |
1,5 |
0°C,32°F |
85°C,185°F |
120 000 |
1988 |
387DX |
1,5 |
0°C,32°F |
85°C, 185°F |
120 000 |
1987 |
Najprostszy sposób identyfikacji typu zainstalowanego w określonym systemie procesora i koprocesora polega na sprawdzeniu umieszczonych na nich oznaczeń.
Błędy procesora
Chociaż producenci do testowania wytwarzanych przez siebie procesorów stosują specjalistyczne urządzenia, jednak to Ty musisz dokonać ostatecznego sprawdzenia. Najlepszym dostępnym urządzeniem testującym jest w pełni sprawny system. Jeśli ten warunek zostanie spełniony, można w celu sprawdzenia płyty głównej i procesora użyć jednego z programów diagnostycznych napisanych przez różnych twórców oprogramowania lub przez producenta Twojego komputera.
Prawdopodobnie najbardziej znanym błędem jest błąd, który pojawiał się w koprocesorze pierwszych wersji układu Pentium przy wykonywaniu operacji dzielenia liczb zmiennoprzecinkowych. Ten oraz kilka innych błędów zostaną szczegółowo omówione w dalszej części rozdziału.
Ze względy na to, że procesor pełni rolę „mózgu" komputera, w przypadku jego uszkodzenia pozostała część systemu też przestanie funkcjonować. Jeśli podejrzewasz uszkodzenie procesora wtedy w jego miejsce wstaw do gniazda płyty głównej inny egzemplarz pochodzący ze sprawnej płyty współpracującej z procesorem tego samego typu. Może się okazać, że podejrzany procesor jest faktycznie sprawcą problemów. Jeśli jednak system w dalszym ciągu nie działa, wtedy przyczyny problemu należy szukać w innych jego komponentach, takich jak płyta główna, pamięć lub zasilacz. Aby uzyskać więcej informacji na temat rozwiązywania problemów w tego typu komponentach, zapoznaj się z zawartością poświęconych im rozdziałów. Muszę powiedzieć, że w ciągu tych wszystkich lat, w których zajmowałem się rozwiązywaniem problemów i naprawą komputerów PC tylko sporadycznie spotykałem się z uszkodzonymi procesorami.
Chociaż już w samej fabryce w produkowanych systemach może pojawić się kilka problemów, to jednak wywołujące je błędy lub wady konstrukcyjne występują rzadko. W każdym podrozdziale poświęconym kolejnym generacjom procesorów omówiono związane z nimi znane defekty, takie jak słynny błąd koprocesora układu Pentium. Aby uzyskać więcej informacji na temat tych błędów i defektów, należy zapoznać się z kolejnymi podrozdziałami oraz sprawdzać aktualizacje z tym związane i publikowane przez producentów procesorów.
Możliwości aktualizacji procesorów
Wszystkie procesory mogą zawierać wady konstrukcyjne lub błędy. W wielu przypadkach efekty wywołane przez określony błąd mogą być wyeliminowane przez zastosowanie, na poziomie sprzętu lub oprogramowania, poprawek. Firma Intel w przypadku wszystkich swoich procesorów dokumentuje wszelkie błędy i zastosowane poprawki oraz umieszcza na swojej stronie internetowej w postaci instrukcji obsługi procesora o nazwie Specification Update. Większość pozostałych producentów procesorów również zamieszcza na swoich stronach internetowych biuletyny zawierające spis problemów lub specjalnych poprawek oraz aktualizacji dotyczących wytwarzanych przez siebie procesorów.
Dotąd jedynym sposobem usunięcia błędu procesora było zastosowanie poprawki lub jego wymiana na egzemplarz całkowicie sprawny. Obecnie nowa funkcja wbudowana w procesory z serii P6 i P7 takie jak Pentium Pro, Pentium III, Celeron i Pentium 4 umożliwia usuwanie wielu błędów poprzez modyfikację mikrokodu (ang. microcode) procesora. Mikrokod jest właściwie zestawem instrukcji i tabel procesora kontrolującym sposób jego działania. W tego typu procesorach zastosowano nową funkcję nazwaną mikrokodem reprogra-mowalnym (ang. reprogrammable microcode), która pozwala, przy wykorzystaniu aktualizacji mikrokodu, na usunięcie błędów określonego typu. Aktualizacje mikrokodu są zapisywane do pamięci ROM BIOS-u płyty głównej, a następnie, w trakcie wykonywania procedury POST, wprowadzane do procesora. Przy każdym uruchomieniu komputera kod poprawki jest ponownie ładowany do procesora, dzięki czemu uzyskujemy gwarancję, że poprawka błędu procesora zawsze będzie zastosowana.
Aktualizacja mikrokodu dla określonego typu procesora jest przekazywana przez firmę Intel do producenta płyty głównej, który następnie wprowadza go do pamięci ROM BIOS typu Flash. Jest to powód, dla którego zawsze, gdy jest montowany na płycie głównej nowy procesor, należy pamiętać o zainstalowaniu najnowszej wersji jej BIOS-u. Jeśli zakupiony procesor jest nowszy niż wersja mikrokodu zawartego w pamięci ROM BIOS-u, wtedy prawdopodobnie oznacza to, że go nie obsługuje. W takim przypadku należy zajrzeć na stronę internetową producenta płyty głównej, a następnie pobrać i zainstalować najnowszą wersję jej BIOS-u.
Nazwy kodowe procesorów
Firmy AMD, Cyrix i Intel zawsze nadawały nazwy kodowe procesorom, które miały być dopiero wprowadzone do sprzedaży. Z założenia nazwy kodowe nie powinny być ogłaszane publicznie, ale zazwyczaj są. Często można je znaleźć w różnych artykułach publikowanych w Internecie i czasopismach poświęconych procesorom kolejnych generacji. Od czasu do czasu można je nawet odnaleźć w instrukcjach obsługi dołączanych do płyt głównych. Bierze się to stąd, że są one tworzone jeszcze przed oficjalnym wprowadzeniem procesora na rynek. W tabeli 3.23 dla celów porównawczych zebrano nazwy kodowe procesorów.
Warto zauważyć, że nazwy kodowe i pozostałe informacje zamieszczone w powyższych tabelach są wykorzystywane jeszcze przed oficjalnym pojawieniem się procesora w sprzedaży. Po wprowadzeniu go na rynek nazwa kodowa jest wycofywana, a w zamian używa się nazwy marketingowej, pod którą procesor jest sprzedawany. Ze względu na fakt, że wiele nazw odnosi się do procesorów, które jeszcze nie zostały oficjalnie zaprezentowane, zarówno one, jak i parametry procesorów mogą ulec zmianie. W celu zapoznania się z nazwami kodowymi chipsetów należy zajrzeć do rozdziału 4.
Procesory kompatybilne
z procesorami firmy Intel (AMD i Cyrix)
Kilku producentów, w tym firmy AMD i Cyrix, opracowało procesory, które są kompatybilne z procesorami firmy Intel. Dzięki pełnej zgodności, procesory te emulują każdą instrukcję dostępną w procesorach firmy Intel. Wiele z nich posiada również jednakową liczbę końcówek, co oznacza, że mogą być stosowane w każdym systemie współpracującym z procesorami firmy Intel. W przeciwnym razie konieczne jest zastosowanie dedykowanej płyty głównej. Dowolne urządzenie i oprogramowanie zgodne z systemami opartymi na procesorze firmy Intel będzie również współpracowało z systemami wyposażonymi w procesory innych producentów. Aktualnie kilku producentów oferuje procesory kompatybilne z produktami firmy Intel. Najpopularniejsze z nich zostaną omówione poniżej.
Procesory firmy AMD
Firma AMD (ang. Advanced Micro Devices), jako producent własnej serii procesorów kompatybilnych z produktami firmy Intel, odgrywa znaczącą rolę na rynku procesorów klasy Pentium. Kilka lat temu firma AMD popadła w poważny konflikt z firmą Intel, ponieważ skopiowała w swojej wersji procesora 486 mikroprogram procesorów Intela. Ostatecznie spór został załagodzony i aktualnie firma AMD ma podpisaną umowę licencyjną. W 1996 r. firma AMD przejęła NexGen, kolejnego producenta procesorów zgodnych w produktami firmy Intel. Firma NexGen prowadziła prace nad procesorem Nx686, który pod nazwą K6 został wprowadzony do sprzedaży przez AMD. Firma AMD ulepszyła projekt procesora K6, prezentując kolejne procesory — K6-2 i K6-3. Jej najnowsze modele, Athlon XP i Duron, wykorzystały podobne, ale nie takie same rozwiązania dotyczące gniazd współpracujących z procesorami Pentium III i Celeron. Nowsze modele procesorów firmy AMD (Athlon, Duron i Athlon XP) współpracują z gniazdem Socket A zwanym również Socket 462. Najnowszy układ firmy AMD, czyli Athlon 64, jest pierwszym 64-bitowym procesorem przeznaczonym dla komputerów stacjonarnych i korzysta z gniazda Socket 754.
Aby przejrzeć zestawienie procesorów firmy AMD, zapoznaj się z zawartością tabeli 3.2.
Procesory firmy Cyrix
Firma Cyrix w 1997 r. została wykupiona przez firmę National Semiconductor, a dwa lata później przez VIA Technolgies. Wcześniej Cyrix nie dysponował fizyczną możliwością produkcji procesorów. Wszystkie procesory Cyrix były najpierw wytwarzane w zakładach firmy Texas Instruments, a następnie, aż do końca 1998 r., głównie przez firmę IBM. Z początkiem 1999 r. firma National Semiconductor przejęła produkcję procesorów Cyrix. Ostatnio firma National Semiconductor została kupiona przez firmę VIA Technologies.
Wszystkie modele procesorów Cyrix były wytwarzane przez inne firmy, takie jak IBM, która również wprowadziła do sprzedaży pod własną nazwą kilka modeli procesorów 6x86, National Semiconductor i obecnie VIA Technologies. W tabeli 3.2 przedstawiono typy procesorów firm Cyrix i VIA.
PI (086). Procesory pierwszej generacji
Do pierwszej generacji procesorów zaliczają się procesory firmy Intel zastosowane w pierwszych komputerach PC. Firma IBM, jako twórca komputera osobistego, do opracowania projektu zastosowanej w nim płyty głównej wykorzystała procesory i inne układy scalone firmy Intel, ustanawiając tym samym standard, który obowiązywał przez kilka następnych lat.
Procesory 8088 i 8086
W czerwcu 1978 r. firma Intel wprowadziła na rynek procesor oznaczony jako 8086. Układ 8086 był jednym z pierwszych procesorów 16-bitowych dostępnych na rynku. Niemal wszystkie inne procesory wykonane były w architekturze 8-bitowej. Procesor 8086 dysponował 16-bitowymi wewnętrznymi rejestrami i był w stanie wykonywać oprogramowanie nowej generacji wykorzystujące instrukcje 16-bitowe. Poza tym posiadał 16-bitową zewnętrzną magistralę danych, co pozwalało na jednoczesne przesyłanie do pamięci 16 bitów danych.
Magistrala adresowa o szerokości 20-bitów umożliwiała zaadresowanie jednego megabajta pamięci (220). W porównaniu z większością innych procesorów z tamtych czasów wyposażonych w 8-bitowe wewnętrzne rejestry, 8-bitową zewnętrzną magistralę danych i 16-bitową magistralę adresową pozwalającą zaadresować maksymalnie 64 kB pamięci RAM (216), stanowiło to wyraźny postęp.
Niestety w większości ówcześnie powstałych komputerów PC był wykorzystywany procesor 8-bitowy, z którym współpracował 8-bitowy system operacyjny CP/M (ang. Control Program for Microprocessors) i zgodne z nim oprogramowanie. Poza tym sama płyta i układy scalone przeważnie też były oparte na architekturze 8-bitowej. Koszty wytwarzania komputerów w pełni wykorzystujących architekturę 16-bitową (płyta główna i pamięć) były na tyle wysokie, że powodowały ich niewielką obecność na rynku.
Wysoka cena wynikała z konieczności zastosowania zamiast tańszej 8-bitowej, 16-bitowej szyny danych (wymóg procesora 8086).
W tamtym okresie przeważały systemy 8-bitowe, natomiast niski poziom sprzedaży rozwiązań opartych na procesorze 8086 dla firmy Intel oznaczał, że mało kto zamierza płacić za dodatkową wydajność wynikającą z zastosowania architektury 16-bitowej. W efekcie firma wprowadziła do sprzedaży uproszczoną wersję procesora 8086 o nazwie 8088. W układzie 8088 właściwie zredukowano tylko szerokość szyny danych do 8 bitów, przez co w zakresie operacji wejścia-wyjścia stał się on procesorem 8-bitowym. Ze względu na fakt pozostawienia 16-bitowych rejestrów wewnętrznych i 20-bitowej magistrali adresowej procesor 8088 wykonywał programy 16-bitowe i potrafił zaadresować 1 MB pamięci RAM.
Z tego też powodu firma IBM wykorzystała procesor 8088 w swoim komputerze IBM PC (już po latach została skrytykowana za fakt użycia procesora 8-bitowego 8088, zamiast 16-bitowego 8086). Patrząc na to z perspektywy czasu, można powiedzieć, że była to bardzo rozsądna decyzja. Firma IBM nawet zamieszczała w ówczesnych reklamach swojego nowego komputera informację o zastosowaniu szybkiego procesora 16-bitowego. Firma IBM mogła to zrobić, ponieważ procesor 8088 nadal umożliwiał obsługę tych samych wspaniałych programów 16-bitowych co układ 8086, tyle tylko, że działały one trochę wolniej. W rzeczywistości programiści powszechnie uważali procesor 8088 za układ 16-bitowy. Wynikało to z stąd, że żaden program nie był w stanie odróżnić procesora 8088 od modelu 8086. Tym sposobem firma IBM mogła wprowadzić do sprzedaży komputer PC, w którym działały 16-bitowe programy nowej generacji i jednocześnie nadal wykorzystywane były urządzenia oparte na architekturze 8-bitowej. Dzięki temu komputer IBM PC w chwili wprowadzenia na rynek był tańszy niż najpopularniejszy wtedy komputer PC — Apple II. Komputer IBM PC wyposażony tylko w 16 kB pamięci RAM kosztował wtedy 1265 dolarów, natomiast komputer Apple II w podobnej konfiguracji kosztował 1355 dolarów.
Chociaż procesor 8088 został zaprezentowany w czerwcu 1979 r., to jednak wykorzystujący go oryginalny komputer IBM PC pojawił się w sprzedaży dopiero w sierpniu 1981 r. W tamtych czasach tak znaczne opóźnienia we wprowadzaniu komputerów wykorzystujących nowy procesor wyprodukowany o wiele wcześniej były częstą sytuacją. Aktualnie tego typu przypadki nie mają racji bytu, ponieważ nowe procesory są wykorzystywane w systemach, które pojawiają się w sprzedaży nawet tego samego dnia.
Procesor 8088 zastosowany w komputerze IBM PC był taktowany zegarem 4,77 MHz, natomiast czas potrzebny na wykonanie typowej instrukcji wynosił 12 cykli.
Użytkownicy komputerów często zastanawiają się, dlaczego pomimo możliwości adresowania przez procesor 8088 do 1 MB pamięci RAM istnieje ograniczenie pamięci konwencjonalnej do 640 kB. Ograniczenie to wynika z faktu, że firma IBM zarezerwowała dla kart rozszerzeń i BIOS-u 348 kB górnego obszaru pamięci, o pojemności 1024 kB adresowanej przez procesor 8088. Dolna jej część jest pamięcią konwencjonalną (640 kB), z której korzystają system operacyjny DOS i aplikacje.
Procesory 80186 i 80188
Po wprowadzeniu do sprzedaży procesorów 8086 i 8088 firma Intel zaprojektowała ulepszone ich wersje zawierające zintegrowaną obsługę niektórych komponentów.
Związek między procesorami 80186 i 80188 jest taki sam jak w przypadku procesorów 8086 i 8088. Procesor 80188 właściwie jest 8-bitową wersją układu 80186. Zaletą obu nowych modeli jest to, że zawierają w sobie od 15 do 20 komponentów stosowanych w systemach opartych na procesorach 8086 i 8088, dzięki czemu w znaczący sposób zmniejszają ilość elementów systemu. Procesory 80186 i 80188 były wykorzystywane w zaawansowanych, jak na tamte czasy, kartach rozszerzeń takich jak karty sieciowe.
Koprocesor 8087
Razem z procesorem 8086 pojawił się koprocesor (jednostka zmiennoprzecinkowa) oznaczony jako 8087 zwany również numerycznym procesorem danych (ang. numeric data procesor — NDP) lub po prostu koprocesorem matematycznym. Koprocesor 8087 miał za zadanie wykonywać złożone operacje matematyczne z szybkością będącą wielokrotnością częstotliwości pracy procesora. Podstawową korzyścią wynikającą z zastosowania tego koprocesora była zwiększona wydajność w przypadku programów takich jak arkusz kalkulacyjny, które wykonywały operacje na liczbach.
P2 (286). Procesory drugiej generacji
Druga generacja procesorów przeznaczonych dla komputerów PC spowodowała znaczny postęp związany z szybkością i wydajnością systemów. Wprowadzenie procesorów 286 ostatecznie wpłynęło na przejście z architektury 8-bitowej na 16-bitową. W dalszej części rozdziału zawarto szczegółowe omówienie procesora drugiej generacji — 286.
Procesor 286
Z procesorem Intel 80286 (stosowany skrót 286) nie były związane problemy z kompatybilnością które tak się dało odczuć w przypadku procesorów 80186 i 80188. Model 286 zaprezentowany po raz pierwszy w 1982 r. został zastosowany w komputerze IBM PC AT (ang. Advanced Technology). Spośród innych producentów komputerów, którzy wytwarzali systemy nazwane później klonami komputera IBM, niektórzy zaczęli nazywać je systemami kompatybilnymi z AT lub komputerami klasy AT.
Po zakończeniu projektu komputera AT firma IBM wybrała dla niego procesor 286. Taka decyzja spowodowana była faktem kompatybilności procesora z układem 8088 wykorzystywanym w komputerach PC i XT. Wynika z tego, że programy napisane dla starszych modeli powinny działać z procesorem 286. Procesor 286 byl wiele razy szybszy od procesora 8088 stosowanego w komputerze XT i oferował znaczny wzrost wydajności komputerów PC wykorzystywanych w biznesie. Szybkość przetwarzania lub przepustowość oryginalnego systemu AT (taktowanego zegarem 6 MHz) była pięć razy wyższa niż komputera PC pracującego z częstotliwością 4,77 MHz. Na rysunku 3.33 pokazano płytkę procesora 286.
Komputery oparte na procesorze 286 są szybsze od swoich poprzedników z kilku powodów. Główny jest taki, że procesor 286 przetwarza instrukcje w sposób o wiele bardziej wydajny. W przypadku procesorów 8086 i 8088, czas wykonania przeciętnej instrukcji wynosi 12 cykli, natomiast procesor 286 potrzebuje na to tylko 4,5 cykla. Ponadto, procesor 286 jest w stanie, za pomocą zewnętrznej magistrali danych, jednocześnie przekazywać do 16 bitów danych, co stanowi dwukrotnie większą ilość niż w przypadku procesora 8088.
Procesor 286 potrafi pracować w dwóch trybach — rzeczywistym i chronionym. Te dwa tryby są na tyle odmienne, że sprawiają wrażenie występowania w procesorze 286 dwóch niezależnych układów. W przypadku trybu rzeczywistego procesor 286 właściwie zachowuje się identycznie jak model 8086, a ponadto jest w pełni kompatybilny z kodem wykonawczym instrukcji (ang. object-code compatible) procesorów 8086 i 8088. Na tego typu procesorze, bez konieczności modyfikacji, mogą być wykonywane programy napisane dla innego procesora, a dodatkowo każda instrukcja systemowa jest wykonywana w identyczny sposób.
Procesor 286, pracujący w trybie chronionym, jest zupełnie czymś nowym. W jego przypadku, program potrafiący wykorzystać nowe możliwości procesora ,.jest przekonany", że ma dostęp do pamięci o pojemności 1 GB (po uwzględnieniu pamięci wirtualnej). Procesor 286 może jednak zaadresować tylko 16 MB pamięci RAM. Poważną wadą nowego procesora jest brak możliwości przełączenia go z trybu chronionego na rzeczywisty bez konieczności wykonania restartu sprzętowego systemu (ang. warm reboot). Niezależnie od tego jest możliwe przełączanie z trybu rzeczywistego w chroniony bez potrzeby wykonania restartu. Podstawowym ulepszeniem zastosowanym w procesorze 386 jest możliwość przełączania przez programy trybu pracy z rzeczywistego na chroniony i odwrotnie. Aby uzyskać więcej informacji na temat trybów pracy procesora, zajrzyj do punktu „Tryby pracy procesora" znajdującego się na początku rozdziału.
Do momentu wprowadzenia systemu Windows 3.0 kompatybilnego z procesorem 286, sprzedano niewielką ilość oprogramowania wykorzystującego jego możliwości. W tamtym czasie największą sprzedaż miał procesor 386. Pomimo to, model 286 nadal pozostaje pierwszym procesorem firmy Intel, w którym próbowano wprowadzić obsługę wielozadaniowości, dzięki której możliwe jest uruchomienie kilku programów jednocześnie.
Koprocesor 80287
Wewnętrzna budowa koprocesora 80287 jest identyczna jak w przypadku układu matematycznego 8087, chociaż jego końcówki służące do instalacji na płycie głównej są inne. Zarówno układ 80287, jak i 8087 funkcjonują w ten sam sposób.
W większości systemów, w celu uzyskania częstotliwości pracy procesora 80286, następuje podział częstotliwości systemu przez dwa. Koprocesor 80287 dokonuje podziału wartości zegara systemowego przez trzy. Z tego też powodu w większości systemów AT koprocesor 80287 jest taktowany częstotliwością stanowiącą 1/3 szybkości zegara systemowego, co jednocześnie odpowiada 2/3 częstotliwości pracy procesora 80286. Ze względu na fakt, że układy 286 i 287 są asynchroniczne, występujący pomiędzy nimi interfejs nie jest tak wydajny jak w przypadku układów 8088 i 8087.
P3 (386). Procesory trzeciej generacji
Pojawienie się procesorów trzeciej generacji prawdopodobnie wiąże się z największym przełomem, który nastąpił od czasów pojawienia się pierwszego komputera PC. Wynikał on z faktu przejścia z procesorów wykonujących operacje 16-bitowe na prawdziwe procesory 32-bitowe. Procesory trzeciej generacji w swoim czasie były bardzo zaawansowane technologicznie, co spowodowało, że dopiero po 10 latach sporą popularność zdobyły 32-bitowe systemy operacyjne i aplikacje. Jednak wtedy tego typu układy należały już do przeszłości. W dalszej części rozdziału zostaną szczegółowo omówione procesory trzeciej generacji.
Procesory 386
Procesor Intel 80386 (zazwyczaj określany jako 386) wywołał w branży komputerowej spore zamieszanie. Wynikało ono ze wzrostu wydajności komputerów osobistych wyposażonych w ten procesor. W porównaniu z procesorami 8088 i 286 model 386 oferował wyższą wydajność w prawie wszystkich typach operacji.
Procesor 386 jest w pełni 32-bitowym układem zoptymalizowanym do wykonywania operacji z dużą szybkością oraz do zastosowań w wielozadaniowych systemach operacyjnych. Procesor 386 został zaprezentowany przez firmę Intel w 1985 r„ ale w pierwszych komputerach został zastosowany pod koniec 1986 r. i na początku roku następnego. Wykorzystano go w komputerze Compaq Deskpro 386 oraz w systemach kilku innych producentów. W późniejszym okresie procesor 386 został wykorzystany w komputerze PS/2 Model 80 firmy IBM.
Procesor 386 potrafi wykonywać instrukcje trybu rzeczywistego procesorów 8086 i 8088. ale potrzebuje na to mniejszą ilość cykli zegara. Poza tym. w wydajny sposób przetwarza instrukcje układu 286. Na wykonanie przeciętnej instrukcji potrzebował około 4,5 cykli zegara. A zatem, pod względem szybkości procesory 286 i 386 właściwie pracowały z prawie z taką samą częstotliwością zegara. Jednak procesor 386 oferował lepszą wydajność w kilku innych aspektach związanych głównie z dodatkowymi możliwościami programowymi (trybami pracy) i znacznie ulepszonym modułem zarządzającym pamięcią (ang. memory management unit — MMU). Na rysunku 3.34 została pokazana płytka procesora 386.
Rysunek 3.34.
Płytka procesora 386. Zdjęcie wykorzystane za zgodą firmy Intel Corporation
Procesor 386 może przełączać się w tryb chroniony, który jest kontrolowany z poziomu oprogramowania, dlatego też nie jest konieczne wykonanie restartu komputera. Taka możliwość sprawia, że stosowanie trybu chronionego stało się bardziej praktyczne. Ponadto, procesor 386 dysponuje nowym trybem pracy znanym jako wirtualny tryb rzeczywisty. Tryb ten pozwala na jednoczesne uruchomienie w trybie rzeczywistym kilku sesji wykonywanych w trybie chronionym.
Tryb chroniony procesora 386 jest w pełni kompatybilny z trybem chronionym procesora 286. Tryb chroniony występujący w obu modelach często jest określany ich naturalnym trybem pracy. Wynika to stąd, że oba procesory zostały zaprojektowane z myślą o zaawansowanych systemach operacyjnych takich jak Windows NT/2000/XP. które działają tylko w trybie chronionym. Firma Intel, dzięki MMU, poszerzyła w trybie chronionym procesora 386 możliwości adresowania pamięci. Moduł MMU dysponuje zaawansowanym stronicowaniem pamięci oraz funkcją przełączania programów. Obie funkcje są rozszerzeniem możliwości układu MMU znanego z procesora 286, dlatego też na poziomie kodu systemowego procesor 386 pozostał w pełni zgodny ze swoim poprzednikiem.
Wirtualny tryb rzeczywisty procesora 386 również był nowością. Procesor, pracując w tym trybie, w trakcie symulowania operacji wykonywanych w trybie rzeczywistym procesora 8086 mógł zastosować ochronę pamięci na poziomie sprzętowym. W związku z tym istniała możliwość jednoczesnego uruchomienia wielu kopii DOS-a lub innego systemu operacyjnego, przy czym każda z nich była umieszczona w chronionym obszarze pamięci. Jeśli program znajdujący się w określonym segmencie zawiesił się, nie wpływało to na resztę chronionego systemu.
Istniało kilka typów procesora 386. Niektóre z nich były mniej wydajne, natomiast inne charakteryzowały się większym poborem mocy. W dalszej części rozdziału znajduje się omówienie kilku modeli procesorów z serii 386 oraz występujących pomiędzy nimi różnic.
Procesor 386DX
Procesor 386DX był pierwszym wprowadzonym na rynek przez firmę Intel przedstawicielem rodziny 386. Procesor 386 jest w pełni 32-bitowym układem posiadającym 32-bitowe rejestry wewnętrzne, 32-bitową wewnętrzną magistralę danych oraz 32-bitową zewnętrzną magistralę danych. Składa się z 275 000 tranzystorów wykonanych w technologii VLSI (ang. very large scalę integration — integracja bardzo dużej skali). Procesor 386 jest umieszczony w 132-końcówkowej obudowie i jest zasilany prądem o natężeniu, w przybliżeniu, 400 mA, co wiąże się z mniejszym zużyciem energii niż w przypadku procesora 8086. Procesor 386 pobiera mniej energii, ponieważ jest wykonany z materiałów o strukturze CMOS (ang. Complementary MetalOxide Sernicondutor). Struktura CMOS powoduje, że urządzenia cechują się znacznie niższym poborem mocy.
Procesor 386 był dostępny w wersjach taktowanych częstotliwościami z zakresu od 16 do 33 MHz. Inni producenci, tacy jak AMD i Cyrix, oferowali porównywalne typy procesorów pracujących z częstotliwością do 40 MHz.
Procesor 386DX może zaadresować maksymalnie 4 GB pamięci RAM. Zintegrowany z nim menedżer pamięci powoduje, że aplikacja z zaimplementowaną obsługą pamięci o tak dużych pojemnościach „ma wrażenie", że została uruchomiona na systemie wyposażonym do 64 TB pamięci operacyjnej. Terabajt (TB) odpowiada 1 099 511 627 776 bajtom lub około 1 000 GB pamięci.
Procesor 386SX
Procesor 386SX był przeznaczony systemów, które w cenie systemów opartych na układzie 286 miały oferować możliwości procesora 386. Podobnie jak 286, procesor 386SX podczas komunikowania się z innymi komponentami systemu takimi jak pamięć, jest ograniczony tylko do 16-bitów. Jednak poza tym. procesor 386SX posiada identyczną budowę wewnętrznąjak układ DX. Ponadto posiada 32-bitowe rejestry wewnętrzne, dlatego też można na nim uruchamiać aplikacji 32-bitowe. Procesor 386SX, zamiast pełnego 32-bitowego adresowania pamięci obecnego w procesorze 386, posługuje się podobnym jak w układzie 286 24-bitowym adresowaniem. W związku z tym, procesor 386SX, w porównaniu z układem 386DX, który może zaadresować do 4 GB pamięci RAM jest w stanie współpracować z pamięcią o maksymalnej pojemności 16 MB.
Zanim produkcja procesora 386SX została przerwana był on dostępny w wersjach taktowanych z częstotliwościami od 16 do 33 MHz.
Ze względu na zastosowanie w procesorze 386SX lepszego modułu MMU i dodatkowo wirtualnego trybu rzeczywistego nastąpił kres stosowania procesora 286. Przy wykorzystaniu systemów takich jak Windows lub OS/2 działających z procesorem 386SX możliwe było jednoczesne uruchomienie kilku programów DOS-owych. W porównaniu z procesorem 286 i starszymi modelami możliwość uruchamiania z procesorem 386SX aplikacji specjalnie napisanych dla architektury procesora 386 była jego kolejną zaletą. Przykładowo, system Windows 3.1 działa prawie tak samo dobrze z procesorem 386SX, jak 386DX.
Procesor 386SL
Procesor 386SL jest kolejnym przedstawicielem rodziny 386. Procesor ten, charakteryzujący się niskim poborem mocy, dysponował identycznymi możliwościami co model 386SX, ale dodatkowo był przeznaczony do zastosowań w komputerach przenośnych, w których niskie zużycie energii odgrywa istotną rolę. Procesor SL oferował specjalne funkcje związane z zarządzaniem energią mające szczególne znaczenie dla systemów zasilanych z baterii. Procesor ten dysponował również kilkoma trybami wstrzymywania pracy systemu mającymi za zadanie zmniejszenie poboru mocy.
Procesor 386SL był wyposażony w architekturę poszerzoną o system SMI (ang. System Management Interr-rupt), który umożliwiał uzyskanie dostępu do funkcji zarządzających zużyciem energii. Poza tym. dołączono do niego specjalną obsługę funkcji pamięci rozszerzonej LIM (ang. Lotus Intel Microsoft) oraz kontroler pamięci Cache. Kontroler pamięci podręcznej został zaprojektowany w celu obsługi zewnętrznej pamięci Cache procesora o pojemności od 16 do 64 kB.
W porównaniu z procesorem 386DX liczącym 275 000 tranzystorów, w procesorze 386SL, wskutek zastosowania dodatkowych funkcji, było ich 855 000. Procesor 386SL był dostępny w wersji taktowanej zegarem 25 MHz.
Firma Intel wraz z procesorem 386SL przeznaczonym dla komputerów przenośnych, wprowadziła do sprzedaży układ obsługi operacji wejścia-wyjścia o nazwie 82360SL. Układ oferował wiele typowych funkcji związanych z urządzeniami peryferyjnymi takimi jak porty szeregowe i równoległe, kontroler DMA (ang. Direct Memory Access — bezpośredni dostęp do pamięci), kontroler przerwań oraz układ logiczny zarządzający energią i współpracujący z procesorem 386SL. W celu stworzenia idealnego rozwiązania spełniającego wymagania komputerów przenośnych (niewielkie rozmiary i niskie zużycie energii) układ 82360SL współpracował z procesorem 386SL.
Koprocesor 80387
Chociaż koprocesor 80387 może pracować w trybie asynchronicznym, to jednak systemy oparte na procesorze 386 były zaprojektowane tak, że w efekcie koprocesor był taktowany z tą samą częstotliwością co procesor. W przeciwieństwie do koprocesora 287, który właściwie był układem 8087 z inną ilością końcówek wykorzystywanych przy instalacji na płycie głównej komputera AT, koprocesor 80387 był bardzo wydajnym układem specjalnie zaprojektowanym z myślą o współpracy z procesorem 386.
Wszystkie koprocesory 387 oparte były na technologii CMOS charakteryzującej się niskim poborem energii. Opracowano dwie wersje koprocesora 387 — 387DX i 387SX. Pierwsza z nich była przystosowana do współpracy z procesorem 386DX, natomiast druga z procesorami 386SX, SL i SLC.
Firma Intel oferowała koprocesor 387DX w kilku wersjach o różnych szybkościach. W chwili, gdy opracowano wersję z zegarem 33 MHz, w jej przypadku, w celu zmniejszenia długości ścieżek sygnałowych procesora, wymagane było już zastosowanie maski o mniejszych rozmiarach. Tym sposobem uzyskano wzrost wydajności procesora w przybliżeniu o 20%.
Ze względu na opóźnienia związane z projektem koprocesora 387, niektóre z pierwszych systemów ^^_\ opartych na procesorze 386 były wyposażone w gniazdo koprocesora 287. Wydajność takiego roz-wiązania pozostawiała jednak wiele do życzenia.
Instalacja koprocesora 387 jest prosta, ale należy zwrócić uwagę na odpowiednie włożenie go do gniazda. W przeciwnym razie może dojść do uszkodzenia układu. Najczęstszym powodem przepalonych końcówek koprocesorów 387DX była ich niewłaściwa instalacja. W wielu systemach instalacja koprocesora różniła się od montażu podobnej wielkości układów scalonych. Aby uniknąć uszkodzenia koprocesora 387DX podczas jego instalacji, należy postępować zgodnie z zaleceniami producenta. Gwarancja udzielona przez firmę Intel nie obejmuje przypadków związanych z nieprawidłową instalacją.
Kilku producentów opracowało własną wersję koprocesora 387. Niektóre z nich były reklamowane jako szybsze od oryginalnego układu firmy Intel. Ogólna kompatybilność tych koprocesorów była wystarczająco dobra.
P4 (486). Procesory czwartej generacji
Wprowadzenie trzeciej generacji procesorów miało przełomowe znaczenie. Począwszy od czwartej generacji, dokonano więcej ulepszeń niż opracowano zupełnie nowych projektów. Pomimo to, firmy takie jak Intel, AMD i inne dołożyły starań, aby w przypadku czwartej generacji dosłownie podwoić wydajność procesorów. W dalszej części rozdziału zostały omówione procesory czwartej generacji wyprodukowane przez firmę Intel, AMD i inne.
Procesory 486
W wyścigu o miano króla szybkości procesor 80486 firmy Intel (zazwyczaj określany jako 486) był kolejnym poważnym krokiem do przodu. Dodatkowa wydajność procesora 486 spowodowało ogromny postęp w branży oprogramowania. Dziesiątki milionów kopii systemu Windows i miliony kopii systemu OS/2 zostało sprzedanych głównie dlatego, że pojawienie się procesora 486 pozwoliło przekonać zwykłych użytkowników komputerów do interfejsu graficznego systemu Windows lub OS/2.
W porównaniu z procesorem 386, taktowanym takim samym zegarem, cztery podstawowe właściwości sprawiły, że procesor 486 był, w przybliżeniu, dwukrotnie szybszy. Są to:
Zmniejszony czas wykonywania instrukcji. W porównaniu z procesorem 386, w którym wykonanie pojedynczej instrukcji zajmuje średnio ponad cztery cykle, w procesorze 486 wystarczą tylko dwa. Wersje procesora 486, takie jak DX2 i DX4 z zastosowanym mnożnikiem częstotliwości, pozwalają dodatkowo obniżyć ilość cykli potrzebnych do wykonania instrukcji do około dwóch.
Wewnętrzna pamięć Cache pierwszego poziomu (Level 1). Wbudowana pamięć podręczna charakteryzuje się skutecznością trafień wynoszącą 90 - 95%, która określą jak często występują operacje odczytu nie wymagające cykli oczekiwania. Zastosowanie zewnętrznej pamięci podręcznej może dodatkowo zwiększyć ilość trafień.
Cykle pamięci pracującej w trybie burst. Standardowy czas transferu z pamięci 32 bitów danych (4 bajtów) zajmuje 2 cykle zegara.
Po zakończeniu transferu takiej ilości danych w ciągu następnego cyklu można przesłać kolejne 32 bity danych (4 bajty), przy czym maksymalna ilość danych nie może przekroczyć 12 bajtów lub trzech operacji przesyłania. A zatem, na przesłanie maksymalnie 16 bajtów ciągłego obszaru danych sekwencyjnie odczytywanych z pamięci zamiast ośmiu lub większej ilości cykli wystarczy tylko 5 cykli. Jeśli przy każdej operacji przesłania danych są one pobierane w ilości 8 lub 16 bitów, wtedy uzyskany efekt może być jeszcze lepszy.
♦ Wbudowany koprocesor (synchroniczny) o poszerzonych możliwościach (niektóre wersje). Koprocesor jest zsynchronizowany z procesorem i wykonuje operacje zmiennoprzecinkowe o kilka cykli szybciej niż poprzednia wersja koprocesora. W porównaniu z zewnętrznym koprocesorem 387, układ zintegrowany z procesorami z serii DX osiąga średnio od dwóch do trzech razy lepszą wydajność.
Procesor 486 jest prawie dwukrotnie szybszy od procesora 386, natomiast układ 386DX-40 dorównuje procesorowi 486SX-20. Dzięki temu znacznie wzrosło zapotrzebowanie na procesor 486, które wynikało również z tego, że w późniejszym okresie o wiele prostsza była jego aktualizacja do nowszych modeli DX2 i DX4. Można teraz zrozumieć, dlaczego pojawienie się procesora 486 spowodowało szybkie zniknięcie z rynku jego poprzednika.
Większość modeli procesora 486 była taktowana kilkoma częstotliwościami mieszczącymi się w zakresie od 16 do 133 MHz. Poza tym, procesory 486 nieznacznie różniły się pomiędzy sobą ilością końcówek. Modele DX, DX2 i SX były wyposażone w tę samą ilość 168 końcówek, natomiast procesory w wersji OverDrive posiadały również 168 końcówek lub. w przypadku specjalnie zmodyfikowanej wersji (czasami określanej też jako 487SX), 169 końcówek. Jeśli płyta główna jest wyposażona w dwa gniazda, wtedy jedno z nich prawdopodobnie współpracuje z układami 168-końcówkowymi, natomiast drugie, OverDrive, jest zgodne z układem 169-końcówkowym. Większość nowszych płyt głównych współpracujących z procesorem 486 i wyposażonych w pojedyncze gniazdo typu ZIF umożliwia instalację dowolnego typu układu z serii 486 (z wyjątkiem modelu DX4). Procesor 486DX4 różni się od innych tym, że zamiast napięcia 5 V (w tym czasie stosowanego przez większość procesorów) jest zasilany napięciem 3,3 V.
Procesor taktowany częstotliwością nominalną pozwala też na pracę z mniejszymi szybkościami. Przykładowo, procesor 486DX4 taktowany zegarem 100 MHz po zainstalowaniu na płycie głównej pracującej z częstotliwością 25 MHz działa z szybkością 75 MHz. Należy zwrócić uwagę na to, że rdzeń procesorów DX2 czy OverDrive pracuje z dwukrotnie wyższą częstotliwością niż płyta główna, natomiast procesory DX4 są taktowane częstotliwościami uzyskanymi po pomnożeniu częstotliwości pracy płyty głównej przez 2, 2,5 lub 3. W tabeli 3.24 zebrano różne zestawy częstotliwości pracy wynikające z instalacji procesorów DX 2 lub DX4 na płytach głównych taktowanych różnymi częstotliwościami.
Tabela 3.24. Porównanie częstotliwości procesorów Intel DX 2 i DX4 z częstotliwościami płyt głównych (magistrali procesora)
Częstotliwość magistrali procesora (MHz) |
Częstotliwość procesorów DX2/DX4 (mnożnik x2) (MHz) |
Częstotliwość procesorów DX4 (mnożnik x2,S) (MHz) |
Częstotliwość procesorów DX4 (mnożnik x3) (MHz) |
16 |
32 |
40 |
48 |
20 |
40 |
50 |
60 |
25 |
50 |
63 |
75 |
33 |
66 |
83 |
100 |
40 |
80 |
100 |
120 |
50 |
100 |
— |
— |
Wewnętrzny mnożnik procesora DX4 jest kontrolowany przez układ CLKMUL (mnożnik zegara), a dokładniej przez końcówkę R-17 (gniazdo Socket 1) lub S-18 (gniazda Socket 2, 3 lub 6). W większości przypadków za konfigurację tych końcówek będą odpowiadały jedna lub dwie zworki umieszczone na płycie głównej niedaleko gniazda procesora. Jeśli jest możliwa zmiana konfiguracji końcówek, wtedy powinna być ona opisana w instrukcji obsługi płyty głównej.
Z procesorem DX4-100 jest związany pewien interesujący fakt, a mianowicie po ustawieniu na płycie głównej częstotliwości 50 MHz może on pracować z szybkością równą 100 MHz. Dzięki temu ma się do dyspozycji bardzo szybką magistralę pamięci pracującą z tą samą częstotliwością odpowiadającą częstotliwości procesora taktowanego zegarem 100 MHz z zastosowanym mnożnikiem o wartości 3.
Wiele płyt głównych wyposażonych w szynę VL-Bus pozwala na pracę w trybie buforowanym oraz dodawanie cykli oczekiwania lub nawet, dla zachowania kompatybilności, na selektywny wybór częstotliwości pracy samej magistrali VL-Bus. W większości przypadków tego typu magistrale nie działają dobrze przy częstotliwości 50 MHz. Aby sprawdzić sposób konfiguracji płyty głównej, należy zajrzeć do dokumentacji do niej dołączonej albo, nawet lepiej, do dokumentacji chipsetu.
W trakcie aktualizacji systemu należy upewnić się, że instalowany procesor jest obsługiwany przez gniazdo płyty głównej. Miało to szczególne znaczenie w przypadku instalacji w starszych systemach procesora DX4. W tym przypadku konieczne było zastosowanie specjalnej karty służącej do obniżenia napięcia do 3,3 V. Założenie procesora DX4 w gnieździe zasilanym napięciem 5 V powodowało jego uszkodzenie! Aby uzyskać więcej informacji na temat gniazd procesorów, należy zapoznać się z zawartością wcześniejszych podrozdziałów.
Procesor 486DX
Pierwsza wersja procesora 486DX została zaprezentowana 10 kwietnia 1989 r., natomiast systemy go wykorzystujące po raz pierwszy pojawiły się w 1990 r. Pierwsze model procesora 486DX były taktowane zegarem 25 MHz, a późniejsze z częstotliwościami wynoszącymi 33 i 50 MHz. Początkowo procesor 486DX był dostępny tylko w wersji 168-końcówkowej (PGA) zasilanej napięciem 5 V. W późniejszym okresie pojawiła się wersja 196-końcówkowa zasilana tym samym napięciem umieszczona w obudowie PQFP (ang. plastic ąuadfiatpack) oraz wersja 208-końcówkowa zasilana napięciem 3,3 V w obudowie SQFP (ang. smali ąuad fiat pack). Oba typy obudów zostały zastosowane w poszerzonej wersji SL, która została opracowana głównie z myślą o komputerach przenośnych, w których duże znaczenie ma oszczędność energii.
W porównaniu ze swoimi poprzednikami procesor 486DX wyróżnia się dwoma cechami:
Procesor 486DX zawiera takie układy jak koprocesor, kontroler pamięci podręcznej oraz zintegrowaną pamięć Cache.
Procesor 486 został zaprojektowany tak, aby jego aktualizacja i instalacja była prostsza. Poza tym, dla większości systemów była dostępna wersja OverDrive taktowana podwójną częstotliwością pracy płyty głównej.
Procesor 486DX był wykonywany przy użyciu technologii CMOS charakteryzującej się niskim zużyciem energii. Posiada 32-bitowe rejestry wewnętrzne, 32-bitową zewnętrzną magistralę danych oraz 32-bitową magistralę adresową. Wymienione magistrale odpowiadają temu, co znajduje się w procesorze 386DX. Szerokość rejestrów wewnętrznych określona jako 32-bitowa jest pierwszym parametrem, który został wymieniony w reklamach procesorów. Procesor DX składa się z 1,2 miliona tranzystorów umieszczonych na krzemowej płytce o powierzchni nie przekraczającej powierzchni paznokcia kciuka. W porównaniu z procesorami 386 jest to ponad czterokrotnie większa liczba tranzystorów, co powinno być wyraźnym potwierdzeniem mocy obliczeniowej procesora 486. Na rysunku 3.35 została pokazana płytka procesora 486.
Standardowy procesor 486DX składa się z jednostki centralnej, jednostki zmiennoprzecinkowej (koprocesora), modułu zarządzającego pamięcią oraz kontrolera pamięci podręcznej wraz z pamięcią Cache o pojemności 8 kB. Wskutek zastosowania wewnętrznej pamięci podręcznej i bardziej wydajnej jednostki centralnej, procesory z rodziny 486 są w stanie wykonywać pojedyncze instrukcje w czasie wynoszącym średnio dwa cykle. Wartość tę można porównać z procesorami z rodziny 286 i 386, w przypadku których było to średnio 4,5 cykla, natomiast średni czas wykonywania pojedynczej instrukcji przez procesory 8086 i 8088 wynosił 12 cykli. Wynika z tego, że przy określonej częstotliwości (MHz), procesor 486 jest w przybliżeniu dwukrotnie wydajniejszy niż procesor 386. Procesor 486SX taktowany zegarem 16 MHz jest prawie tak szybki jak system z procesorem 386DX pracujący z częstotliwością 33 MHz, natomiast model 486SX z zegarem 20 MHz pracuje równie wydajnie jak procesor 386DX taktowany zegarem 40 MHz. Każdy szybszy model procesora 486 jest już znacznie wydajniejszy od procesorów 386.
Procesor 486 pod względem zestawu instrukcji jest w pełni kompatybilny z poprzednimi procesorami firmy Intel takimi jak 386, ale dodatkowo oferuje kilka nowych instrukcji, z których większość jest związana z kontrolowaniem pracy pamięci podręcznej.
Podobnie jak w przypadku procesora 386DX, procesor 486 może zaadresować maksymalnie 4 GB pamięci RAM i zarządzać pamięcią wirtualną o rozmiarze 64 TB. Procesor 486 w pełni obsługuje trzy tryby pracy występujące w procesorze 386 — rzeczywisty, chroniony i wirtualny tryb rzeczywisty.
Rysunek 3.35.
Płytka procesora 486. Zdjęcie wykorzystane za zgodą firmy Intel Corporation
Tryb rzeczywisty. W tym trybie procesor 486, podobnie jak układ 386, wykonuje programy zgodne z architekturą procesora 8086.
Tryb chroniony. W tym trybie procesor 486, podobnie jak układ 386, oferuje zaawansowane funkcje stronicowania pamięci oraz przełączania programów.
Wirtualny tryb rzeczywisty. W tym trybie w trakcie symulowania trybu rzeczywistego procesora 8086 możliwe jest uruchomienie wielu kopii systemu DOS lub innych systemów operacyjnych. W przypadku takich systemów operacyjnych jak Windows lub OS/2 możliwe jest, w przypadku procesora 486
z zastosowaną sprzętową ochroną pamięci, jednoczesne uruchamianie programów zarówno 16-bitowych jak i 32-bitowych. Jeśli jeden program zawiesi się, pozostała część systemu jest chroniona, dzięki czemu można różnymi metodami, zależnymi od rodzaju aplikacji, przywrócić jej działanie bez wpływu na resztę programów.
Procesory 486DX mają wbudowany koprocesor, który jest też określany terminem MCP (ang. math coproces-sor) lub FPU (ang. floating point unit). Tego typu procesory znacznie się różnią od poprzednich procesorów firmy Intel, które w celu szybszego wykonywania złożonych operacji zmiennoprzecinkowych wymagały zastosowania koprocesora. Koprocesor wbudowany w procesory 486 DX jest, „z punktu widzenia oprogramowania", w 100% kompatybilny z zewnętrznym koprocesorem 387 współpracującym z procesorami 386, a ponadto charakteryzuje się ponad dwukrotnie lepszą wydajnością. Koprocesor jest zsynchronizowany z głównym procesorem i na wykonanie większości instrukcji potrzebuje o połowę mniej cykli niż procesor 386.
Procesor 486SL
Procesor 486SL był niezależnym układem, który przez krótki okres czasu dostępny był w sprzedaży. Rozszerzenia zastosowane w wersji SL zostały również dodane do wszystkich modeli procesora 486 (SX. DX, DX2). przez co nazywane są procesorami poszerzonymi o możliwości wersji SL. Rozszerzenia dostępne w wersji SL związane są ze specjalnym projektem zawierającym funkcje zapewniające zmniejszenie zużyciae energii.
Procesory w wersji SL początkowo były projektowane z myślą o komputerach przenośnych zasilanych z baterii, ale później zostały również wykorzystane w komputerach stacjonarnych. Procesory wyposażone w funkcje SL wykorzystują specjalne metody zarządzania energią takie jak tryb uśpienia i obniżania częstotliwości zegara, mające za zadanie, w razie konieczności, zmniejszenie poboru mocy. Tego typu procesory stosowane byty również w wersjach zasilanych napięciem 3,3 V.
Firma Intel opracowała projekt architektury zarządzania energią nazwanej SMM (ang. system management mode — tryb zarządzania systemem). Funkcjonowanie w tym trybie na poziomie sprzętowym i programowym jest całkowicie odizolowane i niezależne od pozostałych komponentów procesora. SMM oferuje takie zasoby sprzętowe jak czasomierze, rejestry i inne układy obsługi operacji wejścia-wyjścia, które nadzorują i odcinają zasilanie komponentów komputera przenośnego bez naruszania innych zasobów systemowych. SMM funkcjonuje w dedykowanym obszarze pamięci zwanej pamięcią zarządzającą systemem, która jest niewidoczna i nie zakłóca pracy systemu operacyjnego oraz aplikacji. SMM dysponuje przerwaniem o nazwie przerwania zarządzającego systemem (ang. system management interrupt — SMI), które obsługuje zdarzenia związane z zarządzaniem energią i jest niezależne od innych przerwań (z ustawionym wyższym priorytetem).
SMM oferuje, wcześniej niedostępną możliwość elastycznego i bezpiecznego zarządzania energią. Przykładowo, przerwanie SMI pojawia się wtedy, gdy program próbuje uzyskać dostęp do urządzenia peryferyjnego, które w celu obniżenia zużycia baterii zostało wyłączone i powoduje jego ponowne włączenie oraz automatyczne wykonanie instrukcji wejścia-wyjścia.
Firma Intel opracowała również funkcję o nazwie Suspens/Resume (wstrzymania/ponowienia) dostępną w procesorze SL. Producenci komputerów mogą wykorzystać ją w celu zapewnienia użytkownikowi komputera przenośnego możliwości jego natychmiastowego wyłączania i włączania. Systemy oparte na procesorze w wersji SL zazwyczaj potrafią wznowić (nagłe włączenie) działanie komputera w ciągi 1 sekundy od momentu, gdy pozostawał w trybie wstrzymania (nagłe wyłączenie). W celu przywrócenia systemu do pełnej funkcjonalności, zamiast wykonywania restartu i ponownego załadowania systemu operacyjnego lub aplikacji, wystarczy nacisnąć przycisk Suspens/Resume.
Procesor w wersji SL, został zaprojektowany tak, aby w trybie wstrzymania komputera, nie pobierał prawie żadnej mocy. Oznacza to, że prawdopodobnie system może pozostawać w trybie wstrzymania całymi tygodniami, a potem będzie jeszcze możliwe przywrócenie go do pełnej sprawności. System wyposażony w procesor w wersji SL, pozwala na bezpieczne przechowywanie danych roboczych w pamięci RAM przez długi okres czasu, ale ich zapis na dysk w dalszym ciągu jest wskazany.
Procesor 486SX
Procesor 486SX wprowadzony na rynek w kwietniu 1991 r. został zaprojektowany jako tańsza wersja procesora 486. Tak naprawdę, jest on identyczny z modelem 486DX, z tym, że nie ma wbudowanego koprocesora.
Jak zapewne dowiedziałeś się po przeczytaniu wcześniejszej części rozdziału, procesor 386SX był uproszczoną (niektórzy powiedzą zubożoną) 16-bitową wersją w pełni funkcjonalnego 32-bitowego modelu 386DX. Procesor 386SX posiadał nawet zupełnie inne rozmieszczenie końcówek i nie był zgodny z bardziej wydajnym modelem DX. W przypadku procesora 486SX jest jednak zupełnie inaczej. W rzeczywistości procesor 486SX jest w pełni funkcjonalnym 32-bitowym układem 486, który dysponuje identycznym jak wersja DX rozmieszczeniem końcówek. Chociaż funkcje kilku końcówek są trochę inne lub zamienione, to jednak każda końcówka jest zgodna z tym samym gniazdem.
Procesor 486SX jest bardziej tworem marketingu niż nowym produktem. Początkowe wersje procesorów 486SX właściwie były układami DX, w których stwierdzono wadliwe działanie koprocesora. Zamiast przeznaczać je na zlom, były sprzedawane jako układy SX z wyłączonym koprocesorem. Takie rozwiązanie było jednak tymczasowe i odtąd w przypadku procesora SX stosowano inną maskę niż w wersji DX. Maska jest fotograficznym obrazem procesora wykorzystywanym do trawienia w warstwie krzemu skomplikowanych ścieżek sygnałowych. W związku z zastosowaniem nowej maski ilość tranzystorów zmniejszyła się z 1,2 do 1,185 miliona.
Procesor 486SX był dostępny z następującymi częstotliwościami: 16, 20, 25 i 33 MHz, natomiast w późniejszym okresie model 486SX/2 był również sprzedawany w wersji 50 lub 66 MHz. Zazwyczaj procesor 486SX zawierał 168 końcówek, chociaż w przypadku modeli wyposażonych w rozszerzenie SL ich obudowy montowane na powierzchni dysponowało inną liczbą końcówek.
Pomimo starań działu marketingu i sprzedaży firmy Intel, nie istnieje żadne techniczne ograniczenie związane z instalacją oddzielnego koprocesora mającego współpracować z procesorem 486SX. Nie istniał też niezależny koprocesor, który można by było dołączyć do systemu. Firma Intel dążyła do tego, aby kupowano jej nowy procesor 486 wyposażony w koprocesor i następnie wyłączano model SX już zainstalowany na płycie głównej. Jeśli wydaje Ci się to niejasne, przeczytaj dalszą część rozdziału, ponieważ dzięki temu dowiesz się o najważniejszym aspekcie dotyczącym architektury 486 — możliwości aktualizacji.
Koprocesor 487SX
Koprocesor 487SX (nazwany tak przez firmę Intel) w rzeczywistości jest procesorem 486DX taktowanym zegarem 25 MHz wyposażonym w dodatkową końcówkę oraz w kilka innych spełniających odmienne funkcje. Po zainstalowaniu koprocesora w dodatkowym gnieździe znajdującym się w systemie opartym na procesorze 486SX następuje wyłączenie procesora. Operacja ta jest realizowana przy użyciu nowego sygnału jednej z końcówek. Dodatkowa końcówka sama nie przenosi żadnego sygnału i jej jedynym zadaniem jest uniemożliwienie niewłaściwej instalacji koprocesora w gnieździe.
Koprocesor 487SX przejmuje wszystkie funkcje procesora 486SX, a ponadto oferuje możliwość skorzystania z funkcji typowych dla koprocesora. Na pierwszy rzut oka takie rozwiązanie wydaje się być dziwne i nieekonomiczne, dlatego też konieczne są dodatkowe wyjaśnienia. Na szczęście, koprocesor 487SX okazał się tylko chwilowym środkiem zastępczym w okresie, gdy firma Intel przygotowywała swoją prawdziwą niespodziankę — procesor OverDrive. Procesory DX2/OverDrive, pracujące z podwójną częstotliwością płyty głównej, zostały dopasowane do 169-końcówkowego gniazda posiadającego identyczne rozmieszczenie końcówek jak koprocesor 487SX. Tego typu procesory są instalowane tak samo jak układ 487SX, dlatego też każdy system współpracujący z koprocesorem 487SX będzie obsługiwał również procesory DX2/OverDrive.
Chociaż w większości przypadków istnieje możliwość wymiany procesora 486SX na koprocesor 487SX (czy nawet model DX lub DX2/OverDrive), to jednak początkowo firma Intel zniechęcała do takiego rozwiązania. Zamiast niego zachęcała producentów komputerów PC do montowania w nich dedykowanego gniazda pozwalającego na aktualizację (OverDrive). Tłumaczyła to tym, że z demontażem procesora ze zwykłego gniazda jest związanych kilka zagrożeń. Zostaną one dokładnie omówione w dalszej części rozdziału. Odtąd firma Intel zaczęła polecać, a nawet domagać się stosowania jednoprocesorowego gniazda typu ZIF, które ułatwia wykonanie fizycznej aktualizacji procesora.
► ► Zajrzyj do punktu „Podstawka ZIF (Zero Insertion Force)" znajdującego się na stronie 129.
Procesory DX2/OverDrive i DX4
3 marca 1992 r. firma Intel zaprezentowała procesor DX2 taktowany podwójną częstotliwością płyty głównej. 26 maja 1992 r. ogłosiła, że procesor DX2 będzie również dostępny dla indywidualnego odbiorcy w wersji nazwanej OverDrive. Początkowo wersje OverDrive procesora DX2 zawierały tylko 169 końcówek, co oznaczało, że mogły być zastosowane tylko w systemach opartych na procesorze 486SX i wyposażonych w gniazda obsługujące zmienioną konfigurację końcówek.
14 września 1992 r. firma Intel wprowadziła do sprzedaży 168-końcówkową wersję OverDrive przeznaczoną do aktualizacji procesorów 486DX. Procesory w wersji OverDrive mogły być zainstalowane w formie aktualizacji w stosowanych systemach wyposażonych w procesor 486 (SX lub DX), nawet jeśli nie obsługiwały konfiguracji 168-końcówkowej. Po zainstalowaniu w systemie procesora OverDrive pełniącego rolę aktualizacji następuje dwukrotny wzrost jego szybkości.
Procesory DX2/OverDrive są taktowane z częstotliwością dwukrotnie wyższą od częstotliwości pracy płyty głównej. Jeśli na przykład częstotliwość płyty głównej wynosi 25 MHz, to wtedy procesor DX2/OverDrive będzie działał z szybkością 50 MHz. Podobnie, jeśli płyta główna jest taktowana zegarem 33 MHz, wtedy procesor DX2/OverDrive będzie pracował z częstotliwością 66 MHz. Dwukrotnie wyższa częstotliwość pracy procesora DX2/OverDrive nie ma wpływu na pozostałą część systemu. Wszystkie komponenty płyty głównej pracują z szybkością taką jak w przypadku zwykłego procesora 486. Wynika z tego, że aby umożliwić współpracę innych komponentów systemu (takich jak pamięć) z procesorem pracującym z dwukrotnie wyższą częstotliwością nie jest konieczna ich wymiana. Procesory DX2/OverDrive były dostępne w kilku wersjach taktowanych różnymi częstotliwościami. Należą do nich:
Model DX2/OverDrive 40 MHz przeznaczony dla systemów taktowanych zegarem 16 lub 20 MHz.
Model DX2/OverDrive 50 MHz przeznaczony dla systemów taktowanych zegarem 25 MHz.
Model DX2/OverDrive 66 MHz przeznaczony dla systemów taktowanych zegarem 33 MHz.
Należy zauważyć, że podane częstotliwości oznaczają maksymalne dopuszczalne szybkości procesorów. Zastosowanie modelu taktowanego zegarem 66 MHz w miejsce procesorów pracujących z częstotliwością 50 lub 40 MHz nie stanowi żadnego problemu. Będzie on jednak pracował tylko z niższymi częstotliwościami. Rzeczywista częstotliwość pracy procesora jest dwukrotnie wyższa od częstotliwości płyty głównej. Jeśli, przykładowo, w systemie 486SX 16 MHz zostanie zainstalowany procesor DX2/OverDrive taktowany zegarem 40 MHz, to będzie pracował tylko z częstotliwością 32 MHz, stanowiącą dwukrotną wartość częstotliwości płyty głównej. Firma Intel początkowo twierdziła, że dla systemów taktowanych zegarem 50 MHz nie będzie dostępny procesor DX2/OverDrive 100 MHz, co nie było prawdą ponieważ od strony technicznej taka współpraca była możliwa. Wystarczyło procesor DX4 tak skonfigurować, aby działał z dwukrotnie wyższą częstotliwością płyty głównej taktowanej zegarem 50 MHz (zapoznaj się z wcześniejszym omówieniem procesora DX4).
Jedynym elementem procesora DX2, który nie pracuje z podwójną częstotliwością, jest interfejs magistrali, który jest modułem odpowiedzialnym za obsługę operacji wejścia-wyjścia pomiędzy procesorem a światem zewnętrznym. Dzięki zastosowaniu mechanizmu translacji pomiędzy różnymi wewnętrznymi i zewnętrznymi częstotliwościami zegara interfejs magistrali powoduje, że dla reszty systemu dwukrotnie wyższa częstotliwość pracy procesora jest niewidoczna. Procesor DX2 jest dla pozostałych komponentów systemu zwykłym procesorem 486DX, ale wykonującym instrukcje dwukrotnie szybciej.
Procesor DX2/OverDrive jest wykonany w technologii 0,8 mikrona, która po raz pierwszy została użyta w procesorze 486DX. Procesor DX2 zawiera 1,2 miliona tranzystorów umieszczonych na trzech warstwach. Zarówno wewnętrzna pamięć podręczna 8 kB, jak i moduł całkowitoliczbowy oraz zmiennoprzecinkowy pracują z podwójną częstotliwością. Komunikacja z zewnętrznymi komponentami komputera, dla zachowania kompatybilności, odbywa się przy standardowej szybkości.
Poza możliwością aktualizacji istniejącego procesora jedną z najlepszych cech projektu procesora DX2 była możliwość tworzenia przez inżynierów systemowych bardzo szybkich komputerów, w których, zamiast stosować kosztowne płyty główne bezpośrednio obsługujące wyższe częstotliwości pracy, można było wykorzystać znacznie tańsze rozwiązania. Przykładowo, system z procesorem 486DX2 taktowanym zegarem 50 MHz był o wiele droższy niż komputer wyposażony w model 486DX 50 MHz. Płyta główna zastosowana w komputerze z procesorem 486DX taktowanym zegarem 50 MHz pracuje z częstotliwością 50 MHz, natomiast w systemie opartym na procesorze 486DX2 taktowanym zegarem 50 MHz tylko 25 MHz.
Możesz dojść do wniosku, że komputery z zainstalowanym procesorem DX taktowanym zegarem 50 MHz będą szybsze od systemów pracujących z częstotliwością 25 MHz i zastosowanym mnożnikiem 2. Po części jest to prawdą ale różnica w szybkości jest nieznaczna i wynika z większej integracji procesora 486, a zwłaszcza pamięci podręcznej.
W momencie, gdy, przykładowo, procesor z pamięci operacyjnej pobiera dane lub instrukcje, wtedy jest zmuszony do obniżenia swojej szybkości do częstotliwości pracy płyty głównej wynoszącej np. 25 MHz. Ze względu na fakt, że skuteczność trafień wewnętrznej pamięci Cache 8 kB procesora 486DX2 wynosi od 90 do 95%. procesor z całego czasu związanego z odczytem danych tylko przez 5 - 10% pobiera je bezpośrednio z pamięci operacyjnej. Z związku z tym, wydajność komputerów z procesorem DX2 kosztujących o wiele mniej może się znacznie zbliżyć do wydajności systemów pracujących z częstotliwością 50 MHz i wyposażonych w procesor DX. Chociaż komputer jest wyposażony w płytę główną pracującą tylko z częstotliwością 33,33 MHz, to jednak po zainstalowaniu na niej procesora DX2 taktowanego zegarem 66 MHz, jego wydajność może być wyższa niż systemu z procesorem DX taktowanym zegarem 50 MHz, zwłaszcza w sytuacji, gdy zostanie zastosowana dobrej jakości pamięć Cache L2.
Wiele płyt głównych współpracujących z procesorami 486 zawierającymi zintegrowaną pamięć Cache jest wyposażona również w dodatkową zewnętrzną pamięć podręczną. Zewnętrzna pamięć podręczna pozwala uzyskać procesorowi 486 o wiele szybszy dostęp do danych pobieranych z pamięci operacyjnej. Pojemność takiej pamięci może zawierać się w przedziale od 16 do 512 kB lub więcej. Po zainstalowaniu procesora DX2, w celu osiągnięcia większego wzrostu wydajności, zastosowanie zewnętrznej pamięci podręcznej jest jeszcze bardziej istotne. Tego typu pamięć Cache w znaczący sposób wpływa na zmniejszenie ilości cykli oczekiwania, które muszą być zastosowane przez procesor w sytuacji, gdy nastąpi operacja zapisu do pamięci operacyjnej lub gdy żądane dane nie znajdują się w wewnętrznej pamięci podręcznej. Z tego powodu, wydajność niektórych systemów opartych na procesorze DX2/OverDrive jest wyższa niż innych. Zazwyczaj jest to zależne od pojemności i wydajności zewnętrznej pamięci podręcznej umieszczonej na płycie głównej. Systemy pozbawione zewnętrznej pamięci podręcznej nadal mogą pracować z wydajnością procesorów taktowanych dwukrotną częstotliwością pracy płyty głównej, ale w przypadku sporej ilości operacji odczytu danych bezpośrednio z pamięci operacyjnej będą one wykonywane wolniej.
Tym sposobem dotarliśmy do procesora DX4. Chociaż procesor DX4 nie był dostępny w sprzedaży detalicznej, to jednak istniała możliwość nabycia go u kilku sprzedawców wraz z kartą służącą do obniżenia napięcia do 3,3 V wymaganego przez procesor instalowany w gnieździe zasilanym napięciem 5 V. Karta była wyposażona w zworki pozwalające na ustawienie wartości mnożnika częstotliwości procesora DX4 (x2, x2,5 lub x3). W przypadku komputerów z procesorem DX taktowanym zegarem 50 MHz możliwe było zainstalowanie procesora DX4 (z ustawionym mnożnikiem x2) wraz ze stabilizatorem napięcia, przy czym płyta główna pracowała z częstotliwością 50 MHz. Dzięki temu szybkość procesora wynosiła 100 MHz! Chociaż mogło nie być możliwe pełne wykorzystanie niektórych kart opartych na szynie VL-Bus, to jednak dysponowało się jednym z najszybszych dostępnych komputerów klasy 486.
Firma Intel wprowadziła również do sprzedaży specjalną wersję procesora DX4 OverDrive, który zawierał wbudowany stabilizator napięcia oraz radiator. Procesor został zaprojektowany specjalnie z myślą o rynku detalicznym. Procesor DX4 OverDrive właściwie jest tym samym układem co standardowy model DX4 zasilany napięciem 3,3 V z tą istotną różnicą że dzięki zintegrowaniu z nim stabilizatora jest zasilany napięciem 5 V. Poza tym, w przeciwieństwie do standardowych procesorów DX4 pracujących z mnożnikiem o wartości x2 lub x2,5, procesor pracuje tylko z trzykrotnie wyższą częstotliwością niż płyta główna.
Firma Intel zaprzestała produkcji wszystkich modeli procesorów 486 i DX2/DX4/OverDrive oraz tak zwanego procesora Pentium OverDrive.
Procesor Pentium OverDrive przeznaczony dla systemów 486SX2 i DX2
Procesor Pentium OverDrive został wprowadzony na rynek w 1995 r. Co prawda wersja OverDrive dla procesora 486DX4 była planowana, ale wskutek niskiego poziomu sprzedaży wersji SX2/DX2 ostatecznie nigdy nie ujrzała światła dziennego. Należy mieć świadomość jednej rzeczy dotyczącej procesora 486 Pentium OverDrive, a mianowicie, że chociaż jest on głównie przeznaczony dla systemów opartych na procesorach SX2 i DX2. to jednak również powinien się sprawdzić w każdym komputerze wyposażonym w gniazdo Socket 2 lub 3 z zainstalowanym procesorem w wersji 486SX lub DX. W razie wątpliwości należy zapoznać się z udostępnionym w Internecie przez firmę Intel przewodnikiem związanym z aktualizacją procesorów.
Procesor Pentium OverDrive został zaprojektowany z myślą o systemach wyposażonych w gniazdo zgodne ze specyfikacją Intel Socket 2. Procesor będzie również pracował w komputerach dysponujących gniazdem Socket 3, ale w tym przypadku należy upewnić się, że napięcie zasilania zamiast 3,3 V ma wartość 5 V. Procesor Pentium OverDrive zawiera wewnętrzną pamięć Cache LI o pojemności 32 kB i tę samą architekturę superskalarna (potok z wieloma instrukcjami) co prawdziwy procesor Pentium. Oprócz rdzenia 32-bitowego Pentium, procesory te są wyposażone w funkcję pozwalającą na stosowanie wyższych częstotliwości pracy, co wynika z użycia wewnętrznego mnożnika częstotliwości zegara i wewnętrznej pamięci podręcznej pracującej w trybie write-back (standardowo dostępnej w procesorze Pentium). Jeśli płyta główna obsługuje pamięć
Cache pracującą w trybie write-back, wtedy możliwe jest uzyskanie większej wydajności. Niestety, większość płyt głównych, zwłaszcza starszego typu wyposażonych w gniazdo Socket 2, współpracuje tylko z pamięcią podręczną pracującą w trybie write-through.
Większość testów procesorów OverDrive wykazało, że są nieznacznie szybsze od procesorów DX4-100 i wolniejsze od układów DX4-120 oraz Pentium 60, 66 i 75. Biorąc pod uwagę stosunkowo przystępną cenę najtańszych wersji procesora Pentium (w czasach ich produkcji), nie trzeba było się zbyt długo zastanawiać nad nabyciem komputera klasy Pentium.
Procesor AMD 486 (5x86)
Firma AMD stworzyła serię procesorów kompatybilnych z procesorem 486 przeznaczonych dla płyt głównych 486. W rzeczywistości firma AMD opracowała najszybszy dostępny na rynku model procesora 486 nazwany Am5x86(TM)-P75. Nazwa była trochę myląca, ponieważ jej składnik 5x86 spowodował, że wiele osób pomyślało, że byl to procesor piątej generacji podobny do procesora Pentium. W rzeczywistości był to układ 486 z ustawionym mnożnikiem o wartości x4, a zatem pracujący z czterokrotnie wyższą częstotliwością niż płyta główna (33 MHz), na której był zainstalowany.
Procesor 5x86 oferował funkcje podnoszące wydajność takie jak zintegrowana pamięć podręczna o pojemności 16 kB pracująca w trybie write-back. Poza tym był taktowany zegarem 133 MHz, dlatego też mógł być porównywany z procesorem Pentium 75, co też zrobiono, umieszczając w jego nazwie oznaczenie P-75. Procesor był idealnym rozwiązaniem dla tańszych systemów 486 z możliwością aktualizacji, w których wymiana płyty głównej była utrudniona lub niemożliwa.
Nie wszystkie płyty główne klasy 486 obsługiwały procesor 5x86. Najlepszym sposobem sprawdzenia, czy używana płyta główna może z nim współpracować, jest zajrzenie do dołączonej instrukcji obsługi. Po jej otwarciu poszukaj takich słów jak Am5X86, AMD-X5, clock-ąuadrupled (mnożnik x4), 133 MHz lub innego podobnego do wymienionych. Inną zalecaną metodą ustalenia, czy płyta główna obsługuje procesor AMD 5x86, jest jej odszukanie na liście modeli płyt zamieszczonej na stronie internetowej firmy AMD.
Należy wspomnieć o kilku kwestiach związanych z instalacją procesora 5x86 na płycie głównej klasy 486:
♦ Procesor 5x86 jest zasilany napięciem 3.45 Vz dopuszczalną tolerancją ± 0,15 V. Nie wszystkie płyty główne oferują takie napięcie. Jeśli płyta jest wyposażona w gniazdo Socket 3, wtedy napięcie 3,45 V też powinno być dostępne. Jeśli natomiast płyta główna ma gniazdo Socket 1 lub 2, wtedy nie będzie ona współpracować z procesorem 5x86. Wynika to z faktu, że procesor zasilany napięciem 3,45 V nie zadziała w gnieździe o napięciu 5 V i może zostać uszkodzony. Aby w przypadku płyt głównych oferujących napięcie 5 V zmniejszyć je do 3,3 V, należy nabyć u jednego ze sprzedawców (Kingston, PowerLeap lub Evergreen) procesor wraz ze stabilizatorem napięcia. Wymienione i inne firmy sprzedawały procesor 5x86 wraz ze stabilizatorem napięcia umieszczonym w prostej do instalacji obudowie. Tego typu rozwiązanie jest idealne dla starszych modeli płyt głównych klasy 486
nie dysponujących gniazdem Socket 3. Z tego typu produktami nadal można się spotkać przy wyprzedażach, a jeśli nie, we własnym zakresie można wykonać zestaw aktualizacyjny złożony z procesora, stabilizatora napięcia i radiatora/wentylatora.
Przeważnie lepiej kupić nową płytę główną, procesor i pamięć RAM niż jedno z rozwiązań wykorzystujących stabilizator napięcia. Nabycie nowej płyty głównej będzie bardziej korzystne, ponieważ BIOS starszej płyty może nie spełniać wymagań procesora dotyczących częstotliwości pracy. W związku z tym, często konieczne jest dokonanie aktualizacji BIOS-u starszej płyty głównej.
Większość płyt głównych z gniazdem Socket 3 posiada zworki umożliwiające ręczne ustawienie wartości napięcia. Niektóre płyty zamiast zworek są wyposażone w mechanizm automatycznej detekcji napięcia. W tym przypadku, po uruchomieniu komputera sprawdzana jest końcówka procesora oznaczona jako VOLDET — S4.
Końcówka VOLDET procesora jest wewnętrznie połączona z masą (Vss). Jeśli na płycie głównej nie ma żadnych zworek służących do ustawienia napięcia, można wtedy wykonać następujące czynności: wyłączyć komputer, wyjąć procesor, na podstawce ZIF połączyć końcówkę S4 z końcówką Vss,
włączyć komputer i następnie zmierzyć przy użyciu woltomierza napięcie końcówki Vcc. Wskazane napięcie powinno mieć wartość 3,45 V +0, 15 V. Aby zapoznać się z rozmieszczeniem końcówek, zajrzyj do poprzedniego podrozdziału.
Procesor 5x86 współpracuje tylko z płytą główną taktowaną zegarem 33 MHz, dlatego też należy się upewnić, że jest ustawiona taka częstotliwość. Procesor 5x86 pracuje z częstotliwością rdzenia wynoszącą 133 MHz. W tego powodu zworki muszą być tak ustawione, aby mnożnik miał wartość x4 (tryb clock-ąuadrupled). Poprzez poprawne ustawienie zworek na płycie głównej końcówka CLKMUL (R17) procesora zostanie połączona z masą(Vss). Jeśli nie ma możliwości ustawienia wartości mnożnika na x4, wtedy powinno być dostępne ustawienie x2, z którym pracuje procesor DX2.
Niektóre płyty główne są wyposażone w zworki służące do ustawiania trybu pracy pamięci podręcznej — write-back (WB) lub write-through (WT). Operacja, w przypadku trybu WB, jest realizowana poprzez połączenie końcówki WB/WT'(nr 13) procesora z High (Vcc), natomiast w celu włączenia trybu WT — z masą (Vss). Aby uzyskać jak najlepszą wydajność, należy ustawić tryb WB. Jeśli jednak pojawią się problemy z aplikacjami lub stacja dyskietek zacznie zachowywać się niepoprawnie (konflikty DMA), wtedy należy z powrotem ustawić tryb WT.
Procesor 5x86 dość mocno się nagrzewa, dlatego też konieczne jest zastosowanie radiatora. Standardowo wymagany jest wentylator, w który wyposażona jest większość zestawów aktualizacyjnych.
Poza wersją procesora 5x86 taktowaną zegarem 133 MHz w ramach serii procesorów 486 o rozszerzonych możliwościach pojawiły się też modele pracujące z częstotliwościami 80, 100 i 120 MHz. Mają one następujące oznaczenia: A80486DX2-80SV8B (40MHzx2), A80486DX4-100SV8B (33MHzx3) i A80486DX4-120SV8B (40MHzx3).
Procesor Cyrix/TI 486
Procesory Cyrix 486DX2/DX4 dostępne były w wersjach taktowanych zegarami 100, 80, 75, 66 i 50 MHz. Podobnie jak w przypadku procesorów 486 firmy AMD, układy firmy Cyrix są w pełni kompatybilne z procesorami Intel 486 i współpracują z większością płyt głównych.
Procesory Cx486DX2/DX4 zawierają pamięć podręczną pracującą w trybie write-back o pojemności 8 kB, zintegrowany koprocesor, zaawansowane zarządzanie energią SMM i zasilane są napięciem 3,3 V.
Początkowo firma Tl produkowała wszystkie procesory Cyrix 486 i w ramach zawartej umowy sprzedawała je również pod nazwą Tl. Procesory firmy Tl właściwie są tym samym co procesory Cyrix.
P5 (586). Procesory piątej generacji
Po pojawieniu się procesorów czwartej generacji takich jak 486, inżynierowie firmy Intel oraz innych producentów ponownie zasiedli przed deskami kreślarskimi z zamiarem zaprojektowania nowej architektury i funkcjonalności, aby później można je było zastosować w tym, co zostało nazwane procesorami piątej generacji. W dalszej części rozdziału omówiono procesory piątej generacji wytwarzane przez firmę Intel, AMD i inne.
Procesory Pentium
19 października 1992 r., firma Intel poinformowała o piątej generacji kompatybilnych procesorów (o nazwie kodowej P5) określonych, wbrew oczekiwaniom wszystkich, zamiast 586 nazwą Pentium. Zastosowanie oznaczenia 586 byłoby naturalną kontynuacją ale firma Intel odkryła, że nie będzie mogła zastrzec oznaczeń liczbowych. Zależało jej na tym, aby inni producenci, w przypadku zaprojektowanych przez siebie kopii procesorów Intel, nie posługiwali się tymi samymi oznaczeniami. Procesor Pentium został wprowadzony do sprzedaży 22 marca 1993 r. Zaledwie kilka miesięcy później pojawiły się systemy na nim oparte.
Procesor Pentium jest w pełni kompatybilny z poprzednimi modelami, ale też różni się od nich pod wieloma względami. Przynajmniej jedna z tych różnic ma fundamentalne znaczenie — mianowicie procesor oferuje dwa identyczne potoki danych pozwalające na jednoczesne wykonywanie dwóch instrukcji. Procesor 486 i wszystkie poprzednie układy były w stanie jednocześnie wykonywać tylko jedną instrukcję. Firma Intel nazwała możliwość jednoczesnego wykonywania dwóch instrukcji technologią superskalarna. W porównaniu z procesorem 486 nowa technologia spowodowała dodatkowy wzrost wydajności.
Dzięki technologii superskalarnej procesor Pentium może przetwarzać wiele instrukcji z szybkością dwóch instrukcji w ciągu cyklu. Architektura superskalarna zazwyczaj jest kojarzona z wydajnymi procesorami RISC. Procesor Pentium jest pierwszym układem CISC uważanym za superskalarny. Pod względem wydajności, procesor Pentium odpowiada prawie dwóm układom 486. W tabeli 3.25 zebrano parametry procesora Pentium.
Tabela 3.25. Parametry procesora Pentium
Data wprowadzenia |
22 marca 1993 (pierwsza generacja), 7 marca 1994 (druga generacja). |
Maksymalne częstotliwości taktowania |
60 i 66 (pierwsza generacja); 75,90, 100, 120, 133, 150, 166. 200 MHz (druga generacja). |
Mnożnik częstotliwości |
x 1 (pierwsza generacja), x 1,5 - x3 (druga generacja). |
Rozmiar rejestrów |
32-bity. |
Zewnętrzna magistrala danych |
64-bitowa. |
Szerokość magistrali adresowej |
32-bity. |
Maksymalna pojemność pamięci |
4 GB. |
Pojemność zintegrowanej pamięci Cache |
8 kB — kod, 8 kB — dane. |
Typ zintegrowanej pamięci Cache |
Dwuścieżkowa pamięć asocjacyjna pracująca w trybie write-back. |
Praca w trybie Burst |
Tak. |
Liczba tranzystorów |
3,1 miliona (pierwsza generacja); 3,3 miliona (druga generacja). |
Rozmiar układu |
0,8 mikrona (60/66 MHz), 0,6 mikrona (75 MHz - 100 MHz), 0,35 mikrona (120 MHz i wyższe). |
Zewnętrzna obudowa |
PGA 273-końcówkowa, SPGA 296-końcówkowa (obudowa formatu TCP — lape carrier). |
Koprocesor |
Zintegrowany. |
Zarządzanie energią |
SMM, rozszerzone w drugiej generacji. |
Napięcie robocze |
5 V (pierwsza generacja), 3,465, 3,3, 3,1, 2,9 V (druga generacja). |
PGA — Pin grid array
SPGA — Staggered pin grid array
Dwa potoki instrukcji procesora są określane jako potok u (ang. u-pipe) i v (ang. v-pipe). Potok u, który jest potokiem głównym, potrafi wykonywać wszystkie instrukcje całkowitoliczbowe i zmiennoprzecinkowe. Potok v jest potokiem dodatkowym, wykonującym tylko proste instrukcje całkowitoliczbowe i niektóre zmiennoprzecinkowe. Operacja jednoczesnego przetwarzania dwóch instrukcji w różnych potokach jest określana terminem parowania (ang. pairing). Nie wszystkie sekwencyjnie wykonywane instrukcje mogą być parowane. Jeśli taka sytuacja nastąpi, wtedy jest używany tylko potok u. Aby zoptymalizować wydajność procesora Pentium, należy, w celu umożliwienia parowania większej liczby instrukcji, dokonać ponownej kompilacji programu.
Procesor Pentium jest wyposażony w bufor adresu docelowego BTB (ang. branch target buffer), który posługuje się techniką określaną mianem przewidywania skoków. Zadaniem bufora BTB jest minimalizacja przestojów występujących w jednym lub kilku potokach wywołanych opóźnieniami wynikającymi z pobrania instrukcji znajdujących się w nieliniowym obszarze pamięci. Bufor BTB próbuje przewidzieć, czy program wykona skok. a następnie pobiera odpowiednie instrukcje. Dzięki zastosowaniu przewidywania skoku, oba potoki procesora Pentium mogą pracować z pełną szybkością. Na rysunku 3.36 pokazano wewnętrzną architekturę procesora Pentium.
Rysunek 3.36.
Wewnętrzna architektura procesora Pentium
Procesor Pentium posiada 32-bitową magistralę adresową dzięki której może zaadresować taką samą ilość pamięci (4GB) co procesory 386DX i 486. W procesorze Pentium zastosowano jednak magistralę danych o szerokości 64-bitów. co oznacza, że w porównaniu ze swoim poprzednikiem taktowanym identycznym zegarem możliwe jest przesyłanie do i na zewnątrz procesora dwukrotnie większej ilości danych. 64-bitowa magistrala danych wymaga zastosowania w systemie pamięci operacyjnej, której każdy moduł ma szerokość 64-bitów.
W większości płyt głównych pamięć RAM jest instalowana w postaci modułów SIMM lub DIMM. Moduły SIMM są dostępne w wersji 8- i 32-bitowej, natomiast moduły DIMM tylko w wersji 64-bitowej. Ponadto poszczególne wersje pamięci, dysponują bitami parzystości lub kodem korekcji błędów ECC (ang. error correc-ting code). Większość systemów opartych na procesorze Pentium wykorzystuje 32-bitowe moduły pamięci SIMM, przy czym na jeden bank pamięci przypadają dwa takie moduły. Większość płyt głównych współpracujących z procesorem Pentium dysponuje przynajmniej czterema gniazdami 32-bitowej pamięci SIMM, co odpowiada dwóm bankom pamięci. Nowsze systemy klasy Pentium i większość obecnie stosowanych systemów opartych na procesorze Pentium II wykorzystuje 64-bitowe moduły pamięci DIMM. Wynika stąd, że ich szerokość odpowiada szerokości zewnętrznej magistrali danych procesora, natomiast jeden moduł DIMM odpowiada jednemu bankowi pamięci. Dzięki temu, że jednemu bankowi jest przypisany jeden moduł DIMM i nie jest konieczne dopasowywanie ich w pary instalacja lub wymiana pamięci stała się o wiele prostsza.
► ►■ Zajrzyj do punktu „Moduły SIMM, DIMM i RIMM" znajdującego się na stronie 543 oraz do punktu „Banki pamięci" zamieszczonego na stronie 563.
Chociaż procesor Pentium dysponuje 64-bitową magistralą danych, która jednocześnie, do i na zewnątrz procesora, przesyła 64 bity danych, to jednak ma tylko 32-bitowe rejestry wewnętrzne. W trakcie wewnętrznego przetwarzania instrukcji są one rozbijane na instrukcje 32-bitowe i dane, a następnie wykonywane identycznie jak w przypadku procesora 486. Niektórzy sądzili, że firma Intel wprowadza ich w błąd, nazywając procesor Pentium układem 64-bitowym. I faktycznie, operacje 64-bitowe są w nim wykonywane. Jednak dla zachowania zgodności z procesorem 486, nowy produkt Intela zawiera tylko 32-bitowe rejestry wewnętrzne.
W porównaniu z układem 486 wyposażonym w pamięć podręczną o pojemności 8 kB lub 16 kB, procesor Pentium dysponuje dwoma niezależnymi modułami wewnętrznej pamięci Cache o pojemności 8 kB. Kontroler pamięci podręcznej oraz sama pamięć Cache są zintegrowane z procesorem. Zadaniem pamięci podręcznej jest powielanie danych zawartych w pamięci RAM, co polega na umieszczaniu w niej kopii danych i kodu instrukcji pobranych z różnych obszarów pamięci operacyjnej. Pamięć Cache procesora Pentium może również przechowywać dane, które w momencie mniejszego obciążenia procesora oraz innych komponentów systemu zostaną zapisane w pamięci operacyjnej. Procesor 486 wykonuje jednorazowy zapis wszystkich operacji do pamięci.
Oddzielna pamięć podręczna, przeznaczona dla kodu instrukcji i danych, jest zorganizowana zgodnie z architekturą dwuścieżkowej pamięci asocjacyjnej, w której każdy zestaw jest podzielony na linie o pojemności 32 bajtów. Każdy moduł pamięci Cache posiada dedykowany bufor translacji adresowej TLB (ang. translalion lookaside buffer), którego zadaniem jest tłumaczenie adresów liniowych na adresy fizyczne. Istnieje możliwość ustawienia na poziomie linii trybu pracy pamięci podręcznej write-back lub write-through. Po zastosowaniu trybu write-back pamięć Cache potrafi przechowywać dane, które mają zostać zapisane w pamięci RAM, dzięki czemu, w porównaniu z trybem write-through (tylko do odczytu), dodatkowo zwiększa się wydajność systemu. Włączenie trybu write-back powoduje zmniejszenie ilości operacji występujących pomiędzy procesorem a pamięcią operacyjną co stanowi wartościową metodę zwiększenia wydajności, ponieważ operacje dostępu do pamięci RAM wykonywane przez procesor w szybkich systemach stanowią „wąskie gardło". Pamięć podręczna przechowująca kod ze swojej natury pracuje w trybie tylko do odczytu. Wynika to stąd, że przechowuje tylko instrukcje, które w przeciwieństwie do danych nie wymagają aktualizacji. Dzięki zastosowaniu cykli burst. operacje odczytu lub zapisu danych zawartych w pamięci podręcznej są wykonywane z dużą szybkością.
Systemy oparte na procesorze Pentium w znaczący sposób mogą skorzystać z faktu zastosowania dodatkowej pamięci Cache L2 procesora która zazwyczaj składa się z wyjątkowo szybkich układów SRAM (czas dostępu 15 ns lub mniej) o pojemności 512 kB lub więcej. W momencie, gdy procesor pobiera dane, które nie znajdują się w jego wewnętrznej pamięci Cache LI, wskutek dodatkowych cykli oczekiwania następuje jego spowolnienie. Jednak jeśli wymagane dane są zawarte w dodatkowej pamięci podręcznej, wtedy procesor może kontynuować swoją pracę bez stosowania cykli oczekiwania.
W celu osiągnięcia oczekiwanej wysokiej wydajności procesora Pentium, wykonano go z wykorzystaniem technologii BiCMOS (ang. Bipolar Complementary Metal-Oxide Semiconductor) oraz zastosowano w nim architekturę superskalarna. Technologia BiCMOS zwiększa o około 10% stopień złożoności projektu procesora, ale za to, bez zwiększenia jego rozmiarów i zużycia energii, wpływa na zwiększenie wydajności o około 30 - 35%.
Wszystkie procesory Pentium wyposażone są w rozszerzenie SL. W celu uzyskania pełnej kontroli nad funkcjami zarządzającymi energią i wpływającymi na obniżenie poboru mocy zastosowano tryb SMM. Procesory Pentium drugiej generacji (taktowane zegarem 75 MHz lub szybszym) posiadają bardziej zaawansowaną wersję trybu SMM, która pozwala kontrolować zegar procesora. Dzięki tej funkcji, w celu nadzorowania zużycia energii możliwe jest zmniejszanie lub zwiększanie szybkości pracy procesora. W przypadku tego typu bardziej zaawansowanych procesorów Pentium istnieje nawet możliwość zatrzymania zegara, a tym samym przełączenia procesora w stan wstrzymania, który charakteryzuje się bardzo małym zużyciem energii. Procesory Pentium drugiej generacji zamiast 5 V są zasilane napięciem 3,3 V, co dodatkowo wpływa na obniżenie zużycia energii i ilość wydzielanego ciepła.
Wiele płyt głównych współpracujących z procesorami Pentium oferuje napięcia 3,465 lub 3,3 V. Wartość napięcia 3,465 V, firma Intel określa terminem VRE (ang. voltage reduced extended — napięcie zredukowane o rozszerzonych możliwościach). Jest ono wymagane przez niektóre wersje procesora Pentium, a zwłaszcza taktowane zegarem 100 MHz. Napięcie standardowe o wartości 3,3 V wykorzystywane przez większość procesorów Pentium drugiej generacji jest określane jako STD (ang. standard — standardowy). Napięcie STD mieści się w przedziale od 3,135 do 3,465 V, przy czym 3,3 V jest wartością nominalną. Ponadto specjalne ustawienie (3,3 V) o nazwie VR (ang. voltage reduced — napięcie zredukowane), określa zawężony przedział, który zaczyna się od 3,300, a kończy na 3,465 V, przy czym 3,38 V jest napięciem nominalnym. Niektóre procesory wymagają jeszcze węższych zakresów, które są obsługiwane przez większość płyt głównych. Poniżej przedstawiono podsumowanie:
Specyfikacja |
Wartość |
|
Wartość |
Wartość |
napięcia |
nominalna (V) |
|
minimalna (V) |
maksymalna (V) |
STD (standard) |
3,30 |
±0,165 |
3,135 |
3,465 |
VR (voltage reduced) |
3,38 |
±0,083 |
3,300 |
3,465 |
VRE (VRextended) |
3,50 |
±0,100 |
3,400 |
3,600 |
W celu dalszego zmniejszania zużycia energii firma Intel opracowała specjalne wersje procesora Pentium (pracujące z częstotliwościami od 75 do 266 MHz) wykorzystujące technologię redukcji napięcia. Tego typu procesory przeznaczone były do zastosowań w komputerach przenośnych. Zamiast standardowej obudowy, zostało zastosowane nowe rozwiązanie formatu TCP (ang. tape carrier packaging). W obudowie TCP. tak jak w przypadku zwykłej obudowy, procesor nie został zamknięty w plastikowej lub ceramicznej osłonie, ale na płytce procesora bezpośrednio zastosowano cienką ochronną plastikową powłokę. Grubość całego procesora nie przekracza 1 milimetra, a waga 1 grama. Procesory były sprzedawane producentom komputerów w opakowaniach w postaci rolek.
Procesor w obudowie TCP jest za pomocą specjalnej maszyny bezpośrednio mocowany (przylutowywany) do płyty głównej. W wyniku uzyskuje się mniejszą obudowę procesora charakteryzującą się niższą wysokością lepszym przewodnictwem cieplnym i mniejszym zużyciem energii. Specjalnie dolutowane punkty umieszczone na płytce drukowanej znajdującej się bezpośrednio pod procesorem powodują odprowadzanie ciepła, a tym samym zapewniają lepsze warunki chłodzenia w komputerach przenośnych dysponujących niewielką ilością wolnej przestrzeni. W tym przypadku nie jest wymagane zastosowanie wentylatora.
Procesor Pentium, podobnie jak układ 486, zawiera zintegrowany koprocesor (FPU). Projekt koprocesora zastosowanego w procesorze Pentium, w celu znacznego zwiększenie wydajności, w porównaniu z układem wykorzystanym w procesorze 486 uległ poważnym modyfikacjom. Pomimo dokonanych zmian, nadal byt w pełni kompatybilny z koprocesorem 387 i układem zintegrowanym z procesorem 486. W porównaniu z koprocesorem zastosowanym w modelu 486, wydajność koprocesora procesora Pentium jest od dwóch do dziesięciu razy wyższa. Poza tym, użycie w procesorze Pentium dwóch standardowych potoków instrukcji wiąże się z zastosowaniem dodatkowych modułów przetwarzających zwykłe operacje całkowitoliczbowe. Koprocesor służy do wykonywania tylko bardziej złożonych obliczeń. Inne procesory, takie jak 486, dysponują tylko jednym standardowym potokiem instrukcji i jednym modułem zajmującym się obliczeniami całkowitoliczbo-wymi. Interesujące jest to, że koprocesor procesora Pentium zawiera błąd, który zyskał wśród opinii publicznej spory rozgłos. Zapoznaj się z treścią punktu „Defekty procesora Pentium" znajdującego się w dalszej części rozdziału.
Procesor Pentium pierwszej generacji
Procesor Pentium wykonywany był w trzech podstawowych architekturach, z których każda była dostępna w kilku wersjach. Procesory charakteryzujące się architekturą pierwszej generacji, od jakiegoś czasu niedostępne, sprzedawane były w wersji taktowanej zegarem 60 i 66 MHz. Tego typu procesory umieszczone były w 273-końcówkowej obudowie PGA i zasilane napięciem 5 V. W tym przypadku procesor pracował z częstotliwością płyty głównej, czyli stosowany mnożnik miał wartość xl.
Procesor Pentium pierwszej generacji był wykonany w technologii 0,8 mikrometra (BiCMOS). Niestety, zastosowanie tej technologii i całkowita liczba tranzystorów wynosząca 3,1 miliona skomplikowały proces wytwarzania płytki procesora, która jednocześnie osiągnęła wyjątkowo duże rozmiary. Efektem niższych wartości uzysku było wytwarzanie niewielkich partii procesorów. Poza tym, firma Intel nie nadążała z zaspokajaniem zapotrzebowania rynku. Technologia 0,8 mikrometrów była krytykowana przez innych producentów procesorów, łącznie z firmą Motorola i IBM, którzy przy wytwarzaniu swoich najbardziej zaawansowanych układów scalonych stosowały technologię 0,6 mikrometra. Dużych rozmiarów płytka oraz napięcie zasilania wynoszące 5 V spowodowały, że procesory taktowane zegarem 66 MHz charakteryzowały się niebywałym poborem mocy wynoszącym 16 W (przy natężeniu 3,2 A). Wskutek tego, w niektórych systemach, które nie wykorzystywały metod oszczędzania energii, wydzielana była znaczna ilość ciepła i pojawiały się różne problemy. Na szczęście, dodanie do procesora wentylatora rozwiązało większość problemów związanych z odprowadzaniem ciepła. Oczywiście było tak, dopóki wentylator był sprawny.
Wiele krytyki związanej z procesorami Pentium pierwszej generacji, skierowanej pod adresem firmy Intel, było uzasadnione. Niektórzy uświadomili sobie, że procesory Pentium pierwszej generacji były takie, jakie były. Na pocieszenie pozostało oczekiwanie na jego nowe wersje wykonane w bardziej zaawansowanej technologii. Wiele z tych osób wstrzymało się przed zakupem jakiegokolwiek komputera opartego na procesorze Pentium do momentu, gdy zostaną wprowadzone do sprzedaży procesory drugiej generacji.
Podstawowa zasada obowiązująca w branży komputerowej mówi, aby nigdy nie kupować pierwszej generacji dowolnego typu procesora. Chociaż, w związku z faktem pojawienia się na horyzoncie czegoś lepszego, można wstrzymywać się z zakupem cały czas, to jednak w wielu przypadkach chwila cierpliwości może okazać się sensowna.
Te osoby, które nabyły procesory Pentium pierwszej generacji, nadal mają możliwość wyboru. Podobnie jak w przypadku procesora 486, firma Intel wprowadziła do sprzedaży wersję OverDrive, która pozwala na efektywne podwojenie szybkości procesorów Pentium taktowanych zegarem 60 lub 66 MHz. Procesory w wersji OverDrive określane są terminem aktualizacji jednoukładowej (ang. single-chip upgrade). co oznacza, że służą do aktualizacji stosowanego procesora. Ze względu na fakt, że wszystkie następne wersje procesora Pentium są niezgodne z modelami pracującymi z częstotliwością 60 i 66 MHz (gniazdo Socket 4), zastosowanie wersji OverDrive lub porównywalnych aktualizacji oferowanych przez inne firmy było jedyną możliwością aktualizacji procesorów Pentium pierwszej generacji, bez konieczności wymiany płyty głównej.
Zwykle lepszym rozwiązaniem była wymiana płyty głównej na współpracującą z procesorami nowej generacji, które prawdopodobnie będą kilka razy szybsze niż układ w wersji OverDrive pozwalający na tylko dwukrotne zwiększenie szybkości procesora.
Procesor Pentium drugiej generacji
Firma Intel poinformowała o procesorze Pentium drugiej generacji 7 marca 1994 r. Nowy procesor pojawił się w wersjach taktowanych zegarem 90 i 100 MHz oraz trochę później w wersji 75 MHz. Ostatecznie wprowadzono do sprzedaży również wersje pracujące z częstotliwością 120, 133, 150, 166 i 200 MHz. Procesor Pentium drugiej generacji był wykonany w technologii 0,6 mikrometra (wersje 75/90/100 MHz). Technologia BiCMOS umożliwiła zmniejszenie rozmiarów płytki i obniżenie zużycia energii. W przypadku nowszej wersji taktowanej zegarem 120 MHz (i wyższym) zastosowano nawet technologię 0,35 mikrometra (BiCMOS) oraz płytkę o jeszcze mniejszych rozmiarach. Mniejszy rozmiar płytki procesora nie jest wynikiem zastosowania technologii 0,35 mikrona. Osiągnięto to dzięki wykorzystaniu metody fotograficznego pomniejszenia płytki P54C. Płytka procesora Pentium została pokazana na rysunku 3.37. Nowe procesory były zasilane napięciem 3,3 V. Wersja taktowana zegarem 100 MHz charakteryzuje się poborem mocy wynoszącym 10,725 W (przy natężeniu 3,25 A i napięciu 3,3 V). W przypadku szybszego modelu taktowanego zegarem 150 MHz, pobór mocy wynosił 11,6 W (przy natężeniu 3,5 A i napięciu 3,3 V), dla wersji 166 MHz było to odpowiednio 14,5 W (przy natężeniu 4,4 A i napięciu 3,3 V), natomiast dla wersji 200 MHz było to 15,5 W (przy natężeniu 4,7 A i napięciu 3,3 V).
Rysunek 3.37.
Płytka procesora Pentium. Zdjęcie zamieszczone za zgodą firmy Intel Corporation
Procesory Pentium drugiej generacji umieszczone były w 296-końcówkowej obudowie SPGA, która nie była kompatybilna z wersjami pierwszej generacji. Jedyny sposób przejścia z procesorów pierwszej generacji na drugą polegał na wymianie płyty głównej. Procesory Pentium drugiej generacji zawierają 3,3 miliona tranzystorów — więcej niż w starszych modelach. Zastosowanie dodatkowej liczby tranzystorów wiązało się z dodaniem rozszerzenia SL nadzorującego pracę zegara kontrolera APIC (ang. advancedprogrammable interrupt controller) oraz dwuprocesorowego interfejsu.
Zadaniem kontrolera APIC oraz dwuprocesorowego interfejsu jest zarządzanie konfiguracją dwuprocesorowa, w przypadku której możliwe jest wykorzystanie na jednej płycie głównej jednocześnie dwóch procesorów Pentium drugiej generacji. Wiele płyt głównych współpracujących z procesorem Pentium przeznaczonych dla serwerów plików jest wyposażona w gniazda zgodne ze specyfikacją Socket 7, która pozwalają w pełni wykorzystać wieloprocesorowe możliwości nowych wersji procesora Pentium. Obsługa symetrycznego przetwarzania wieloprocesorowego SMP (ang. symmetric multiprocessing) na poziomie oprogramowania jest realizowana przez systemy operacyjne takie jak Windows NT i OS/2.
Procesory Pentium drugiej generacji — w celu umożliwienia pracy z częstotliwością wyższą od częstotliwości pracy głównej — wykorzystują mnożnik zegara. Przykładowo, procesor Pentium 150 MHz może pracować z ustawionym mnożnikiem o wartości x2,5, przy czym częstotliwość taktowania płyty głównej wynosi 60 MHz. Procesor Pentium taktowany zegarem 200 MHz, w przypadku płyty głównej pracującej z częstotliwością 66 MHz, ma ustawiony mnożnik o wartości x3.
Ustawienie mnożnika zegara (stosunek częstotliwości rdzenia do częstotliwości magistrali procesora) jest kontrolowane za pomocą dwóch końcówek procesora Pentium oznaczonych jako BF1 i BF2. W tabeli 3.26 pokazano, w jaki sposób ustawienia końcówek BFx wpływają na wartość mnożnika procesora Pentium.
1W przypadku procesorów taktowanych zegarem 233 i 266 MHz zostały zmienione wartości mnożnika z xl.5 na x3.5 (233 MHz) oraz z x2 na x4 266 MHz).
Niemal wszystkie płyty główne przeznaczone dla procesorów Pentium mogą pracować z trzema częstotliwościami — 50, 60 i 66 MHz. Procesory Pentium wykorzystywały różne mnożniki częstotliwości, co powodowało, że pracowały z różnymi wielokrotnościami częstotliwości płyty głównej. W tabeli 3.7 przedstawiono listę częstotliwości pracy płyt głównych i procesorów Pentium.
Nie wszystkie procesory obsługują wszystkie możliwe ustawienia końcówek BF (ang. bus freąuency) lub ich kombinacji. Mówiąc inaczej, niektóre z procesorów Pentium pracują tylko przy wybranych kombinacjach ustawień lub nawet mogą być ograniczone do jednej konkretnej konfiguracji. Wiele z nowszych płyt głównych współpracujących z procesorami Pentium było wyposażonych w zworki lub przełączniki, które umożliwiały zmianę ustawień końcówek BF, a tym samym modyfikację ustawienia mnożnika zegara procesora. Teoretycznie, poprzez zmianę ustawień zworek płyty głównej możliwe jest spowodowanie, że procesor Pentium — taktowany zegarem 75 MHz — będzie pracował z częstotliwością 133 MHz. Taka operacja jest określana mianem przetaktowywania. Została ona omówiona w punkcie „Przetaktowywanie", znajdującym się wcześniej w rozdziale. To, w jaki sposób firma Intel zniechęciła do przetaktowywania nowszych modeli procesora Pentium, zostało opisane na końcu podrozdziału „Wytwarzanie procesorów".
Intel oferował też jednoukladową wersję OverDrive przeznaczoną dla procesorów Pentium drugiej generacji. Tego typu procesory stosują tylko mnożnik o wartości x3 i służą aktualizacji istniejących procesorów opartych na gnieździe Socket 5 lub 7. Dodatkowo zwiększają częstotliwość pracy do 200 MHz (w przypadku płyty głównej taktowanej zegarem 66 MHz) i są wyposażone w rozszerzenie MMX. Mówiąc wprost, zastosowanie wersji OverDrive w przypadku komputera z zainstalowanym procesorem Pentium 100, 133 lub 166 oznacza uzyskanie procesora taktowanego zegarem 200 MHz. Prawdopodobnie największą zaletą procesorów Pentium OverDrive jest zastosowanie w nich rozszerzenia MMX. Rozwiązanie to w przypadku używania bardzo popularnych obecnie aplikacji multimedialnych pozwala uzyskać znaczny wzrost wydajności.
Jeśli jesteś posiadaczem płyty głównej wyposażonej w gniazdo Socket 7 może okazać się zbyteczne zastosowanie specjalnej wersji procesora Pentium OverDrive wyposażonej w stabilizator napięcia. Zamiast niego można zaopatrzyć się w zwykły procesor Pentium lub układ z nim kompatybilny, a następnie zainstalować go w miejsce poprzedniego procesora. Należy pamiętać o ustawieniu odpowiedniej wartości mnożnika i napięcia wymaganego przez nowy procesor.
Procesory Pentium-MMX
Trzecia generacja procesorów Pentium (o nazwie kodowej P55C) pojawiła się na rynku w styczniu 1997 r. i jako nowość była wyposażona w rozwiązanie nazwane przez firmę Intel terminem MMX (rysunek 3.38). Procesory Pentium-MMX były dostępne w następujących wersjach — 66/166, 66/200 i 66/233 MHz, natomiast w przypadku procesorów przeznaczonych dla komputerów przenośnych dodatkowo w wersję 66/266 MHz. Procesory z rozszerzeniem MMX były bardzo podobne do procesorów Pentium drugiej generacji. Zastosowano w nich następujące elementy poprzedniej generacji — architekturę superskalarna, obsługę wielu procesorów, zintegrowany lokalny kontroler APIC oraz funkcje zarządzania energią. Do nowości zastosowanych w procesorach trzeciej generacji należy zaliczyć — moduł MMX oparty na potokach, pamięć Cache pracującą w trybie write-back o pojemności 16 kB (przy 8 kB w starszych modelach Pentium) i przechowującą kod instrukcji oraz 4,5 miliona tranzystorów. Procesory Pentium-MMX były wytwarzane w ulepszonej technologii 0.35 mikrometra (CMOS), pozwalającej na obniżenie napięcia zasilającego do 2,8 V. Nowsze modele procesorów taktowane zegarem 233 i 266 MHz i przeznaczone dla komputerów przenośnych zostały wykonane w technologii 0,25 mikrona i są zasilane napięciem wynoszącym tylko 1,8 V. Dzięki nowej technologii wytwarzania procesorów wersja pracująca z częstotliwością 266 MHz w rzeczywistości zużywa mniej energii niż procesor pozbawiony rozszerzenia MMX taktowany zegarem 133 MHz.
Rysunek 3.38.
Procesor Pentium MMX. Po lewej stronie widać spód procesora, z którego — w celu odsłonięcia jego ptytki
usunięto warstwę ochronną. Zdjęcie zamieszczone za zgodą firmy Intel Corporation
Aby zainstalować procesor Pentium-MMX, płyta główna musi obsługiwać napięcia przez niego wymagane (2,8 V lub niższe). W celu umożliwienia produkcji bardziej uniwersalnych płyt głównych obsługujących różne wartości napięcia, firma Intel zaprojektowała gniazdo Socket 7 z modułem VRM. Moduł VRM, którego zadaniem jest dostarczanie wymaganego napięcia, wyposażony jest w gniazdo montowane w pobliżu procesora. Ze względu na to, że moduł VRM jest łatwo wymienialny, przystosowanie płyty głównej do obsługi napięć wymaganych przez nowsze procesory Pentium stało się o wiele prostsze.
Oczywiście niższe napięcie zasilania procesora Pentium-MMX jest wskazane, ale tak naprawdę jego główną zaletą jest MMX. Rozszerzenie MMX opiera się na funkcji określanej przez firmę Intel mianem SIMD (ang. single instruction multiple data), dzięki której możliwe jest wykonywanie przez jedną instrukcję na wielu blokach danych tej samej funkcji. Poza tym MMX zawiera 57 nowych instrukcji specjalnie zaprojektowanych do przetwarzania grafiki, dźwięku i plików wideo.
Aby w jak największym stopniu umożliwić aktualizację do procesora Pentium-MMX, płyta główna współpracująca z procesorami Pentium musi być wyposażona w 321-końcówkowe gniazdo w pełni zgodne ze specyfikacją Intel Socket 7. Powinna również zawierać gniazdo VRM. Jeśli dysponujesz dwuprocesorowa płytą główną, wtedy, w celu wykorzystania funkcji SMP dostępnej w niektórych systemach operacyjnych, należy zainstalować drugi procesor Pentium.
Defekty procesora Pentium
Prawdopodobnie najsłynniejszym w historii błędem procesora stał się legendarny już błąd koprocesora procesora Pentium. Często błąd ten był nazywany błędem FDIV, ponieważ przede wszystkim występował w instrukcji FDIV (ang. floating-point divide), ale pojawiał się również w kilku innych instrukcjach wykonujących operację dzielenia. Firma Intel oficjalnie odnosi się do tego problemu w Erracie nr 23 zatytułowanej Slight precision loss for floating-point divides on specific operand pairs (Częściowa utrata dokładności przy wykonywaniu operacji dzielenia określonych par argumentów zmiennoprzecinkowych). Błąd został usunięty w wersji (ang. stepping) Dl lub nowszej, występującej w procesorach Pentium taktowanych zegarem 60 i 66 MHz oraz w wersji B5 lub nowszej zastosowanej w procesorach pracujących z częstotliwościami 75, 90, 100 MHz. Procesory taktowane zegarem 120 MHz lub szybszym zawierały nowsze wersje, które były pozbawione błędu. W dalszej części rozdziału znajdują się tabele zawierające wszystkie modele procesora Pentium, zastosowane w nich wersje oraz wyjaśnienie sposobu ich identyfikacji.
Błąd koprocesora w chwili, gdy w październiku 1994 r. po raz pierwszy został opisany na stronach internetowych przez pewnego matematyka, wywołał żywą reakcję. W ciągu kilku dni informacja o wykrytym defekcie obiegła cały świat i nawet usłyszały o nim osoby, które nie miały do czynienia z komputerami. Procesor Pentium niepoprawnie wykonywał operację dzielenia liczb zmiennoprzecinkowych. Błąd pojawiał się przy wystąpieniu określonej kombinacji liczb, przy czym swoim zasięgiem sięgał powyżej trzeciego miejsca po przecinku.
Mniej więcej w czasie, gdy o błędzie wiedzieli już wszyscy, firma Intel do następnych wersji procesorów Pentium taktowanych zegarem 75, 90, 100 MHz, jak również wersji pracujących z częstotliwościami 60 i 66 MHz. zdążyła, poza innymi modyfikacjami, wprowadzić poprawkę tego błędu.
Po tym, jak informację dotyczącą błędu podano do publicznej wiadomości, a firma Intel przyznała że wiedziała o nim wcześniej, ludzie oszaleli. Wiele osób zaczęło sprawdzać obliczenia wykonane za pomocą arkuszy kalkulacyjnych i innych aplikacji. Wiele z nich stwierdziło, że problem związany z błędem koprocesora też ich dotyczy, a oni o tym nie wiedzieli. Inni, którzy doszukali się błędów w obliczeniach, w znacznym stopniu przestali ufać jednostce centralnej komputera PC. Wiele osób tak bardzo zaufało wynikom generowanym przez komputer, że po uświadomieniu sobie, że nie jest on nawet w stanie poprawnie wykonywać obliczeń na liczbach, przechodziło trudne chwile!
Jeden z ciekawszych objawów wynikłych z szumu związanego z błędem procesora Pentium polegał na tym, że prawdopodobnie wiele osób będzie mniej ufnych wobec komputerów i zacznie przeprowadzać dodatkowe sprawdzenie poprawności wyników ważnych obliczeń. Wniosek końcowy jest taki, że jeśli przetwarzane dane i wykonywane obliczenia są wystarczająco ważne, wtedy należy rozważyć opracowanie dodatkowej proceduty sprawdzającej uzyskane wyniki. W kilku programach wykonujących obliczenia matematyczne stwierdzono, że występują błędy. Przykładowo, błąd został znaleziony w wyniku funkcji stosowanej w programie Excel 5.0. który po części przypisano defektowi procesora Pentium. Jednak w tym przypadku problem wynikał z błędu występującego w kodzie programu (został usunięty w wersji 5.0c i nowszych).
Firma Intel ostatecznie doszła do wniosku, że dla dobra końcowego użytkownika, jak i obrazu firmy w oczach opinii publicznej najlepszym rozwiązaniem będzie udzielenie dożywotniej gwarancji na wymianę procesorów posiadających defekt. A zatem, jeśli kiedykolwiek spotkasz się z jednym z procesorów, których dotyczy Errata nr 23 z opisanym błędem koprocesora, wtedy firma Intel dokona wymiany takiego egzemplarza na odpowiednik pozbawiony defektu. Zazwyczaj, w takiej sytuacji wystarczy skontaktować się z przedstawicielem firmy Intel i zażądać wymiany procesora. Po odebraniu zgłoszenia nowy procesor, którego szybkość odpowiada szybkości wadliwego egzemplarza zostanie w ciągu doby dostarczony do klienta. Wymiana jest bezpłatna i uwzględnia koszty przesyłki. Po otrzymaniu przesyłki należy wyjąć stary procesor i umieścić go w pudelku, a nowy procesor zainstalować w gnieździe płyty głównej. Po zapakowaniu starego procesora należy skontaktować się z firmą kurierską, która dostarczy go do producenta. W chwili, gdy po raz pierwszy skontaktujesz się z firmą Intel z żądaniem wymiany procesora, zostaniesz poproszony o podanie numeru karty kredytowej. Jest to tylko forma zabezpieczenia na wypadek, gdyby wadliwy procesor nie został zwrócony. W ciągu określonego okresu czasu związanego ze zwrotem wadliwego procesora nie zostaniesz obciążony żadnymi kosztami. Firma Intel zaznaczyła, że wszystkie procesory zawierające defekt zostaną zniszczone i w żadnej innej postaci nie zostaną ponownie wprowadzone do sprzedaży.
Procedura sprawdzająca obecność błędu koprocesora
Wykrycie błędu procesora Pentium jest stosunkowo prostym zadaniem. Wszystko, co należy zrobić, sprowadza się do wykonania jednej z zamieszczonych poniżej procedur testowych stosujących operację dzielenia, a następnie sprawdzenia, czy uzyskane wyniki są zgodne z poprawnymi wartościami.
Operacja dzielenia może być wykonana przy użyciu arkusza kalkulacyjnego takiego jak Lotus 1-2-3, Microsoft Excel lub dowolnego innego lub nawet programu Kalkulator wbudowanego w system Microsoft Windows. Można również posłużyć się każdym innym programem obliczeniowym korzystającym z koprocesora. Na początku należy się upewnić, że w czasie przeprowadzania testu koprocesor jest włączony. Zazwyczaj wiąże się to z zastosowaniem specjalnego polecenia lub ustawienia specyficznego dla wykorzystywanej aplikacji, które dodatkowo pozwoli przeprowadzić procedurę testową niezależnie od tego. czy procesor jest wadliwy czy nie.
Najpoważniejsze błędy wynikające z defektu koprocesora procesora Pentium pojawiają się już przy trzeciej cyfrze znaczącej uzyskanego wyniku. Poniżej przedstawiono przykład jednego z najpoważniejszych błędów:
962 306 957 033 / 11 010 046 = 87 402,6282027341 (wynik prawidłowy)
962 306 957 033 / 11 010 046 = 87 399,5805831329 (wadliwy procesor Pentium)
Należy zauważyć, że w szczególności program Kalkulator może nie wyświetlić wyniku o tak dużej dokładności jak powyżej. Większość arkuszy kalkulacyjnych jest ograniczona do wyświetlania wyników zawierających od 13 do 15 cyfr znaczących.
Jak można wywnioskować na podstawie powyższego przykładu, błąd pojawia się przy trzeciej cyfrze znaczącej wyniku. Po sprawdzeniu ponad 5000 par liczb całkowitych o długości od 5 do 15 cyfr, w których stwierdzono nieprawidłowy wynik spowodowany błędem procesora Pentium, okazało się, że najbardziej prawdopodobne są błędy pojawiające się w szóstej cyfrze znaczącej wyniku.
Istnieje kilka metod obejścia błędu koprocesora, ale ich zastosowanie wiąże się ze spadkiem wydajności procesora. Ze względu na fakt, że firma Intel w ramach udzielonej dożywotniej gwarancji zgodziła się wymieniać wadliwe procesory, najlepszym obejściem problemu jest skorzystanie z bezpłatnej wymiany!
Błędy związane z zarządzaniem energią
Wraz z pojawieniem się procesorów Pentium drugiej generacji, firma Intel dodała funkcje umożliwiające ich zastosowanie w systemach charakteryzujących się efektywnym zużyciem energii. Tego typu systemy zazwyczaj są określane mianem systemów Energy Star (ang. Energy Star systems). Nazwa wynika stąd, że tego typu systemy są zgodne ze specyfikacją określoną w ramach programu EPA Energy Star. Nieoficjalnie przez wielu użytkowników wykorzystywane jest również określenie zielonych komputerów PC (ang. green PCs).
Niestety, wraz z zastosowaniem funkcji energooszczędnych pojawiło się również kilka błędów, wskutek których funkcje te nie działały prawidłowo lub musiały zostać wyłączone. Wspomniane błędy występują w niektórych funkcjach związanych z możliwościami zarządzania energią oferowanymi przez tryb SMM. Problemy wynikłe z wystąpienia błędów dotyczą tylko procesorów drugiej generacji w wersjach taktowanych zegarem 75. 90, 100 MHz. Problemy nie dotyczą procesorów pierwszej generacji taktowanych zegarem 60 i 66 MHz, ponieważ nie są one wyposażone ani w tryb SMM, ani w możliwości zarządzania energią. We wszystkich wersjach procesorów pracujących z częstotliwością powyżej 120 MHz wspomniane wyżej błędy zostały usunięte.
Większość problemów jest związana z końcówką STPCLKtt oraz instrukcją HALT. W momencie wykonania przez procesor instrukcji HALT następuje zawieszenie systemu. W przypadku większości systemów jedyne rozwiązanie tego problemu polega na wyłączeniu trybów energooszczędnych takich jak tryb wstrzymania lub uśpienia. Niestety, oznacza to, że Twój „zielony komputer PC" nie będzie już taki! Najlepsza metoda usunięcia problemu polega na wymianie procesora na model wyposażony w nowszą i pozbawioną tego błędu wersję. Wspomniane błędy dotyczą wersji procesorów Pentium taktowanych zegarem 75, 90 i 100 MHz, w których zastosowano końcówkę BI. natomiast zostały usunięte w modelach wykorzystujących wersję B3 lub nowszą.
Modele i wersje procesora Pentium
Jesteśmy świadomi tego. że tak jak żaden program nigdy nie będzie doskonały, tak też jest w przypadku procesorów. Od czasu do czasu producenci procesorów wykonują zestawienie zawierające zidentyfikowane problemy, a następnie uwzględniają je w procesie produkcyjnym pod postacią nowej wersji (ang. steppmg). czyli zestawu masek, które dodają poprawki zaistniałych błędów. Każdy następna wersja, w porównaniu z poprzednimi, jest lepsza i bardziej udoskonalona. Chociaż żaden procesor dotąd nie był doskonały, to wszystkie kolejne wersje coraz bardziej zbliżają się do osiągnięcia tego poziomu. W trakcie cyklu produkcyjnego typowego procesora jego producent może wprowadzić pół tuzina, a nawet więcej wersji.
Aby zapoznać się z zawartością tabel, w których zebrano wersje i kolejne modele procesorów Pentium, należy zajrzeć na stronę internetową firmy Intel.
Aby poznać parametry określonego procesora należy, w tabeli zawierającej tego typu dane odszukać numer indentyfikacyjny. Aby określić taki numer, należy odczytać go bezpośrednio z procesora. Może on być umieszczony zarówno na wierzchu, jak i na spodzie jego obudowy. Jeśli radiator jest przyklejony do procesora, wtedy należy w całości wyjąć z gniazda oba elementy i odczytać numer znajdujący się na spodzie procesora. Po poznaniu numeru identyfikacyjnego można go poszukać w przewodniku Speciflcation Guide publikowanym przez firmę Intel na jej stronie internetowej. Dzięki niemu można poznać parametry określonego procesora. Ze względu na to, że firma Intel cały czas wprowadza do sprzedaży nowe wersje procesorów należy zaglądać na jej stronę internetową i posługując się przewodnikiem Quick Reference Guide, znajdującym się w części przeznaczonej dla projektantów, szukać informacji na temat procesorów Pentium. Również tam zostały zebrane parametry wszystkich aktualnie dostępnych procesorów, których wyszukiwanie opiera się na znajomości numeru identyfikacyjnego.
Godna uwagi jest informacja, że różne wersje procesorów Pentium są zasilane napięciami nieznacznie się od siebie różniącymi. W tabeli 3.27 przedstawiono różne wersje procesorów i wymagane przez nie napięcia.
Wiele nowszych modeli ptyt głównych przeznaczonych dla procesorów Pentium jest wyposażonych w zworki, które umożliwiają ustawianie różnych wartości napięć. Jeśli pojawiły się problemy z określonym typem procesora, może to oznaczać, że napięcia obsługiwane przez płytę główną nie są zgodne z wartościami przez niego wymaganymi.
Jeśli zamierzasz nabyć starszy model komputera opartego na procesorze Pentium, osobiście polecam systemy wyposażone w procesory drugiej generacji (Model 2) lub nowsze typy taktowane zegarem 75 MHz albo wyższym. Na pewno powinieneś sprawdzić, czy procesor jest w wersji C2 lub nowszej. Niemalże wszystkie najważniejsze błędy i problemy zostały usunięte w tej i następnych wersjach. Nowsze modele procesorów Pentium są pozbawione wszelkich poważniejszych błędów.
Tabela 3.27. Napięcia zasilania procesorów Pentium
Model |
Wersja |
Typ napięcia zasilania |
Zakres napięć (V) |
1 |
— |
Std. |
4,75 - 5.25 |
1 |
— |
5vl |
4,90-5,25 |
1 |
— |
5v2 |
4,90 - 5,40 |
1 |
— |
5v3 |
5,15-5,40 |
2+ |
BI -B5 |
Std. |
3,135-3,465 |
2+ |
C2+ |
Std. |
3,135 -3.600 |
2+ |
— |
VR |
3,300-3,465 |
2+ |
BI-B5 |
VRE |
3.45-3,60 |
2+ |
C2+ |
VRE |
3,40-3,60 |
4+ |
— |
MMX |
2,70 - 2,90 |
4 |
3 |
Mobile |
2,285 - 2,665 |
4 |
3 |
Mobile |
2.10-2,34 |
8 |
1 |
Mobile |
1,850-2,150 |
8 |
1 |
Mobile |
1,665- 1,935 |
Procesor AMD-K5
AMD-K5 jest procesorem kompatybilnym z procesorem Pentium. Został zaprojektowany przez firmę AMD i był dostępny w następujących wersjach — PR75, PR90, PR100, PR133 i PR166. Ze względu na fakt zachowania fizycznej i funkcjonalnej kompatybilności, wszystkie płyty główne współpracujące z procesorami Intel Pentium, powinny również obsługiwać procesor AMD-K5. Może się okazać, że do poprawnej identyfikacji procesora AMD-K5 konieczna będzie aktualizacja BIOS-u. Procesor K5 posiada następujące cechy:
Pamięć Cache przechowującą instrukcje o pojemności 16 kB oraz pamięć Cache przechowującą dane o pojemności 8 kB i pracującą w trybie write-back.
Dynamiczne wykonywanie — przewidywanie rozgałęzień i wykonywanie spekulatywne.
5-poziomowy potok (podobny do stosowanych w procesorach RISC) składający się z sześciu równoległych modułów funkcjonalnych.
Koprocesor o dużej wydajności.
Ustawiane za pomocą zworek wartości mnożnika częstotliwości (x 1,5; x 1,75 i x2).
Procesor K5 jest sprzedawany z zastosowanym oznaczeniami PR, które oznaczają że podana na nim liczba nie odpowiada rzeczywistej częstotliwości zegara, a określa tylko pozorną szybkość zmierzoną przy wykonywaniu określonego typu aplikacji.
Należy zauważyć, że rzeczywiste częstotliwości pracy kilku procesorów firmy AMD nie są równe wartościom podanym w ramach oznaczeń PR. Przykładowo, procesor w wersji PR-166 w rzeczywistości jest taktowany zegarem 117 MHz. Czasami może to doprowadzić do sytuacji, że BIOS, zamiast częstotliwości podanej według oznaczenia PR porównującego szybkość procesora AMD z odpowiednim układem Intel Pentium, wyświetli jego rzeczywistą szybkość. Zawyżanie częstotliwości stosowane przez firmę AMD wynika z przekonania wyższości architektury jej procesorów nad procesorami Pentium. Ulepszenia zastosowane w architekturze procesorów K5 pozwalają uzyskać wydajność procesorów Pentium bez konieczności stosowania tej samej częstotliwości. Pomimo tak znacznych ulepszeń, dział marketingu firmy AMD uznał procesor K5 za układ piątej generacji, do której zalicza się również procesor Pentium.
Procesor AMD-K5 jest zasilany napięciem 3,52 V (ustawienie VRE). Zainstalowanie procesora K5 na niektórych starszych modelach płyt głównych, w których napięcie standardowe ma wartość 3,3 V (niższe od wymaganego) może spowodować jego błędne działanie. Ze względu na stosunkowo małe częstotliwości zegara procesorów K5 i problemy ze zgodnością, z jakimi mieli do czynienia niektórzy użytkownicy, firma AMD zastąpiła je układami z serii K6.
Intel P6 (686). Procesory szóstej generacji
Procesory P6 (686) reprezentują nową generację dysponującą możliwościami nie spotykanymi w poprzednich. Pierwszym przedstawicielem rodziny procesorów P6 jest układ Pentium Pro wprowadzony na rynek w listopadzie 1995 r. Od tego momentu firma Intel zaprojektowała wiele wersji procesorów P6. z których każdy oparty był na rdzeniu procesora Pentium Pro. W tabeli 3.28 zebrano różne wersje procesorów z rodziny P6.
Tabela 3.28. Wersje procesorów Intel P6
Pentium Pro |
Oryginalny procesor P6 — zawiera pamięć Cache L2 o pojemności 256, 512 kB lub 1 MB działającą z częstotliwością rdzenia procesora. |
Pentium 11 |
P6 z pamięcią Cache L2 o pojemności 512 kB działającą z częstotliwością równą 1/2 częstotliwości rdzenia procesora. |
Pentium 11 Xeon |
P6 z pamięcią Cache L2 o pojemności 512 kB, 1 MB lub 2 MB działającą z częstotliwością rdzenia procesora. |
Celeron |
P6 bez pamięci Cache L2. |
Celeron-A |
P6 z pamięcią Cache L2 o pojemności 128 kB działającą z pełną częstotliwością rdzenia procesora i z nim zintegrowaną. |
Pentium III |
P6 z rozszerzeniem SSE (MMX2) i pamięcią Cache L2 o pojemności 512 kB działającą z częstotliwością równą 1/2 częstotliwości rdzenia procesora. |
Pentium IIPE |
P6 z pamięcią Cache L2 o pojemności 256 kB działającą z częstotliwością rdzenia procesora. |
Pentium IIIE |
P6 z rozszerzeniem SSE (MMX2) i pamięcią Cache L2 o pojemności 256 kB lub 512 kB działającą z częstotliwością rdzenia procesora. |
Pentium III Xeon |
P6 z rozszerzeniem SSE (MMX2) i pamięcią Cache L2 o pojemności 512 kB, 1 MB lub 2 MB działającą z częstotliwością rdzenia procesora. |
Podstawową nową funkcją procesorów Pentium piątej generacji była architektura superskalarna, w której dwa moduły wykonawcze były w stanie w sposób równoległy, jednocześnie, przetwarzać wiele instrukcji. W późniejszych wersjach procesorów piątej generacji dodano również rozszerzenie MMX. A zatem, co takiego nowego firma Intel dodała w procesorach szóstej generacji, aby mogła je tak nazywać? Poza wieloma mniej istotnymi ulepszeniami, do nowych funkcji o kluczowym znaczeniu zastosowanych we wszystkich procesorach szóstej generacji należy zaliczyć architekturę Dynamie Execution oraz DIB (ang. Dual Independent Bus) oraz znacznie ulepszony projekt architektury superskalarnej.
Dynamiczne wykonywanie
Architektura Dynamie Execution pozwala na równolegle wykonywanie przez procesor większej ilości instrukcji, dzięki czemu są one wykonywane znacznie szybciej. To rozwiązanie składa się z trzech następujących podstawowych elementów:
Przewidywanie z uwzględnieniem wielu rozgałęzień (ang. multiple branch prediction). Przy użyciu kilku rozgałęzień przewiduje sposób wykonania programu.
Analiza przepływu danych (ang. data flow analysis). Niezależnie od kolejkowania w oryginalnym programie instrukcji gotowych do wykonania, planuje kolejność ich przetworzenia.
Wykonywanie spekulatywne (ang. speculative executioń). Na podstawie wcześniejszego sprawdzenia licznika programu i oceny prawdopodobieństwa wykorzystania instrukcji zwiększa szybkość ich przetwarzania.
Architektura DIB
Jedna z podstawowych funkcji architektury procesorów P6 jest określana terminem Dual Independent Bus. Jest on związany z tym, że procesor jest wyposażony w dwie magistrale danych —jedną wykorzystywaną przez system (płytę główną), a drugą współpracującą tylko z pamięcią podręczną. Dzięki niej, pamięć Cache może pracować z szybkością dotąd nieosiągalną.
Inne ulepszenia procesorów szóstej generacji
W porównaniu z architekturą superskalarna procesorów P5, w przypadku procesorów P6 została ona poszerzona jeszcze o kilka następnych modułów wykonawczych, a także dokonano rozbicia instrukcji na specjalne mikro-operacje. To właśnie w tym miejscu instrukcje CISC są zamieniane na większą ilość instrukcji RISC. Instrukcje RISC są mniejsze i prostsze do wykonania przez moduły instrukcji równoległych, dzięki czemu uzyskuje się wyższą wydajność. Zastosowanie tego typu rozwiązania pozwoliło firmie Intel przenieść w świat instrukcji CISC zalety wynikające z użycia instrukcji RISC, czyli bardzo wydajne dedykowane wykonywanie instrukcji. Należy zauważyć, że procesory P5 mają tylko dwa moduły wykonujące instrukcje, natomiast modele P6 są wyposażone przynajmniej w sześć niezależnych modułów dedykowanych przetwarzających instrukcje.
Ze względu na to, że wiele modułów wykonujących instrukcje może w ciągu jednego cyklu przetworzyć do trzech instrukcji, taka innowacja jest określana mianem 3-ścieżkowej architektury superskalarnej (ang. three-way superscalar).
Do architektury procesorów P6 zostały dodane również inne ulepszenia zwiększające wydajność, takie jak wbudowana obsługa wieloprocesorowa, rozszerzona detekcja błędów i poprawności obwodów drukowanych oraz optymalizacja programów 32-bitowych.
Pentium Pro, Pentium II i III oraz inne procesory szóstej generacji są nie tylko szybsze od procesorów Pentium, ale charakteryzują się również wieloma nowymi funkcjami i ulepszeniami architektury. Rdzeń tych procesorów jest bardzo podobny do rdzeni stosowanych w procesorach RISC. natomiast zewnętrzny interfejs instrukcji jest już rozwiązaniem typowym dla architektury Intel CISC. Dzięki rozbiciu instrukcji CISC na kilka instrukcji RISC i wykonaniu ich przy użyciu równoległych potoków wykonawczych uzyskuje się znaczny wzrost wydajności.
W porównaniu z procesorem Pentium taktowanym tym samym zegarem, procesor P6 jest szybszy, ale tylko wtedy, gdy wykonuje programy 32-bitowe. Architektura Dynamie Execution procesorów P6. została zoptymalizowana głównie pod kątem wykonywania aplikacji 32-bitowych takich jak system Windows NT. Jeśli jest wykorzystywane oprogramowanie 16-bitowe, takie jak system operacyjny Windows 95 lub 98 (w którym nadal częściowo jest stosowane 16-bitowe środowisko pracy) oraz większość starszych aplikacji, wtedy w porównaniu z układami Pentium i Pentium-MMX o podobnej szybkości procesor P6 nie osiągnie spodziewanego wzrostu wydajności. Wynika to stąd, że w takim przypadku architektura Dynamie Execution nie jest w pełni wykorzystywana. Z tego też powodu takie systemy operacyjne jak Windows NT/2000/XP są najbardziej zalecane w przypadku stosowania procesorów Pentium Pro/II/III/Celeron. Chociaż nie jest to do końca prawda (wymienione procesory znakomicie sprawdzają się w systemach Windows 95/98). to jednak systemy Windows NT/20()0/XP w lepszy sposób wykorzystają możliwości procesorów P6.
Należy zauważyć, że tak naprawdę najważniejszy nie jest sam system operacyjny, ale wykorzystywane aplikacje. Projektanci oprogramowania mają możliwość podjęcia działań pozwalających na pełne wykorzystanie zalet procesorów szóstej generacji. Należy tutaj wymienić najnowsze kompilatory zwiększające wydajność w przypadku wszystkich obecnie dostępnych procesorów firmy Intel, jak najczęstsze tworzenie 32-bitowego kodu źródłowego oraz sprawianie, by byl jak najbardziej przewidywalny, co pomoże wykorzystać zalety architektury Dynamie Execution oraz jej możliwości związanych z przewidywaniem z uwzględnieniem wielu rozgałęzień.
Procesory Pentium Pro
Następcą procesora Intel Pentium jest układ Pentium Pro. Pentium Pro był pierwszym przedstawicielem rodziny P6 lub procesorów szóstej generacji. Został zaprezentowany w listopadzie 1995 r. i powszechnie stal się dostępny w roku następnym. Procesor jest umieszczony w obudowie 387-końcówkowej i współpracuje z gniazdem Socket 8, dlatego też pod względem ilości końcówek nie jest kompatybilny z wcześniejszymi modelami procesora Pentium. Nowy procesor jest unikalnym rozwiązaniem ze względu na wykorzystanie w jego konstrukcji formatu MCM (ang. multichip module — moduł wieloukladowy), nazywanego też przez firmę Intel obudową dual cavity PGA. Wewnątrz 387-końcówkowej obudowy znajdują się dwie płytki procesora. Pierwsza z nich jest właściwym procesorem Pentium Pro (pokazanym na rysunku 3.39). natomiast druga zawiera pamięć Cache L2 o pojemności 256 (procesor Pentium Pro wyposażony w pamięć Cache 256 kB został pokazany na rysunku 3.40), 512 kB lub 1 MB. Płytka procesora składa się z 5,5 miliona tranzystorów, płytka pamięci Cache L2 o pojemności 256 kB zawiera 15,5 miliona tranzystorów, natomiast każda płytka pamięci podręcznej o pojemności 512 kB liczy 31 milionów tranzystorów. W przypadku wersji procesora Pentium Pro wyposażonego w pamięć Cache L2 1 MB liczba tranzystorów jest bliska 68 milionom! Procesor Pentium Pro dysponujący taką ilością pamięci podręcznej składa się z dwóch płytek, z których każda ma pojemność 512 kB oraz płytki samego układu P6 (rysunek 3.41).
Rysunek 3.39.
Płytka procesora Pentium Pro. Zdjęcie wykorzystane za zgodąfirmy Intel Corporation
Rysunek 3.40.
Procesor Pentium Pro wyposażony w pamięć Cache U 256 kB (moduł pamięci podręcznej widoczny jest po lewej stronie płytki procesora). Zdjęcie wykorzystane za zgodąfirmy Intel Corporation
Rysunek 3.41.
Procesor Pentium Pro wyposażony w pamięć Cache L2 I MB (moduły pamięci podręcznej widoczne są w środkowej części układu i po prawej stronie płytki procesora). Zdjęcie wykorzystane za zgodą firmy Intel Corporation
Główna płytka procesora zawiera pamięć Cache LI o pojemności 16 kB, przy czym 8 kB jest przydzielone 2-ścieżkowej asocjacyjnej pamięci podręcznej przechowującej przede wszystkim instrukcje, natomiast pozostałe 8 kB należy do 4-ścieżkowej asocjacyjnej pamięci Cache służącej do przechowywania danych.
Kolejną funkcją charakterystyczną dla procesorów szóstej generacji oferowaną przez model Pentium Pro, jest architektura DIB, której zadaniem jest adresowanie pamięci o pojemnościach przekraczających możliwości architektury stosowanej w poprzedniej generacji procesorów. W skład architektury DIB wchodzą dwie magistrale — magistrala pamięci Cache L2 (całkowicie zintegrowana z obudową procesora) oraz magistrala systemowa łącząca procesor z pamięcią operacyjną. Szybkość dedykowanej magistrali pamięci Cache L2 procesora Pentium Pro odpowiada pełnej częstotliwości pracy jego rdzenia. Jest to możliwe dzięki umieszczeniu modułów pamięci podręcznej bezpośrednio w obudowie procesora Pentium Pro. Magistrala procesora pozwala na adresowanie pamięci o pojemności przekraczającej możliwości zwykłej magistrali łączącej procesor z pamięcią RAM. Dzięki niej można uzyskać do trzech razy wyższą wydajność niż w przypadku magistrali pojedynczej stosowanej w procesorach opartych na gnieździe Socket 7, takich jak Pentium.
W tabeli 3.29 zebrano parametry procesora Pentium Pro, natomiast w tabeli 3.30 zawarto parametry każdego modelu z rodziny procesorów Pentium Pro, co wynika stąd, że w przypadku każdego z nich pojawiło się kilka wersji.
Tabela 3.29. Parametry rodziny procesorów Pentium Pro
Tabela 3.30. Parametry procesorów Pentium Pro według modeli
Procesor Pentium Pro (200 MHz) wyposażony w zintegrowaną pamięć Cache L2 o pojemności 1 MB
Data wprowadzenia |
18 sierpnia 1997 r. |
Częstotliwość pracy |
200 MHz (66 MHz x 3). |
Liczba tranzystorów |
5,5 miliona (technologia 0,35 mikrona) oraz 62 miliony w pamięci Cache L2 1 MB (technologia 0,35 mikrona). |
Pamięć Cache |
Pamięć Cache LI 8 kB x 2 (16 kB), pamięć L2 1 MB (pracująca z częstotliwością rdzenia). |
Wymiary płytki |
0,552 cala (14,0 mm). |
Procesor Pentium Pro (166/180/200 MHz) |
|
Data wprowadzenia |
1 listopada 1995 r. |
Częstotliwość pracy |
200 MHz (66 MHz x 3), 180 MHz (60 MHz x 3), 166 MHz (66 MHz x 2,5). |
Liczba tranzystorów |
5,5 miliona (technologia 0,35 mikrona) oraz 15,5 miliona w pamięci Cache L2 256 kB (technologia 0,6 mikrona) lub 31 milionów w pamięci Cache L2 512 kB (technologia 0,35 mikrona). |
Pamięć Cache |
Pamięć LI 8 kB x 2 (16 kB), pamięć L2 256 lub 512 kB (pracująca z częstotliwością rdzenia). |
Wymiary płytki |
0,552 cala na każdą stronę (14,0 mm). |
Procesor Pentium Pro (150 MHz) |
|
Data wprowadzenia |
1 listopada 1995 r. |
Częstotliwość pracy |
150 MHz (60 MHz x 2,5). |
Liczba tranzystorów |
5,5 miliona (technologia 0,6 mikrona) oraz 15,5 miliona w pamięci Cache L2 256 kB (technologia 0,6 mikrona). |
Pamięć Cache |
Pamięć LI 8 kB x 2. |
Wymiary płytki |
0,691 cala na każdą stronę (17,6 mm). |
Z zestawienia wydajności według indeksu iCOMP 2.0 Index wynika, że w porównaniu ze standardowym procesorem Pentium taktowanym zegarem 200 MHz osiągającym wynik 142, procesor Pentium Pro pracujący z tą samą szybkością uzyskał imponującą wartość 220. Wyłącznie dla celów porównawczych należy zauważyć, że procesor Pentium MMX w wersji 200 MHz uplasował się, mniej więcej w środku stawki z wydajnością wyrażoną liczbą 182. Należy mieć świadomość, że w przypadku stosowania programów 16-bitowych, wydajność procesora Pentium Pro zmierzona według indeksu iCOMP 2.0 nie jest już tak imponująca.
Podobnie jak w przypadku ostatniej wersji procesora Pentium, która została wprowadzona do sprzedaży przed pojawieniem się układu Pentium Pro, pracuje on z częstotliwością będącą wielokrotnością częstotliwości pracy płyty głównej wynoszącej 66 MHz. W poniższej tabeli zebrano częstotliwości pracy procesorów Pentium Pro oraz współpracujących z nimi płyt głównych:
Typ procesora/Szybkość |
Mnożnik częstotliwości |
Częstotliwość zegara płyty głównej (MHz) |
Pentium Pro 150 |
x2,5 |
60 |
Pentium Pro 166 |
x2,5 |
66 |
Pentium Pro 180 |
x3 |
60 |
Pentium Pro 200 |
x3 |
66 |
Zintegrowana pamięć Cache L2 jest jedną z najbardziej interesujących funkcji procesora Pentium Pro. Dzięki przeniesieniu pamięci podręcznej L2 z płyty głównej do procesora Pentium Pro możliwe jest wykonywanie przez nią operacji z szybkością rdzenia. Wcześniej pamięć podręczna pracowała tylko z częstotliwością płyty głównej wynoszącą 60 lub 66 MHz. W rzeczywistości, pamięć Cache L2 dysponuje własną dodatkową 64-bi-tową magistralą, która nie musi korzystać z zewnętrznej magistrali 64-bitowej (ang. front-bus) wykorzystywanej przez procesor. Rejestry wewnętrzne i ścieżki danych, podobnie jak w procesorze Pentium, nadal pozostały
32-bitowe. Poprzez zintegrowanie pamięci podręcznej L2 z procesorem, a tym samym uniknięcie konieczności wyposażenia płyt głównych w oddzielne moduły pamięci Cache, mogą zostać obniżone koszty ich produkcji. Niektóre płyty nadal mogą dysponować układami pamięci podręcznej, ale według powszechnej opinii dotyczącej stosowania pamięci Cache L3 (jak można by ją nazwać), jej użycie będzie bardziej korzystne w przypadku procesora Pentium niż układu Pentium Pro.
Jedną z funkcji oferowanych przez zintegrowaną pamięć Cache L2 jest znacznie ulepszonych wieloprocesorowość. W przeciwieństwie do procesora Pentium wyposażonego w SMP, układ Pentium Pro oferuje nowy rodzaj konfiguracji wieloprocesorowej określanej jako MPS 1.1 (ang. Multiprocessor Specification). Procesor Pentium Pro wyposażony w MPS umożliwia zastosowanie go w konfiguracji składającej się z maksymalnie czterech współpracujących ze sobą procesorów. W przeciwieństwie do innych konfiguracji wieloprocesorowych, w procesorze Pentium Pro nie występują problemy spójności zawartości pamięci podręcznej, co wynika z faktu zintegrowania pamięci Cache LI i L2 z każdym z procesorów.
Płyty główne współpracujące z procesorem Pentium Pro są wyposażone wyłącznie w szyny PCI i ISA. Ponadto firma Intel zaprojektowała dla tych płyt własne chipsety. Ze względu na wyższe wymagania związane z odprowadzaniem ciepła i odpowiednią ilością wolnego miejsca firma Intel opracowała nowy format płyt głównych o nazwie ATX. Został stworzony z myślą o lepszej obsłudze Pentium Pro i innych nowych modeli procesorów, takich jak Pentium II/III/4. Niezależnie od tego procesor Pentium Pro jest obsługiwany przez wszystkie formaty płyt głównych. Format ATX nie jest jedynym.
► ► Zajrzyj do podrozdziału „Formaty płyt głównych" znajdującego się na stronie 253 oraz do podrozdziału „Chipsety szóstej generacji (procesory P6 Pentium Pro/II/III)" znajdującego się na stronie 309.
Producenci komputerów opartych na procesorze Pentium Pro byli namawiani do pozostania przy formacie Baby-AT. Z płytami głównymi wykonanymi w tym formacie związany jest jeden duży problem, a mianowicie uzyskanie odpowiedniego odprowadzania ciepła wytwarzanego przez procesor. Większość wersji procesora Pentium Pro zużywa ponad 25 watów energii i generuje znaczną ilość ciepła.
Procesor Pentium Pro dysponuje czterema specjalnymi końcówkami VID. Mogą one posłużyć do obsługi automatycznego ustawiania napięcia zasilania. W związku z tym, płyty główne współpracujące z procesorem Pentium Pro nie muszą posiadać stabilizatora napięcia konfigurowanego za pomocą zworek, (w który była wyposażona większość płyt głównych klasy Pentium), co w znaczący sposób przyczynia się do ułatwienia konfiguracji i integracji systemów wykorzystujących procesor Pentium Pro. Końcówki VID nie przesyłają sygnałów, ale powodują otwarcie lub zamknięcie obwodu doprowadzającego napięcie. Określona sekwencja otwarć i zamknięć obwodu powoduje ustawienie napięcia wymaganego przez procesor. Poza możliwością automatycznej regulacji napięcia dodano również obsługę kolejnych specyfikacji napięć, które mogą pojawić się w przyszłych wersjach procesora Pentium Pro. Końcówki VID zostały oznaczone symbolami od VID0 do VID3. Objaśnienia końcówek znajdują się w tabeli 3.31. Jedynka w tabeli oznacza końcówkę w stanie rozwarcia, natomiast zero odnosi się do stanu zwarcia (końcówka połączona z masą). Stabilizator napięcia znajdujący się na płycie głównej powinien dostarczyć żądane napięcie lub samoczynnie się wyłączyć.
Większość procesorów Pentium Pro jest zasilana napięciem 3.3 V, ale niektóre działają przy wartości 3.1 V. Należy zauważyć, że ustawienie 1111 (wszystkie końcówki rozwarte) może być pomocne przy stwierdzaniu braku procesora w gnieździe.
Tabela 3.31. Definicja napięć zasilających procesora Pentium Pro
VID[3:0] |
Wartość napięcia (V) |
VID[3:0] |
Wartość napięcia (V) |
0000 |
3,5 |
1000 |
2.7 |
0001 |
3,4 |
1001 |
2,6 |
0010 |
3,3 |
1010 |
2,5 |
0011 |
3,2 |
1011 |
2,4 |
0100 |
3,1 |
1100 |
2,3 |
0101 |
3,0 |
1101 |
2,2 |
0110 |
2,9 |
1110 |
2,1 |
0111 |
2,8 |
1111 |
Brak procesora |
Procesor Pentium Pro nigdy nie zyskał dużej popularności wśród użytkowników komputerów osobistych, ale za to. dzięki wykorzystaniu bardzo wydajnej wewnętrznej pamięci Cache L2 pracującej z szybkością rdzenia, zdobył uznanie na rynku serwerów plików. Przez jakiś czas firma Intel oferowała dla procesorów Pentium II wersję OverDrive. ale obecnie nie jest ona dostępna dla żadnego układu. Firma PowerLeap oferuje dla procesora Pentium Pro kilka aktualizacji korzystających z układów Celeron PPGA o szybkości 700 MHz.
Procesory Pentium II
Firma Intel zaprezentowała procesor Pentium II w maju 1997 r. Przed swoją oficjalną premierą, procesor Pentium 11 byl powszechnie znany pod swoją nazwą kodową Klamath. W branży komputerowej, w związku z nowym procesorem, pojawiło się wiele spekulacji. Chociaż procesor Pentium II właściwie jest takim samym układem jak procesor Pentium Pro szóstej generacji z zastosowanym rozszerzeniem MMX (zawierający podwójną pamięć Cache LI i 57 nowych instrukcji MMX), to jednak w jego architekturze znalazło się kilka ulepszeń. Płytka procesora Pentium II została pokazana na rysunku 3.42.
Rysunek 3.42.
Płytka procesora Pentium II. Zdjęcie wykorzystane za zgodąfirmy Intel Corporation
Z konstrukcyjnego punktu widzenia w porówaniu z poprzednimi procesorami naprawdę było to coś nowego. W przeciwieństwie do niemalże wszystkich typów procesorów dotąd wyprodukowanych i umieszczonych w obudowie montowanej w gnieździe, procesor Pentium II charakteryzuje się nową obudową SEC. Sam procesor wraz z kilkoma modułami pamięci Cache L2 jest umieszczony na niewielkiej płytce drukowanej (bardzo podobnej do powiększonego modułu pamięci SIMM) pokazanej na rysunku 3.43, która jest następnie szczelnie zamykana w obudowie wykonanej z plastiku i metalu. Obudowa procesora jest instalowana na płycie głównej przy użyciu gniazda Slot 1 bardzo podobnego do gniazda kart rozszerzeń.
Wśród obudów SEC można wyróżnić dwie odmiany — SECC (ang. single edge conlact cartridge) i SECC2. Na rysunku 3.44 została pokazana konstrukcja obudowy SECC, natomiast na rysunku 3.45 obudowy SECC2.
Jak można wywnioskować z obu rysunków, obudowa SECC2, ze względu na zastosowanie mniejszej ilości elementów, jest tańsza w wykonaniu. Pozwala również uzyskać bardziej bezpośredni kontakt radiatora z procesorem, co polepsza odprowadzanie ciepła. Na początku 1999 r. firma Intel zaniechała produkcji obudowy SECC na rzecz wersji SECC2. W efekcie, wszystkie późniejsze modele procesora Pentium II i Pentium III w wersji Slot 1 były wyposażone w ulepszoną obudowę SECC2.
Rysunek 3.43.
Płytka drukowana
procesora Pentium II
(zamknięta
w obudowie SEC).
Zdjęcie wykorzystane
za zgodąfirmy
Intel Corporation
Rysunek 3.44.
Elementy obudowy SECC z widoczną płytką drukowaną procesora
Rysunek 3.45.
Dwa elementy obudowy SECC2 z widoczną płytką drukowaną procesora zamykaną tylko z jednej strony
Dzięki umieszczeniu poszczególnych modułów na płytce drukowanej, a nie tak jak w procesorze Pentium Pro w obudowie wieloukładowej, firma Intel znacznie obniżyła koszty produkcji procesorów Pentium II. W przyszłych modelach procesorów, firma Intel może również zastosować moduły pamięci podręcznej wyprodukowane przez innych producentów, a tym samym zmieniać jej pojemność.
Typ procesora/Częstotliwość |
Mnożnik zegara |
Częstotliwość płyty głównej |
Pentium II 233 MHz |
x3,5 |
66 MHz |
Pentium II 266 MHz |
x4 |
66 MHz |
Pentium II 300 MHz |
x4,5 |
66 MHz |
Pentium II 333 MHz |
x5 |
66 MHz |
Pentium II 350 MHz |
x3,5 |
100 MHz |
Pentium II 400 MHz |
x4 |
100 MHz |
Pentium 11 450 MHz |
x4,5 |
100 MHz |
Rdzeń procesora Pentium II zawiera 7,5 miliona tranzystorów i jest oparty na zaawansowanej architekturze Intel P6. Procesor początkowo był wykonywany w technologii 0,35 mikrona, ale w przypadku modeli taktowanych zegarem 333 MHz i wyższym zastosowano technologię 0,25 mikrona. Dzięki temu uzyskano płytkę o mniejszych rozmiarach, co pozwoliło na zwiększenie częstotliwości pracy rdzenia oraz zmniejszenie zużycia energii. W porównaniu z procesorem Pentium taktowanym zegarem 233 MHz i wyposażonym w MMX, układ Pentium II pracujący z częstotliwością 333 MHz charakteryzuje się przyrostem wydajności wynoszącym od 75% do 150%. Ponadto wyniki multimedialnych testów porównawczych wykazały w przybliżeniu o 50% wyższą wydajność procesora Pentium II. Z zamieszczonej wcześniej tabeli 3.3 zawierającej indeks iCOMP 2.0 Index wynika, że wydajność osiągnięta przez procesor Pentium II taktowany zegarem 266 MHz jest ponad dwukrotnie wyższa od wydajności zwykłego układu Pentium pracującego z częstotliwością 200 MHz.
Pomijając różnicę w szybkości, najlepiej wyobrazić sobie procesor Pentium II jako Pentium Pro wyposażony w MMX i nieznacznie zmodyfikowaną architekturę pamięci podręcznej. Procesor Pentium II posiada takie same możliwości skalowalności w zastosowaniu w konfiguracji wieloprocesorowej jak ukiad Pentium Pro oraz zintegrowaną pamięć Cache L2. Dołączono również 57 nowych multimedialnych instrukcji oferowanych w ramach MMX oraz możliwość bardziej wydajnego przetwarzania instrukcji powtarzanych w obrębie pętli. Nowością dodaną przy okazji aktualizacji rozszerzenia MMX jest wewnętrzna pamięć Cache LI, która w porównaniu z procesorem Pentium Pro (16 kB) ma dwukrotnie większą pojemność.
W poniższej tabeli zebrano dane dotyczące zużycia energii procesorów Pentium II
Częstotliwość pracy rdzenia |
Pobór mocy |
Technologia wytwarzania |
i Napięcie |
450 MHz |
27,1 W |
0,25 mikrometra |
2,0 V |
400 MHz |
24,3 W |
0,25 mikrometra |
2,0 V |
350 MHz |
21,5 W |
0,25 mikrometra |
2,0 V |
333 MHz |
23,7 W |
0,25 mikrometra |
2,0 V |
300 MHz |
43,0 W |
0,35 mikrometra |
2,8 V |
266 MHz |
38,2 W |
0,35 mikrometra |
2,8 V |
233 MHz |
34,8 W |
0,35 mikrometra |
2,8 V |
Można zauważyć, że najszybsza wersja procesora Pentium II taktowana zegarem 450 MHz tak naprawdę zużywa mniej energii niż najwolniejsza wersja pracująca z częstotliwością 233 MHz! Stało się tak dzięki zastosowaniu nowszej technologii 0,25 mikrona oraz zasilaniu napięciem o wartości tylko 2.0 V. Kolejne wersje procesora Pentium III będą wykonywane w technologii 0,25 i 0,18 mikrona i będą wymagały jeszcze niższego napięcia.
Procesor Pentium II oferuje architekturę Dynamie Execution, która po raz pierwszy została zastosowana w procesorze Pentium Pro, i zawiera w sobie unikalne rozwiązania firmy Intel mające na celu zwiększenie wydajności. Do podstawowych funkcji architektury Dynamie Execution należy zaliczyć przewidywanie z uwzględnieniem wielu rozgałęzień, które dzięki zastosowaniu przewidywania przepływu programu, odbywającego się za pośrednictwem kilku rozgałęzień, przyspiesza jego wykonanie, analizę przepływu danych modyfikującą przebieg programu, tak aby wykonywał oczekujące instrukcje oraz wykonywanie spekulatywne, które ma za zadanie wyszukiwać instrukcje, które prawdopodobnie w najbliższym czasie zostaną przetworzone. Procesor Pentium II, celem dodatkowego zwiększenia wydajności, wykorzystując nowe bardziej zaawansowane i szybsze metody, udoskonala powyższe funkcje.
Procesor Pentium II, podobnie jak układ Pentium Pro, jest wyposażony w architekturę DIB (ang. Dual Independent Bus). Nazwa architektury DIB wynika z faktu zastosowania w procesorze Pentium II dwóch niezależnych magistral — magistrali pamięci podręcznej L2 oraz magistrali systemowej pośredniczącej pomiędzy procesorem i pamięcią operacyjną. Procesor Pentium II może jednocześnie wykorzystywać obie magistrale, dzięki czemu, w porównaniu z architekturą opartą na jednej magistrali procesora, możliwe jest przesłanie do i na zewnętrz procesora dwukrotnie większej ilości danych. W przypadku procesora Pentium II taktowanego zegarem 333 MHz architektura DIB pozwala na pracę pamięci Cache L2 z 2,5 razy większą szybkością niż w procesorze Pentium. Wynika z tego, że wraz ze wzrostem częstotliwości pracy kolejnych wersji procesora Pentium II będzie również rosła szybkość pamięci podręcznej L2. Ponadto, magistrala systemowa oparta na potokach, zamiast sekwencyjnie wykonywanych pojedynczych transakcji pozwala na ich jednoczesne równolegle przetwarzanie. Podsumowując, można powiedzieć, że wszystkie ulepszenia architektury DIB pozwalają, w porównaniu ze zwykłym procesorem Pentium współpracującym zjedna magistralą systemową, uzyskać maksymalnie trzykrotnie wyższą wydajność.
W tabeli 3.32 zebrano podstawowe parametry procesora Pentium II, natomiast w tabeli 3.33 parametry, które różniły się w poszczególnych modelach.
Tabela 3.32. Podstawowe parametry procesora Pentium II
Częstotliwość magistrali |
66. 100 MHz |
Mnożnik zegara procesora |
x3,5, x4, x4,5, x5 |
Częstotliwość pracy procesora |
233, 266, 300, 333, 350, 400, 450 MHz |
Pamięć podręczna |
Pamięć Cache LI 16 kB x 2 (32 kB) oraz L2 512 kB pracująca z 1/2 szybkości rdzenia |
Rejestry wewnętrzne |
32-bitowe |
Zewnętrzna magistrala danych |
64-bitowa magistrala systemowa z kodem korekcji błędów ECC lub 64-bitowa magistrala pamięci podręcznej (ECC opcjonalne) |
Magistrala adresowa pamięci |
36-bitowa |
Pojemność adresowanej pamięci |
64 GB |
Pojemność pamięci wirtualnej |
64 TB |
Typ obudowy |
242-końcówkowa obudowa SECC |
Wymiary obudowy |
5,505 cala (12,82 cm) x 2,473 cala (6,28 cm) x 0,647 cala (1,64 cm) |
Koprocesor |
Wbudowany |
Zarządzanie energią |
SMM |
Pamięć Cache LI zawsze pracuje z peiną szybkością rdzenia, ponieważ jest bezpośrednio zintegrowana z płytką procesora. Pamięć podręczna L2 procesora Pentium II zazwyczaj jest dwa razy wolniejsza od rdzenia, co pozwala na uzyskanie dodatkowych oszczędności wynikających z użycia tańszych modułów. Przykładowo, w przypadku procesora Pentium II taktowanego zegarem 333 MHz, pamięć podręczna LI pracuje z taką samą częstotliwością, natomiast pamięć Cache L2 z częstotliwością 167 MHz. Chociaż pamięć podręczna L2 nie pracuje już, jak w procesorze Pentium Pro, z szybkością rdzenia, to jednak nadal jest znacznie wydajniejsza od pamięci Cache zainstalowanej na płycie głównej taktowanej, jak w większości płyt klasy Pentium opartych na gnieździe Socket 7. zegarem 66 MHz. Firma Intel twierdzi, że architektura DIB zastosowana w procesorze Pentium II pozwala, w porównaniu ze zwykłym systemem klasy Pentium opartym na pojedynczej magistrali procesora, uzyskać do trzech razy wyższą wydajność.
Tabela 3.33. Parametry procesora Pentium II według modelu
Procesor Pentium II MMX (350, 400, 450 MHz)
Data wprowadzenia |
15 kwietnia 1998 r. |
Częstotliwość pracy |
350 MHz (100 MHz x 3,5), 400 MHz (100 MHz x 4), 450 MHz (100 MHz x 4,5) |
Wydajność wg iCOMP Index 2.0 |
386 (350 MHz), 440 (400 MHz), 483 (450 MHz) |
Liczba tranzystorów |
7,5 miliona (technologia 0,25 mikrometra) oraz 31 milionów w pamięci Cache L2 512 kB |
Pojemność pamięci RAM obsługiwanej przez pamięć Cache |
4 GB |
Napięcie zasilania |
2,0 V |
Gniazdo |
Slot 2 |
Wymiary płytki |
0,400 cala na jedną stronę (10,2 mm) |
Procesor Mobile Pentium II (266, 300, 333, 366 MHz) |
|
Data wprowadzenia |
5 stycznia 1999 r. |
Częstotliwość pracy |
266, 300,333,366 MHz |
Liczba tranzystorów |
27,4 miliona (technologia 0,25 mikrometra) w zintegrowanej pamięci Cache L2 256 kB |
Obudowa BGA (ang. Bali grid array) |
ilość kulek = 615 |
Wymiary |
szerokość = 31 mm, długość = 35 mm |
Napięcie zasilania rdzenia |
1,6 V |
Pobór mocy w zależności od częstotliwości |
366 MHz = 9,5 W, 333 MHz = 8,6 W, 300 MHz = 7,7 W, 266 MHz = 7,0 W |
Procesor Pentium II MMX (333 MHz) |
|
Data wprowadzenia |
26 stycznia 1998 r. |
Częstotliwość pracy |
333 MHz (66MHz x 5) |
Wydajność wg iCOMP Index 2.0 |
366 |
Liczba tranzystorów |
7,5 miliona (technologia 0,25 mikrometra) oraz 31 milionów w pamięci Cache L2 512 kB |
Pojemność pamięci RAM obsługiwanej przez pamięć Cache |
512 MB |
Napięcie zasilania |
2,0 V |
Gniazdo |
Slot 1 |
Wymiary płytki |
0,400 cala na jedną stronę (10,2 mm) |
Procesor Pentium II MMX (300 MHz) |
|
Data wprowadzenia |
7 maj 1997 r. |
Częstotliwość pracy |
300 MHz (66MHz x 4,5) |
Wydajność wg iCOMP lndex 2.0 |
332 |
Liczba tranzystorów |
7,5 miliona (technologia 0,35 mikrometra) oraz 31 milionów w pamięci Cache L2 512 kB |
Pojemność pamięci RAM obsługiwanej przez pamięć Cache |
512 MB |
Wymiary płytki |
0,560 cala na jedną stronę (14,2 mm) |
Procesor Pentium II MMX (266 MHz)
Data wprowadzenia |
7 maj 1997 r. |
Częstotliwość pracy |
300 MHz (66MHz x 4,5) |
Wydajność wg iCOMP Index 2.0 |
303 |
Liczba tranzystorów |
7,5 miliona (technologia 0,35 mikrona) oraz 31 milionów w pamięci CacheL2 512kB |
Pojemność pamięci RAM obsługiwanej przez pamięć Cache |
512 MB |
Gniazdo |
Slot 1 |
Wymiary płytki |
0,560 cala na jedną stronę (14,2 mm) |
Procesor Pentium II MMX (233 MHz) |
|
Data wprowadzenia |
7 maj 1997 r. |
Częstotliwość pracy |
233 MHz (66MHz x 3,5) |
Wydajność wg iCOMP lndex 2.0 |
267 |
Liczba tranzystorów |
7,5 miliona (technologia 0,35 mikrona) oraz 31 milionów w pamięci Cache L2 512 kB |
Pojemność pamięci RAM obsługiwanej przez pamięć Cache |
512 MB |
Gniazdo |
Slot 1 |
Wymiary płytki |
0,560 cala na jedną stronę (14,2 mm) |
Dzięki usunięciu pamięci podręcznej z wnętrza obudowy procesora i zamontowaniu jej w postaci zewnętrznych modułów na płytce drukowanej procesora zamkniętej w obudowie kasetowej, firma Intel mogła zastosować tańsze w produkcji typy pamięci i w prostszy sposób zwiększać częstotliwość pracy procesorów. Maksymalna szybkość procesora Pentium Pro wynosząca 200 MHz wynikała głównie z braku możliwości produkcji odpowiednio taniej pamięci podręcznej, która była w stanie pracować z wyższymi częstotliwościami. Dzięki obniżeniu częstotliwości pracy pamięci Cache do 1/2 częstotliwości rdzenia możliwe było taktowanie procesora Pentium II maksymalnie zegarem 400 MHz, przy czym pamięć podręczna nadal była taktowana zegarem 200 MHz. W celu kompensacji dwukrotnie mniejszej szybkości zintegrowanej pamięci podręcznej L2 procesora Pentium II, jej pojemność została podwojona w porównaniu z 256 kB pamięci Cache dostępnej w procesorze Pentium Pro.
Należy zauważyć, że indeks TAG RAM występujący w pamięci Cache L2 procesorów Pentium II taktowanych zegarami w zakresie od 233 do 333 MHz pozwala obsłużyć maksymalnie 512 MB pamięci operacyjnej. W przypadku modeli taktowanych zegarem 350 MHz lub szybszym zastosowano ulepszony indeks TAG RAM, który umożliwia współpracę pamięci podręcznej z pamięcią RAM o pojemności do 4 GB. Jeśli planujesz zainstalować więcej niż 512 MB pamięci RAM, wtedy taka możliwość okaże się bardzo przydatna. W takim przypadku należy również rozważyć zakup wersji procesora pracującego z częstotliwością 350 MHz lub wyższą ponieważ w przeciwnym razie nastąpi znaczny spadek wydajności.
Magistrala systemowa procesora Pentium II umożliwia niezależną obsługę maksymalnie dwóch procesorów. Pozwala ona na zastosowanie magistrali pamięci podręcznej L2 w roli niedrogiego dwukanałowego rozwiązania wieloprocesorowego. Tego typu magistrale systemowe są specjalnie przeznaczone do zastosowań w serwerach lub innego rodzaju systemach o dużym znaczeniu, w których najważniejsza jest stabilność i integralność danych. Wszystkie procesory Pentium II w celu utrzymania stabilności i wysokiego stopnia integralności dysponują również magistralą systemową wyposażoną w mechanizm ponawiania i umożliwiającą dokonywanie operacji odczytu i zapisu adresów pamięci z kontrolą parzystości.
Aby zainstalować w komputerze procesor Pentium II, konieczne jest zastosowanie specjalnego mechanizmu podtrzymującego. Jego elementem składowym jest podpora montowana na powierzchni płyty głównej, której zadaniem jest zapobieżenie uszkodzeniu procesora Pentium II zainstalowanego w gnieździe Slot 1 wywołanego wstrząsami i drganiami. Mechanizmy podtrzymujące powinny być dostarczone przez producentów płyt głównych. Przykładowo, płyty główne Intel Boxed AL440FX i DK440LX, poza innymi istotnymi elementami pomagającymi w integracji systemu, są wyposażone w takie mechanizmy.
Procesor Pentium II generuje znaczną ilość ciepła, która musi zostać odprowadzona. Zadanie to jest realizowane przez radiator zamontowany na procesorze. Wiele procesorów Pentium II jest wyposażonych w radiator aktywny, który posiada wentylator. W przeciwieństwie do wentylatorów stosowanych we wcześniejszych modelach procesorów firmy Intel w wersji pudełkowej, w procesorach Pentium II wentylatory są zasilane przez 3-końcówkowy układ znajdujący się na płycie głównej. Większość płyt głównych jest wyposażonych w kilka złączy pozwalających na doprowadzenie zasilania do wentylatora.
Dla zapewnienia mechanicznego podparcia pomiędzy radiatorem aktywnym i otworami na płycie głównej konieczne może okazać się zastosowanie specjalnych podpórek radiatora. Zazwyczaj przed zainstalowaniem procesora i radiatora w otworach umieszczonych na płycie głównej w pobliżu procesora montowana jest plastikowa podpora. Większość radiatorów aktywnych składa się z dwóch elementów — wentylatora umieszczonego w plastikowej osłonie i metalowego radiatora. Radiator jest mocowany do powierzchni płytki termicznej procesora i nie powinien być z niej zdejmowany. Wentylator, jeśli przestanie działać, może być zdjęty i wymieniony. Na rysunku 3.46 pokazano obudowę SEC z założonym wentylatorem, złączami zasilania, podpórkami i otworami znajdującymi się na płycie głównej służącymi do montażu podpórek.
Otwory na wspornik radiatora
W zamieszczonych poniżej tabelach zebrano unikalne parametry niektórych wersji procesora Pentium II.
Aby dokładnie określić, którego modelu procesora Pentium II jesteś posiadaczem i jakie są jego możliwości, należy sprawdzić numer identyfikacyjny umieszczony na obudowie SEC. Numer ten jest zapisany w obszarze noszącym nazwę pola opisu procesora (ang. dynamie mark area), położonym na górnej ściance obudowy procesora. Aby określić jego lokalizację, spójrz na rysunek 3.47.
Po znalezieniu numeru identyfikacyjnego (właściwie jest to kod alfanumeryczny), w celu określenia typu posiadanego procesora należy odszukać go w tabeli 3.34.
Rysunek 3.47.
Obudowa SECC procesora Pentium II lub III
Tabela 3.34. Podstawowe parametry procesora Pentium II (wg numeru identyfikacyjnego)
CPUID = numer wewnętrzny zwrócony przez instrukcję CPUID; ECC — Error correcting code (kod korekcji błędów); OLGA = Organie land grid array; PLGA = Plastic land grid array; SECC = Single edge contact cartridge. SECC2 = Single edge contact cartridge revision 2.
1 Procesor Pentium II w wersji pudełkowej z dołączonym radiatorem aktywnym.
2Procesory są wyposażone w ulepszoną wersję pamięci Cache L2 współpracującej z pamięcią RAM o pojemności maksymalnej
4 GB. Inne modele procesora Pil dysponują pamięcią podręczną obsługującą tylko 512 MB pamięci operacyjnej.
3Tego typu procesory, w wersji pudełkowej, mogą być wyposażone w obudowę, na której widnieje nieprawdziwa informacja dotycząca pamięci Cache L2 wyposażonej w ECC.
4jest to procesor Pentium II OverDrive, w wersji pudełkowej, wyposażony w radiator aktywny przeznaczony do aktualizacji systemów opartych na procesorze Pentium Pro (gniazdo Socket 8).
5 Tego typu procesory mogą pracować tylko z fabrycznie określoną wartością mnożnika częstotliwości zegara. Ich przetaktowywanie jest możliwe tylko poprzez zwiększanie częstotliwości pracy magistrali.
Przykładowo, numer identyfikacyjny SL2KA opisuje procesor Pentium II taktowany zegarem 333 MHz (przy częstotliwości pracy płyty głównej równej 66 MHz) wyposażony w pamięć Cache L2 z kodem korekcji błędów ECC. Dodatkowo informuje, że procesor jest zasilany napięciem 2,0 V. W numerze zawarta jest również wersja (ang. stepping), po sprawdzeniu której (w opracowaniu Pentium II Specification Update Manuał opublikowanym przez firmę Intel) można się dokładnie dowiedzieć, jakie błędy zostały w niej usunięte.
Można wyróżnić dwie odmiany obudowy SECC2, które zmieniają się w zależności od zastosowanego typu rdzenia procesora. PLGA (ang. plastic land grid array) jest starszą stopniowo wycofywaną z użycia, odmianą pokrywy stosowanej w obudowach SECC. Jej miejsce zajęła mniejsza i tańsza w produkcji pokrywa rdzenia OLGA (ang. organie land grid array). Tego typu pokrywa stworzyła lepsze warunki termiczne panujące pomiędzy płytką procesora i radiatorem, który był mocowany bezpośrednio na jej górnej powierzchni. Na rysunku 3.48 widoczny jest spód obudowy SECC2. z którą łączono pokrywy rdzenia w wersji PLGA i OLGA.
Rysunek 3.48.
Obudowa SECC2 z pokrywami rdzenia w wersji PLGA (u góry) i OLGA (na dole)
Płyty główne obsługujące procesory Pentium II posiadają zasilający je regulator napięcia. Niektóre modele układu Pentium II korzystają z różnych napięć, dlatego musi istnieć możliwość dostarczania odpowiedniego napięcia dla określonego procesora, który zainstalowano. Podobnie jak w przypadku procesora Pentium Pro, a zarazem odwrotnie do starszych układów Pentium, nie trzeba ustawiać żadnych zworek lub przełączników. Określanie napięcia realizowane jest całkowicie automatycznie przez końcówki VID znajdujące się w kasecie procesora. W tabeli 3.35 przedstawiono relację występującą pomiędzy końcówkami i wybranym napięciem.
Aby zagwarantować, że system może współpracować ze wszystkimi wersjami procesora Pentium II, muszą być obsługiwane wartości napięć zaznaczone pogrubioną czcionką. Większość procesorów Pentium II jest zasilana napięciem 2,8 V. Tylko niektóre nowsze modele wymagają napięcia 2,0 V.
Pentium II Mobile Module jest wersją procesora Pentium II przeznaczoną dla komputerów przenośnych i wyposażoną w mostek północny (ang. North Bridge) bardzo wydajnego chipsetu 440BX. Jest to pierwszy na rynku chipset, który pozwala na taktowanie magistrali procesora zegarem 100 MHz. Chipset 440BX został wprowadzony do sprzedaży w tym samym okresie, co procesor Pentium II w wersjach taktowanych zegarem 350 i 400 MHz.
Do nowszych modeli procesora Pentium II należy zaliczyć Pentium IIPE, który jest przeznaczony dla komputerów przenośnych i zawiera pamięć Cache L2 o pojemności 256 kB bezpośrednio zintegrowaną z rdzeniem procesora. Wynika stąd, że pamięć Cache pracuje z pełną szybkością rdzenia, co czyni procesor Pentium IIPE szybszym od wersji przeznaczonej dla komputerów stacjonarnych wyposażonych w pamięć podręczną pracującą z 1/2 częstotliwości rdzenia.
Tabela 3.35. Końcówki napięciowe VID procesorów Pentium 11/III/Celeron
= Końcówka procesora zwarta z Vss.
= Końcówka rozwarta.
Końcówki VlD0 - VID3 stosowane w gnieździe Socket 370. Gniazdo Socket 370 obsługuje napięcia tylko z zakresu 1,30 - 2,05 V. Końcówki VID0 - VID4 stosowane w gnieździe Slot 1. Gniazdo Slot 1 obsługuje napięcia tylko z zakresu 1,30 -3,5 V.
Procesor Celeron
Można by zażartować, że procesor Celeron jest kameleonem. Początkowo był układem P6 wyposażonym w ten sam rdzeń co procesor Pentium II w swoich dwóch pierwszych wersjach. Później został wyposażony w rdzeń procesora PIH, a ostatnio wykorzystuje rdzeń układu Pentium 4. Został stworzony głównie z myślą o rynku tanich komputerów PC.
Większość funkcji procesora Celeron jest identyczna jak w przypadku procesorów Pentium II, III lub 4. Wynika to z faktu zastosowania w nim jednakowych rdzeni. Główna różnica uwidacznia się w obudowie, pojemności pamięci Cache L2 oraz częstotliwości magistrali procesora.
Pierwsza wersja procesora Celeron była dostępna w obudowie SEP lub SEPP (ang. single edge processor package). Obudowa SEP jest właściwie tym samym co obudowa SECC — wykorzystywana w procesorach Pentium II lub III w wersji Slot 1. Jedyna różnica polega na tym, że brak w niej plastikowej ozdobnej pokrywy. Jej usunięcie sprawiło, że procesor był tańszy w produkcji i w efekcie sprzedawano go po niższej cenie.
Tak naprawdę, w procesorze Celeron zastosowano identyczną płytkę drukowaną procesora, jaka znajduje się wewnątrz obudowy układu Pentium II.
► ► Zajrzyj do punktu „Obudowy SEC i SEPP" znajdującego się na stronie 127.
Nawet bez użycia plastikowej pokrywy obudowy procesora instalowanego w gnieździe Slot 1, koszty jej wyprodukowania nadal były zbyt wysokie. Głównie było to spowodowane koniecznością zastosowania mechanizmu podtrzymującego (podpory) służącego do dociskania procesora zainstalowanego w gnieździe Slot 1 płyty głównej oraz większego i bardziej złożonego radiatora. Tego typu wymagania oraz konkurencja, przede wszystkim ze strony tańszych systemów wyposażonych w procesory firmy AMD i opartych na gnieździe Socket 7, doprowadziły do podjęcia przez firmę Intel decyzji o wprowadzeniu do sprzedaży procesorów Celeron instalowanych w gnieździe typu Socket. Ze względu na to, że gniazdo procesora Celeron było wyposażone w 370 końcówek, zostało ono nazwane jako PGA-370 lub Socket 370. Obudowy procesora przystosowane do współpracy z takim gniazdem otrzymały nazwę PPGA (ang. plasticpin grid array) (rysunek 3.49) oraz FC-PGA (ang. flip chip PGA). Oba rodzaje obudów są kompatybilne z 370-końcówkowym gniazdem i ze względu na korzystanie z mniej kosztownego mechanizmu podtrzymującego oraz mniejsze wymagania związane z odprowadzaniem ciepła idealnie nadają się do zastosowania w mniejszych, a zarazem tańszych i prostszych systemach.
Rysunek 3.49.
Procesor Celeron w obudowach FC-PGA. PPGA i SEP
PGA
>- ^ Zajrzyj do punktu „Gniazdo Socket 370 (PGA-370)" znajdującego się na stronie 137.
Wszystkie modele procesora Celeron taktowane zegarem 433 MHz i wolniejszymi były dostępne w wersji SEPP instalowanej w 242-końcówkowym gnieździe Slot 1. Wersje pracujące z częstotliwością 300 MHz i wyższą były również dostępne w wersji PPGA. Oznacza to, że modele taktowane zegarem w zakresie od 300 do 433 MHz były sprzedawane w obu wersjach obudowy, natomiast modele pracujące z częstotliwością 466 MHz i wyższą tylko w wersji PPGA. Najszybsza wersja procesora Celeron przeznaczona dla gniazda Socket 370 działa z szybkością 1,4 GHz. Szybsze modele procesora Celeron oparte na architekturze procesorów Pentium 4 korzystają z gniazda Socket 478.
Płyty główne wyposażone w gniazdo Socket 370 w większości przypadków mogą współpracować zarówno z procesorami Celeron, jak i Pentium 111 umieszczonymi w obudowie PGA. Jeśli zamierzasz na płycie głównej z gniazdem Slot 1 zainstalować procesor Celeron w wersji Socket 370, wtedy powinieneś nabyć przej-ściówkę z gniazda Slot 1 na Socket 370 (zwaną też slot-ket) dostępną za około 40 - 80 złotych. Przejściówkę, wyposażoną z gniazdo Socket 370. instaluje się w gnieździe Slot 1. Na rysunku 3.50 została pokazana jedna z takich przejściówek (slot-ket).
Rysunek 3.50.
Przejściówka (slot-ket) służąca do instalacji procesorów w wersji PPGA w gnieździe
Gniazdo Socket 370
Zącze zgodne z gniazdem Slot 1
Do najważniejszych cech procesora Celeron zalicza się:
♦ Modele taktowane zegarem 300 MHz (300A) i wyższym wyposażone są w pamięć Cache L2
o pojemności 128 kB, natomiast wersje pracujące z częstotliwością 300 i 266 MHz są pozbawione pamięci podręcznej L2.
Pamięć Cache L2 obsługuje maksymalnie 4 GB pamięci RAM i jest wyposażona w kod korekcji błędu ECC.
Zawiera taki sam rdzeń jak procesor Pentium II (taktowany zegarem od 266 do 533 MHz) oraz, obecnie, procesor Pentium III (taktowany zegarem 533 MHz i szybszym) i procesor Pentium 4 (taktowany zegarem 1,7 GHz i szybszym).
Architektura Dynamie Kxecution.
W zależności od modelu, pracuje przy częstotliwości magistrali procesora wynoszącej 66, 100 lub 400 MHz.
Zaprojektowany specjalnie do zastosowań w tańszych komputerach PC.
Wykorzystuje MMX, natomiast model Celeron 533A i nowsze są wyposażone w SSE, a modele taktowane zegarem 1,7 GHz i szybszym w SSE2.
Zastosowanie obudów o niższych kosztach produkcji takie jak SEP, PPGA, FC-PGA oraz FC-PGA2.
Zintegrowana pamięć Cache LI i L2 o pojemności i typie zależnym od wersji procesora. Zazwyczaj procesor Celeron jest wyposażony w pamięć podręczną L2 o pojemności o połowę mniejszej niż
w przypadku rdzenia procesora Pentium I1/III/4.
♦ Zintegrowana dioda termiczna monitorująca temperaturę.
Procesory Intel Celeron, począwszy od wersji 300A, są wyposażone w zintegrowaną pamięć Cache L2 o pojemności 128 kB. Ze względu na wbudowanie w rdzeń procesora pochodzącego z układu Pentium II pamięci podręcznej L2 takiej pojemności, procesory Celeron taktowane zegarem od 300 do 533 MHz zawierają
19 milionów tranzystorów. Począwszy od wersji 533A, opartej na rdzeniu procesora Pentium III, liczba tranzystorów osiągnęła 28,1 miliona. Procesory pracujące z częstotliwością 1,7 GHz i wyższą posiadają rdzeń procesora Pentium 4 i zawierają 42 miliony tranzystorów. Modele oparte na rdzeniu procesorów Pentium III i 4 są wyposażone w 256 kB zintegrowanej z płytką procesora pamięci Cache L2. Niestety połowa z niej jest wyłączona, wskutek czego pozostaje 128 kB pamięci Cache L2. Wyłączenie połowy pamięci podręcznej L2 wynikało stąd, że dla firmy Intel produkującej procesor Celeron tańszym rozwiązaniem było zastosowanie w nim rdzenia procesora Pentium III lub 4 z częściowo wyłączoną pamięcią Cache L2 niż opracowanie zupełnie nowej płytki procesora. Procesory Celeron oparte na rdzeniu układu Pentium III, oprócz instrukcji MMX, są również wyposażone w rozszerzenie SSE, natomiast wersje z rdzeniem procesora Pentium 4, dodatkowo w instrukcje SSE2. Starsze wersje procesora Celeron z rdzeniem procesora Pentium II wykorzystują tylko instrukcje MMX.
Wszystkie modele procesora Celeron w wersji SEPP i PPGA są wytwarzane w technologii 0,25 mikrometra, natomiast w wersji FC-PGA i FC-PGA2. w jeszcze lepszej technologii 0,18 mikrometra. Zastosowanie nowszej technologii pozwoliło zmniejszyć zużycie energii i stworzyło warunki do pracy procesorów z wyższymi częstotliwościami.
Czym właściwie jest Celeron?
Celeron jest ogólną nazwą, jaką Intel posługuje się w przypadku taniej serii procesorów, zapoczątkowanej jeszcze za czasów układu Pentium II. W skrócie Celeron jest wersją procesorów Pentium II/I1I/4, w której niektóre funkcje ograniczono lub usunięto. Układy Celeron stworzone zostały przede wszystkim jako tańsze i uproszczone wersje podstawowych modeli procesorów firmy Intel. Choć przez lata zmieniały się określone szczegóły, procesory Celeron standardowo różniły się od układów Pentium II/III lub dostępnych obecnie Pentium 4 pod następującymi względami:
mniejsze częstotliwości zegara,
mniejsze częstotliwości magistrali procesora,
pamięć Cache L2 o mniejszej pojemności.
Wymienione różnice spowodowały, że procesory Celeron były i są mniej wydajne od określonych modelów układów Pentium II/III/4, na których bazują. Różnice te sprawiają zarazem, że procesory Celeron i wyposażone w nie komputery są tańsze. Jeśli szukasz taniego komputera z procesorem firmy Intel, pod uwagę można wziąć taki egzemplarz, który wyposażono w układ Celeron.
Historia procesora Celeron w pigułce
Początkowo procesory Celeron były tańszą wersją układów Pentium II firmy Intel. Producent uznał, że przez usunięcie z układu Pentium II pamięci Cache L2 oddzielnie montowanej wewnątrz jego kasety, a także ozdobnej osłony, można uzyskać „nowy" procesor, który przede wszystkim był trochę wolniejszą wersją Pentium II. A zatem pierwsze modele procesora Celeron o częstotliwości 266 i 300 MHz nie zawierały pamięci Cache L2. Niestety miało to o wiele większy wpływ na spadek wydajności, dlatego począwszy od wersji 300A, procesory Celeron dysponowały pamięcią Cache L2 o pojemności 128 kB zintegrowaną z rdzeniem i działającą z jego szybkością. Okazało się, że ta pamięć podręczna była szybsza i bardziej zaawansowana od tej, którą zastosowano w procesorze Pentium II (pojemność 512 kB; pracowała z Vi częstotliwości rdzenia), na którym oparty był Celeron! Tak naprawdę Celeron był pierwszym procesorem dla komputerów PC. w którym użyto pamięci Cache L2 zintegrowanej z rdzeniem. Dopiero w wersji Coppermine procesora Pentium III, reprezentującego serię podstawowych układów Intela, pamięć Cache L2 zintegrowano z rdzeniem.
Nie trzeba podkreślać, że Celeron wywołał na rynku sporo zamieszania. Biorąc pod uwagę to, że początkowo był mniej wydajną wersją procesora Pentium II, a następnie został tak zmodyfikowany, że pod kilkoma względami właściwie go zdystansował (dodatkowo cały czas sprzedawano go po niższej cenie), tak naprawdę wiele osób nie wiedziało, gdzie w zakresie wydajności układ ten umiejscowić. Na szczęście niekorzystnie wpływający na wydajność brak pamięci Cache L2 dotyczył tylko pierwszych wersji procesora Celeron. Wszystkie kolejne modele o częstotliwości przekraczającej 300 MHz dysponowały pamięcią podręczną L2 zintegrowaną z rdzeniem i pracującą z jego pełną szybkością.
Najstarsze wersje procesora Celeron o częstotliwościach z przedziału od 266 do 400 MHz oparte były na obudowie SEPP, która z wyglądu przypominała płytkę drukowaną przystosowaną do gniazda Slot 1. Takie same gniazdo zastosowano w przypadku procesora Pentium II. Oznacza to, że układy Celeron SEPP można było zainstalować w każdej płycie głównej z gniazdem Slot 1. W trakcie dalszej ewolucji układów Celeron stosowano inne obudowy, które odzwierciedlały zmiany, jakich dokonywano w procesorach Pentium II/III/4, na których Celeron bazował. Począwszy od wersji 300A (częstotliwość 300 MHz; pamięć Cache L2 128 kB zintegrowana z rdzeniem), układy Celeron wyposażone były w obudowę PPGA, zgodną z gniazdem Socket 370. Gniazda tego — z trochę innymi napięciami — użyto później w przypadku większości modeli procesorów Pentium III. Układy Celeron oparte na gnieździe Socket 370 pracowały z częstotliwościami zawierającymi się w przedziale od 300 MHz do 1,4 GHz. „Po drodze" obudowę PPGA zastąpiła obudowa FC-PGA, a tę FC-PGA2. W obudowie FC-PGA2 nad delikatnym rdzeniem umieszczono metalowy element rozpraszający ciepło, oferujący jego lepszą ochronę.
Najnowsze modele procesora Celeron oparte są na procesorze Pentium 4. Wyposażono je w obudowę FC-PGA2 zgodną z gniazdem Socket 478, obsługiwanym przez najnowsze układy Pentium 4. Nigdy nie wyprodukowano układów Celeron używających (mającego krótki żywot) gniazda Socket 423, stosowanego w przypadku pierwszych modeli procesora Pentium 4.
Jak powyższa skrócona historia potwierdza, nazwa Celeron nigdy nie oznaczała czegoś więcej niż wersji podstawowych procesorów Intela, oferującej mniejszą wydajność. Zanim uznasz, że określony model proceo-ra Celeron jest odpowiedni, trzeba zapoznać się z jego funkcjami, a zwłaszcza sprawdzić, na jakim procesorze bazuje. Istnieje co najmniej osiem odmian procesora Celeron, które dokładnie omówiono w tabeli 3.36.
Na rysunku 3.51 pokazano różne typy obudów procesorów Celeron.
Jak widać, nazwę Celeron nadano wielu różnym układom. Z tego powodu można z nią wiązać rodzinę różnych modeli procesorów wyposażonych w kilka odmian obudów.
W kolejnych podpunktach omówiono różnice występujące pomiędzy różnymi procesorami Celeron.
Porównanie procesorów Celeron
opartych na gnieździe Socket 370 i Socket 478
Choć zarówno procesory oparte na gnieździe Socket 370, jak i na gnieździe Socket 478 noszą nazwę Celeron, pomiędzy obydwoma wariantami układów istnieją ogromne różnice dotyczące wewnętrznej architektury. Różnice te bezpośrednio związane są z tym, na jakim procesorze Intel Pentium oparty jest określony model procesora Celeron.
Procesory Celeron (Socket 370) oparte są na różnych wersjach układów Pentium II i III. Z kolei procesory Celeron (Socket 478) bazują na architekturze układów Pentium 4. W omówieniu zawartym w niniejszym podpunkcie skupiłem się na wersjach procesorów Celeron IIIA/4 i 4A, ponieważ wcześniejsze modele nie są już produkowane.
Intel oferuje modele procesora Celeron IIIA przeznaczonego dla nowych płyt głównych z gniazdem Socket 370, pracujące z częstotliwością od 900 MHz do 1,4 GHz. Z kolei modele układu Celeron 4A współpracującego z płytami głównymi wyposażonymi w gniazdo Socket 478 oferują szybkości 1,7 i 1,8 GHz, natomiast szybsze modele Celeron 4A — częstotliwości z przedziału od 2,0 do 2,8 GHz. Dostępne są też nowe modele procesora Celeron D opartego na układzie Prescott, instalowane w gniazdach Socket 478 i Socket T (LGA775) oraz taktowane zegarem o częstotliwości od 2,53 do 3,2 GHz.
Tabela 3.36. Odmiany procesorów Celeron
Odmiana procesora Celeron |
Oparty na |
Nazwa kodowa |
Technologia wytwarzania (w mikronach) |
Pamięć Cache L2 (kB) |
Obsługa multimediów |
Celeron |
Pentium II Deschutes |
Covington |
0,25 |
0 |
MMX |
Celeron A |
Pentium II Deschutes |
Mendocino |
0,25 |
128 |
MMX |
Celeron A-PGA |
Pentium II Deschutes |
Mendocino |
0,25 |
128 |
MMX |
Celeron III |
Pentium III Coppermine |
Coppermine-128 |
0,18 |
128 |
SSE |
Celeron IIIA |
Pentium III Tualatin |
Tualatin-256 |
0,13 |
256 |
SSE |
|
Pentium 4 Willamette |
Willamette-128 |
0,18 |
128 |
SSE2 |
Celeron 4A |
Pentium 4 Northwood |
Northwood-128 |
0,13 |
128 |
SSE2 |
Celeron D |
Pentium 4 Prescott |
Prescott-256 |
0,09 |
256 |
SSE3 |
Rysunek 3.51.
Procesory z serii Celeron. Zdjęcie wykorzystane za zgodą firmy Intel Corporati
Czym poza szybkością różnią się wymienione procesory?
♦ Wszystkie modele procesora Celeron IIIA używają magistrali (czasami nazywanej FSB —front side bus) o szybkości 100 MHz, natomiast modele dla gniazda Socket 478 współpracują z magistralą
o częstotliwości 400 MHz.
♦ Wersje procesora Celeron IIIA oparte na układzie Pentium III (rdzeń Tualatin) dysponują pamięcią Cache L2 o pojemności 256 kB. natomiast modele bazujące na starszym rdzeniu Coppermine procesora Pentium III posiadają pamięć podręcznąL2 o pojemności 128 kB. Wszystkie nowe układy Celeron zgodne z gniazdem Socket 478 i oparte na rdzeniu Willamette procesora Pentium 4 zawierają pamięć Cache L2 o pojemności 128 kB. Z kolei nowsze wersje oparte na rdzeniu Northwood też używają pamięci podręcznej o identycznej pojemności.
Efektywnie — dla procesora Celeron opartego najądrze Pentium 4.
Końcówka 1
|
Tabela 3.26. Końcówki BFxprocesora Pentium i wartości mnożnika