|
|
Procesor (CPU - centralna jednostka wykonawcza) to układ scalony, którego działanie polega na wykonywaniu instrukcji programów. Nadzoruje on i synchronizuje prace wszystkich urządzeń w komputerze. Charakterystyczne cechy, które odróżniają procesory od siebie to:
|
Wszystkie współczesne procesory maja podobna architekturę oparta na superskalarnym jądrze RISC (architektura procesora o uproszczonej liście rozkazów). Jeszcze kilka lat temu procesory zaliczano do rodziny CISC (architektura procesora wykorzystująca złożona listę rozkazów). Dzisiaj, dzięki zastosowaniu w nich techniki przekodowywania rozkazów, uzyskano ogromne zwiększenie wydajności procesora, a RISC-owa konstrukcja umożliwia stosowanie wysokich częstotliwości zegara.
Zasada działania
Ze względu na przepływ danych i rozkazów w procesorze, można wyróżnić w nim kilka zasadniczych modułów:
1. Blok wstępnego pobierania i dekodowania instrukcji. Odpowiada on za dostarczenie kolejnych poleceń z pamięci operacyjnej i przekazanie ich do odpowiedniej jednostki wykonawczej.
2. Główny blok wykonawczy to jednostka arytmetyczno-logiczna ALU. Zapewnia ona prawidłowe przetworzenie wszystkich danych stałoprzecinkowych. ALU wyposażony jest w niewielka zintegrowana pamięć, nazywana zestawem rejestrów. Każdy rejestr to pojedyncza komórka używana do chwilowego przechowywania danych i wyników.
3. FPU, czyli koprocesor wykonujący wszystkie obliczenia zmiennoprzecinkowe
4. Po zakończeniu "obliczeń" dane będące wynikiem przetwarzania trafiają do modułu wyjściowego procesora. Jego zadaniem jest przekierowanie nadchodzących informacji np. do odpowiedniego adresu w pamięci operacyjnej lub urządzenia wejscia/wyjścia.
Dodatki multimedialne
Producenci nowoczesnych procesorów za podstawowy kierunek rozwoju technologicznego obrali rozszerzenie multimedialnych możliwości układu. Poszerzone listy rozkazów operujące na stało- i zmiennoprzecinkowych macierzach znacząco przyspieszają obróbkę grafiki, dźwięku czy generowanie obrazów 3D.
MMX
Pierwszym wprowadzonym rozszerzeniem multimedialnym, wbudowanym we wszystkie obecnie produkowane modele procesorów, jest zestaw 57 instrukcji arytmetyki stałoprzecinkowej typu SIMD, znany pod nazwa MMX.
3D Now!
Firma AMD wprowadziła 21 nowych instrukcji zmiennoprzecinkowych typu SIMD-FP zorientowanych na wspomaganie grafiki trójwymiarowej. Był to pierwszy przypadek wprowadzenia tak istotnych zmian do architektury procesora przez firmę inna niż Intel. SIMD-FP procesorów AMD wykorzystuje do działania połączone w pary 64-bitowe rejestry MMX - co niestety, utrudnia automatyczna optymalizacje kodu programu, gdyż wymagany jest podział danych na dwa segmenty.
SSE
Również Intel wprowadził w swoich procesorach Pentium III, instrukcje zmiennoprzecinkowe SIMD-FP. Instrukcje te są wykonywane przez wyspecjalizowana jednostkę operująca na ośmiu 128-bitowych dedykowanych rejestrach - co sprzyja optymalizacji kodu programu.
Gniazda
Współczesne procesory montowane są na płycie głównej za pośrednictwem następujących gniazd:
Często widząc procesor, czy każdy inny chip zastanawiamy się, jak został on wytworzony. Szczególnie nas to ciekawi, gdy po raz pierwszy zobaczymy zdjęcie "gołego chipu", czyli układu scalonego bez obudowy. Piękny widok!!! W większości przypadków zaraz odpuszczamy sobie ten temat. Ja postanowiłem wyjaśnić, jak się robi procesory i inne chipy.
Projektowanie
Projektowanie to jeden z trudniejszych elementów wytworzenia procesora. Tworzenie konstrukcji nowego chipa zawsze składa się z kilku etapów. Pierwszy polega na przyjęciu założeń, jakie będzie spełniać dany chip. Ważna jest tutaj ilość cache poziomu pierwszego, drugiego, a może nawet ilość jednostek wykonawczych, rejestrów, wielkość buforów, rodzaj szyny FSB, jej szerokość, długość słowa procesora i wiele innych parametrów. Tworzony jest schemat procesora.
Następnie te założenia i schemat są dawane projektantom - to oni wykonują brudną robotę. Projektanci zazwyczaj wykonują pierwsze szkice ręcznie, a nie od razu do komputera. Szkic nie jest szczegółowy. Detale dodaje się w komputerze. Tam planuje się każdy tranzystor, każdą ścieżkę i inny szczególik chipu. Sam proces projektowania jest zazwyczaj ściśle tajny, jednak powinien on odbywać się zgodnie z powyższymi regułami.
Po zaprojektowaniu układu następuje jego próbna produkcja - otrzymujemy tzw. "first silicon". Jest to najczęściej jeden, dwa, trzy, może i więcej wafli, które sprawdza się pod względem funkcjonalności i błędów. "First silicon" mogą pokazać niedoskonałości architektury. Jeżeli tak się stanie, to projektanci siedzą i myślą, jak wyeliminować błąd. Po wyeliminowaniu błędów znów się produkuje próbne wersje procesorów i znów się je bada. I tak się to robi, aż do wykrycia wszystkich błędów. Po ich wyeliminowaniu pojawiają się pierwsze "sample". Są to wersje procesorów, na których znów prowadzi się badania. Ich późniejsze wersje daje się także m.in. producentom płyt głównych, w celu sprawdzenia ich działania. Czasami nazywa się je te wersje także "engeering samples". Po przeprowadzeniu wszystkich testów procesory są wdrażane do seryjnej produkcji.
Układ scalony - budowa
Aby zrozumieć proces produkcji procesorów, należy znać budowę normalnego układu scalonego. Układ scalony to zbiór tranzystorów, połączonych ze sobą ścieżkami, na powierzchni monolitowego kryształu krzemu. Każdy pojedynczy tranzystor składa się z dwóch obszarów krzemu z odpowiednimi domieszkami. Obszary te nazywają się źródło i dren. Między źródłem a drenem znajduje się kanał - obszar kryształu krzemu bez domieszek. Na powierzchni kanału znajduje się warstwa izolatora. Na jej powierzchni znajduje się elektroda bramki. Trochę zawiłe? Wiem, ale dla pomocy przygotowałem pewien obrazek, który przedstawia przekrój przez tranzystor. Trochę źle dobrałem kolorystykę, ale może coś zrozumiecie.
Jak są wytworzone elektrody? Podobnie - są one stworzone przez dyfuzję w odpowiednich obszarach krzemu drobnych ilości domieszek. Ilość ich i rodzaj kształtują rodzaj przewodnictwa obszaru krzemu.
Wiemy już jak jest zbudowany tranzystor. Teraz przypatrzmy się ścieżką. Ścieżki łączą poszczególne tranzystory w jedną całość. Ścieżki to drobne ilości metalu, które są nakładane na powierzchnię chipu przez naparowywanie. W dzisiejszych technologiach stosuje się dwa rodzaje ścieżek - aluminiowe i miedziane. Ścieżka aluminiowa jest jedną z pierwszych koncepcji łączenia poszczególnych elementów np. procesorów. Dlaczego aluminium? Łatwo go doprowadzić do stanu lotnego i jest bardzo dobrym przewodnikiem. Jednak ze względu na swoje wady jest on powoli wypierany przez miedź. Ta stosunkowo młoda koncepcja od razu podbiła rynek. Jej twórcą jest IBM. Ma ona jedną wadę - najpierw trzeba odizolować daną powierzchnię. Zarówno w aluminiowej, jak i miedzianej technologii należy stworzyć pomocniczą izolację kanału tranzystora. W przypadków monokryształów krzemu jest to dość proste - należy utlenić powierzchnie. Powstanie wtedy dwutlenek tlenu - jeden z najlepszych izolatorów na świecie. Utleniane jest jedynie powierzchnia struktury. Nie utlenia się natomiast elektrod tranzystora, aby móc je połączyć ze sobą ścieżkami. I tutaj ujawnia się kolejna zaleta aluminium. Aby stworzyć kolejną warstwę, należy poprzednią odizolować. W przypadku aluminium wystarczy utlenić go - powstaje tlenek glinu - również bardzo dobry izolator. Technologia wykorzystująca ścieżki miedziane wymusza stworzenie kilku następnych faz produkcyjnych, które tworzą warstwę izolacyjną. Warto dodać, że nie jest to jedna, ale kilka warstw izolacyjnych, które przeplatają warstwy ścieżek. Wynika to po prostu ze złożoności współczesnych procesorów. Tworzone jest od 5 do 7 warstw ścieżek, które się ze sobą krzyżują. Pojedyncza warstwa ścieżek nie mogłaby połączyć 42 milionów tranzystorów w Pentiumie 4 i 37,5 milionów tranzystorów w Athlonie 4. Powszechnie przyjęta jest również zasada, że najbardziej zewnętrzna warstwa ma najgęściej i najbardziej precyzyjnie rozmieszczone struktury ścieżek. Kolejne warstwy mają większą powierzchnię ścieżek i jest ich coraz mniej. I tutaj ujawniła się potęga AMD - potrafiła ona wykorzystać tą wolną przestrzeń do narysowania mapki Teksasu i colta wycelowanego na zachód. Poprzednie zdanie dotyczyło jedynie jednego procesora - Athlona "aluminiowego" produkowany w Austin (właśnie Teksas). Znawcy geografii powinni wiedzieć, co jest na zachód - Silicon Valley - Krzemowa Dolina i Santa Clara - siedziba Intela. Ciekawe czy ten wybryk projektantów to zbieg okoliczności?
W produkcji procesorów trochę namieszało SOI - Silicon On Insulator. Ta technologia polega na tworzeniu dodatkowych warstw izolatora pomiędzy warstwami ścieżek. Warstwy te składają się z krzemu i tlenku krzemu. Dzięki zastosowaniu tej technologii możliwe jest zmniejszenie o 30% ilości pobieranej energii elektrycznej, a co za tym idzie zmniejszenie wydzielanego ciepła. To natomiast umożliwia zwiększenie maksymalnej częstotliwości zegara procesora bez zmniejszenia wymiaru technologicznego.
Produkcja procesora
Proces produkcji procesora, jak i każdego chipu, rozpoczyna się w jednej z firm, produkującej monolityczne kryształy krzemu. Wynikiem produkcji są długie walce krzemu, które następnie przez tą samą firmę są cięte na tzw. wafle. Istnieją wafle o dwu średnicach - mniejsze, popularniejsze i tańsze są wafle ośmiocalowe. Istnieją także coraz popularniejsze 12-calowe wafle. Warto wspomnieć, że te drugie są droższe nie tylko ze względu na wielkość, ale także trudność otrzymania jednolitego, dobrej jakości monokryształu tej wielkości. Firmy zajmujące się produkcją docelowych wafli zazwyczaj znajdują się na Dalekim Wschodzie (Japonia, Tajwan). Mało, która firma produkująca chipy ma własną fabrykę wafli. Kupowanie od innych jest ekonomiczniejsze. Otrzymują pewną jakość, jak i cenę, czego nie można być pewnym przy własnej produkcji. Skład izotopowy (izotopy to atomy o takiej samej liczbie porządkowej, a różnych liczbach masowych) naturalnego kryształu krzemu to: 92,2% krzemu o masie atomowej 28, 4,7% izotopu o masie 29 i 3,1% o masie 30 unitów. Obecność cięższych izotopów krzemu źle wpływa na przewodnictwo cieplną i elektryczną. Dlatego m.in. AMD jest zainteresowanych zastosowaniem czystego izotopowo krzemu (100% izotopu krzemu o masie atomowej 28). Są już nawet specjalne firmy zajmujące się tego typu krzemem.
Powróćmy jednak do samego procesu produkcyjnego chipów. Mamy już wafle z firm je produkujących. Teraz wafle są ostrożnie, ze względu na ruchliwość krzemu, przetransportowywane do fabryk układów scalonych (tzw. FAB-ów). I tutaj kolejna ciekawostka. Również mało firm ma własne FAB-y. Nie chodzi mi w tej chwili o producentów procesorów zwykłych, ale np. monopolista Nvidia korzysta z usług firmy produkującej chipy. Podobnie postępuje VIA, do niedawna SiS i wiele innych gigantów. Boże, jak ja odbiegam od tematu... Wafle są już w FAB-ie. Teraz zaczynają się cuda... Każdy proces jest przeprowadzony zawsze lokalnie - na jednym mikrometrze kwadratowym, albo nawet i na mniejszej powierzchni. Prawie nigdy nie działa on na całej powierzchni wafla. Dlatego używa się technikę fotograficzną i materiały światłoczułe, tworząc się tzw. maski. Chronią one obszary, które mają nie przereagować przed reakcją. Jak się tworzy maskę? Prościutko. Wafel jest pokrywany materiałem światłoczułym. Te elementy, które mają nie przereagować naświetla się. Materiał światłoczuły zmienia swoje właściwości fizykochemiczne. Teraz można zmyć specjalnym zmywaczem materiał nienaświetlony. Ponieważ obszar naświetlony ma inne właściwości chemiczne, nie zmywa się, więc materiał światłoczuły. Po odkryciu obszarów do przereagowania, może nastąpić właściwy proces nanoszenia. Po procesie nanoszenia materiał światłoczuły zmywa się odpowiednim rozpuszczalnikiem. Operacje nanoszenia materiału światłoczułego, jego naświetlania i zmywania muszą być bardzo precyzyjnie przeprowadzone, gdyż każda niedokładność pociąga za sobą złe działanie chipów, czyli straty.
Zajmijmy się dokładniej właściwemu procesowi nanoszenia domieszek, ścieżek, czy innych elementów. Proces ten to nic innego jak jedna z reakcji chemicznych lub procesów fizycznych - dyfuzji, utleniania lub naparowywania. W wyniku tych procesów powstają obszary w krzemie lub na jaj powierzchni o różnej oporności elektrycznej i dzięki temu powstają tranzystory, ścieżki, bramki logiczne i wszystkie inne elementy chipów. Jednak, aby to wszystko stworzyć, nie wystarczy jedna maska. Przy produkcji procesorów i nie tylko powtarza się następujący cykl - nakładanie maski, naświetlanie, zmywanie nienaświetlonej części wafla, proces nanoszenia, zmywanie naświetlonej części maski. I tak w kółko. W 0,18-mikronowym procesie technologicznym Intela z 5 warstwami metalizacji liczy sobie około 300 takich cykli. Przy 6-warstwowym procesie AMD w Dreźnie ta liczba się nie tylko zwiększa ze względu na liczbę warstw ścieżek, ale także AMD ma nieco inną technologię izolacji ścieżek miedzianych.
Dalej wykonuje się testy, które wskazują na maksymalną częstotliwość układów i jeżeli jest stosowany stały mnożnik, to się go ustala. Przy tych testach odpadają także źle wyprodukowane chipy, które mogłyby źle pracować. Aha. Przypominacie sobie średnicę wafli - 8 lub 12 cali. Żaden z dzisiejszych procesorów nie jest taki duży. Po co więc takie duże wafle? Otóż na jednym waflu tworzy się struktury dla wielu procesorów. Panuje także jedna reguła - im większy stopień miniaturyzacji, tym większa liczba uzyskanych procesorów z jednego wafla i mniejsze koszty. Wróćmy jednak do wafla. Po wytworzeniu struktury dla układów scalonych, FAB tnie wafel na poszczególne chipy. Dalszym krokiem jest umieszczenie "gołego" chipa w obudowie. Kiedyś stosowano do tego celu druciki, które zgrzewano z krzemową strukturą. Dziś stosuje się intelowską prostszą, tańszą i pewniejszą metodę - FCPGA (Flip Chip Pin Grid Array). Polega ona na powierzchniowym przylutowaniu chipa do płytki drukowanej, w której są umocowane nóżki procesora. Warto wspomnieć o innej metodzie stosowanej przez intelowską konkurencję - Flip Chip. Jest ona bardzo podobna, jednakże zawiera ona dużo więcej elementów. Po umieszczeniu chipa w obudowie należy ją nadrukować, zapakować i wysłać do sklepu, skąd trafi wprost do twojego komputera.
Czytając ten artykuł zapewne zastanawiasz się, dlaczego technologia oparta na miedzianych ścieżkach jest taka dobra. Widać to doskonale na przykładzie Athlona TB i Durona. Mając prawie to samo jądro i różniąc się tylko ilością cache L2 oraz technologią ścieżek, Athlon jest podatny na overlocking, a Durona można podkręcić, ale z większym ryzykiem. Po prostu technologia miedziana daje większe pole do popisu FAB-owi, jest nowocześniejsza i pozwala osiągnąć większe częstotliwości bez zmiany wymiaru technologicznego, co widać np. w Athlonie czy w Pentiumie 4.
Trzy słowa podsumowania
Produkcja chipów to proces dość zawiły. Gdy się go pojmie, to wydaje się on strasznie prosty i monotonny. Spójrzmy jednak w przyszłość - wkrótce dojdziemy do granicy miniaturyzacji - przewiduje ją się na wymiarze technologicznym 0,07 mikrometra (chociaż Intel chce ją podobno przekroczyć). Co będzie dalej? Zapewne ktoś z Was, czytelników, słyszał o nanotechnologii - dość śmiałemu pomysłowi budowania wszystkiego od podstaw z atomów, a nie z ich grup, operowania na nich, przemieszczania, łączenia w związki itp. Pozwoli to na niesamowity chwilowy postęp technologiczny - wszystko zostanie zmniejszone do atomów. Tylko co dalej? Ponieważ cząstki elementarne nie zachowują swoich właściwości fizykochemicznych, nie mogą stanowić bezpośredniego elementu do budowy chipa, tak jak będzie stanowił to atom. Powoli procesor znów będzie się rozrastał do początkowych swych wymiarów, będzie rósł, rósł, drożał przy okazji i w końcu może zająć miejsce twojej szafy. Prawo Moore'a przestanie obowiązywać. Będzie natomiast obowiązywać prawo z lat 70. - Cena jest proporcjonalna do kwadratu wydajności. Chyba, że zaistnieje w praktyce koncepcja komputera kwantowego - maszyny, która do obliczeń wykorzystuje zjawisko interferencji znane z mechaniki kwantowej, a w roli tranzystora znajdzie się detektor promieniowania kwantowego (pomysł wybitnego fizyka, matematyka i informatyka - Michaela H. Freedmana). A może nasze tęgie głowy z Intela i AMD wspólnie coś innego wymyślą?
3