Intel Pentium 4 1,4 GHz! 2000-11-27 (16:47)
|
|
|
|
|
|
Intel Pentium 4
1,4 GHz
Marek Budny
Paweł Leśniorowski
Intel zaprezentował niedawno swój nowy procesor Pentium 4. Nowa architektura, nowe możliwości, jeszcze bardziej wydajna praca. Czy Intel znów może poszczycić się mianem firmy, kóra ma najszybszy procesor? Prezentujemy pierwszy w Polsce test Pentium 4.
Do tej pory najszybszym procesorem mogła pochwalić się firma AMD. Athlony taktowane tą samą częstotliwością, co Pentium III, były szybsze i wydajniejsze. Najszybszy procesor, jaki wyprodukowała firma AMD, to Athlon 1,2 GHz. Intel opracował serię nowych procesorów Pentium 4. Pierwsze modele taktowane są częstotliwością 1,4 i 1,5 GHz. Do naszego laboratorium trafił pierwszy z nich.
Rzut oka na "czwórkę"
Nie najweselsza sytuacja dotychczasowego potentata rynku procesorów x86 zmusiła go do zintensyfikowania prac nad kolejnym, 32-bitowym układem dla domowych i biurowych komputerów PC. Na wyjątkową aktywność Intela na tym polu wpłynęły zapewne problemy z najszybszymi modelami Pentium III (wystarczy wspomnieć wycofany ze sprzedaży model 1.13 GHz), a także z pierwszymi egzemplarzami z 64-bitowej generacji chipów (Itanium), które wbrew wcześniejszym zapowiedziom nie trafią do sprzedaży tak szybko, jak oczekiwano. Nie bez znaczenia pozostaje także wyjątkowo skuteczna konkurencja ze strony AMD, który wprowadza na rynek z sukcesem kolejne, coraz szybsze modele układów Athlon i Duron. Niezależnie od powodów, fakt pozostaje faktem - na rynek trafił Pentium 4, konstrukcja o tyle wyjątkowa, co zastanawiająca. Nowy układ łączy w sobie szereg rozwiązań, które czynią z niego produkt przełomowy, choć - jak twierdzi producent - przewaga wprowadzonych technologii uwidoczni się dopiero w momencie upowszechnienia obsługującego je oprogramowania. Cóż oznacza to w praktyce?
Dynamiczne wykonywanie rozkazów
Jedną z najważniejszych cech nowego chipa jest usprawnienie przetwarzania potokowego. Zostało ono osiągnięte poprzez rozbudowanie kolejek mikrooperacji, które obecnie składają się z dwudziestu, a nie - jak w Pentium III - dziesięciu etapów. Dzięki takiemu podejściu uzyskano możliwość uproszczenia logiki procesora i zwiększenia szybkości pracy potoku. Prostsze mikrooperacje wykonywane są szybciej, a sam układ może być taktowany większą częstotliwością, a ta - jak wiadomo - przyciąga oczy klientów. Tłumaczenie kodu x86 odbywa się poza potokiem i realizowane jest przez specjalizowany dekoder (wcześniej niniejszy etap wchodził w skład cyklu pracy samej jednostki potokowej).
Zwiększenia rozmiaru kolejek nie należy postrzegać wyłącznie jako zalety. W przypadku nietrafienia kolejnej instrukcji programu kolejka musi zostać opróżniona i załadowana nowymi rozkazami - im większa długość, to więcej straconego czasu. Ponadto, im dłuższa kolejka, tym większe ryzyko, że oczekujące w niej instrukcje okażą się nieprzydatne, a wykonanie danego rozkazu spowoduje konieczność uaktualnienia "treści" potoku.
Przewidywanie skoków i pamięć podręczna
Aby zminimalizować ryzyko wystąpienia sytuacji, w których ma miejsce konieczność "przeładowania" kolejek, w Pentium 4 udoskonalono algorytmy przewidywania skoków. Według opublikowanych informacji, zdolność nowego modułu predykcji ma być o ok. 1/3 lepsza niż w przypadku analogicznej jednostki w Pentium III (prawdopodobieństwo trafnego przewidzenia kierunku rozgałęzienia w Pentium 4 wynosić ma aż 95%). Zwiększono także rozmiar bufora rozgałęzień, który obecnie jest aż osiem razy pojemniejszy niż w przypadku poprzedniego CPU Intela.
Novum w konstrukcji chipa stanowi niewątpliwie zastosowany w nim nowy typ pamięci podręcznej L1 dla rozkazów (Execution Cache Trace - bufor śledzenia wykonania instrukcji). Zadaniem wprowadzonego mechanizmu jest przechowywanie przetłumaczonych na mikrooperacje instrukcji i przekazywanie ich do potoków bez konieczności ponownego dekodowania instrukcji x86 (może to znacząco zwiększyć wydajność w przypadku wykonywania wielokrotnie powtarzanych fragmentów kodu - na przykład małych pętli). Bufor śledzenia wykonania instrukcji jest ośmiodrożny i może przechować do ok. 12 tysięcy mikrooperacji. W przypadku bufora danych L1 architektura Penitum 4 nie uległa zmianie w porównaniu do poprzednika, dwukrotnie zmniejszył się jednak rozmiar dostępnej pamięci (z 16 do 8 KB). Pewnym modyfikacjom uległa za to architektura pamięci L2, która przygotowana jest przede wszystkim pod kątem strumieniowego przetwarzania przechowywanych w pamięci danych.
Jednostki wykonawcze
O wydajności Pentium 4 zadecydować może asymetryczna struktura jądra. W odróżnieniu od klasycznych konstrukcji, w nowym CPU część układu, a dokładniej jego stałopozycyjna, szybka jednostka arytmetyczno-logiczna (Rapid Execution Engine), pracuje z dwukrotnie większą częstotliwością niż pozostałe moduły. Przyda się to w sytuacji, w której CPU do wykonania ma ciąg instrukcji stałopozycyjnych (np. wszelkiego rodzaju prostych operacji logicznych), na niewiele się jednak zda w przypadku zadań wymagających przetwarzania danych zmiennoprzecinkowych.
W przeciwieństwie do najnowszych procesorów AMD, które już od dłuższego czasu udostępniają trzy niezależne jednostki FPU, Pentium 4 ma tylko jedną w pełni funkcjonalną z jedną towarzyszącą (pełni funkcję pomocniczą w niektórych operacjach). Skąd zatem wznoszone obecnie przez Intela hasło opracowania najwydajniejszego modułu FPU?
SSE2 - nowe instrukcje SIMD
Odpowiedzią na powyższe pytanie jest nowy zestaw 144 instrukcji strumieniowych podwójnej precyzji. W porównaniu do modułu pierwszej generacji nowa jednostka strumieniowa Pentium 4 przetwarzać może nie tylko cztery liczby zmiennoprzecinkowe o pojedynczej precyzji, ale także dwie liczby FP o podwójnej precyzji (oraz różne kombinacje danych całkowitoliczbowych, które "da się upchać" do odpowiadających im rejestrów: 16 bajtów, 8 słów, 4 długie słowa, dwie całkowite wartości 64-bitowe lub jedną wartość 128-bitową). Z ciekawostek dotyczących nowego zestawu instrukcji wymienić warto także obecność rozkazów, które ułatwić mają proces szyfrowania/deszyfrowywania informacji, a to - jak wiadomo - może mieć znaczenie dla stale wzrastających wymogów w zakresie bezpieczeństwa sieciowego.
Pompa wielkiej mocy
Znaczącym usprawnieniem Pentium 4 w porównaniu do pozostałych procesorów klasy x86 jest rodzaj zastosowanej w nim szyny systemowej. Na pierwszy rzut oka może ona wprawdzie rozczarować - taktowana jest zegarem tylko 100 MHz - ale głębsza analiza możliwości CPU zmienia obraz radykalnie. W Pentium 4 zastosowano znaną już z AGP 4x technikę tzw. quad-pumpingu, tj. przesyłania danych z czterokrotnie większą prędkością niż wynosi takt zegara. Biorąc pod uwagę szerokość magistrali (64 bity), daje to przepustowość rzędu 3,2 GB/s, która przekracza nawet możliwości szyny EV6 procesorów AMD. Z istniejących na rynku rozwiązań tego typu wysoką efektywność w dostępie do pamięci zapewnia obecnie wyłącznie chipset i850, współpracujący z dwoma kanałami pamięci RDRAM. O tym, czy powstanie analogiczna konstrukcja z użyciem pamięci DDR SDRAM, można na razie jedynie spekulować - w przypadku jednego kanału DDR dostępna obecnie pamięć tego typu nie "nadąży" za możliwościami najnowszego układu Intela.
Nie tylko procesor
Kupując procesor Pentium 4, musimy być przygotowani na inne wydatki. P4 nie pasuje do starych płyt głównych z gniazdem Socket 370. Dla niego została przygotowana nowa rodzina płyt z gniazdem Socket 423. Jak na razie, wybór jest niewielki, ponieważ w sprzedaży znajdują się urządzenia tylko z chipsetem i850. Mało tego, decydując się na zmianę procesora na Pentium 4, będziemy musieli wymienić zasilacz na nowy, z dodatkowymi wyprowadzeniami. P4 pobiera bardzo dużo energii - około 50W, dlatego konieczne jest stosowanie solidnego chłodzenia.
Do naszego laboratorium dostarczono na szczęście wszystkie komponenty potrzebne do uruchomienia Pentium 4: zasilacz 300W, radiator z wentylatorem, wyglądem przypominający urządzenia z serii Golden ORB, i płytę główną Intel D850GB z chipsetem i850. Radiator, niestety, jest bardzo ciężki, dlatego też montowany jest do płyty głównej i obudowy komputera za pomocą specjalnych wkrętów. Zastosowano takie rozwiązanie, ponieważ konstruktorzy obawiali się, że tak ciężki radiator przyczepiony tylko do gniazda Socket 423 może spowodować jego wyrwanie z płyty. Niektórzy producenci do zestawu dołączają specjalną metalową podstawę pod płytę główną, do której montuje się radiator.
Chipset Intel i850
Pierwszym dostępnym na rynku chipsetem obsługującym procesory Pentium 4 jest i850. Jest on bardzo podobny do innego układu - i840. i850 jest zbudowany zgodnie z zasadami architektury hubowej (więcej o niej możesz dowiedzieć się tutaj). Jednym z jego hubów jest układ 82850 Memory Controller Hub (MCH), obsługujący pamięci Rambus 300 i 400 MHz. Drugim układem wchodzącym w skład i850 jest dobrze znany 82801BA I/O Controller Hub (ICH2), w którym zaszyto m.in. kontroler EIDE UltraATA/100. Magistrala FSB pracuje z częstotliwością 400 MHz. Zwiększono przepustowość pomiędzy pamięcią Rambus a procesorem do 3,2 GB/s. Oczywiście 82850 MCH obsługuje też AGP 4x.
Ustawienia testu i wyniki
Wyniki testu |
Pentium 4 1,4 GHz |
Athlon 800 MHz |
Różnica [%] |
3DMark 2000 |
|||
CPU Speed 1024x768x16 |
492 |
371 |
32,6% |
Sandra 2001 |
|||
Memory Benchmark |
|||
INT ALU/RAM Bandwidth [MB/s] |
1337 |
272 |
391,5% |
Float FPU/RAM Bandwidth [MB/s] |
1372 |
288 |
376,4% |
CPU Multimedia Benchmark |
|||
Integer SSE2 [it/s] |
5499 |
4334* |
26,9% |
Floating Point SSE2 [it/s] |
6827 |
5271** |
29,5% |
CPU Benchmark |
|||
Dhrystone ALU |
2624 |
2174 |
20,7% |
Whetstone FPU [MFLOPS] |
831 |
1047 |
62,5% |
Wheststone SSE2 [MFLOPS] |
1701 |
|
|
WinBench 99 1.1 |
|||
CPUMark |
84,5 |
65,3 |
29,4% |
FPU WInMark |
4800 |
4360 |
10,1% |
Quake III Arena |
|||
Fastest, |
200,6 |
115,7 |
73,4% |
Fastest, |
151,3 |
111,7 |
35,5% |
Normal, |
170,5 |
106,6 |
59,9% |
Normal, |
119 |
99,5 |
19,6% |
HQ, |
111,5 |
97,4 |
14,5% |
HQ, |
70,9 |
69,8 |
1,6% |
SYSmark 2000 (1024x768x32 85 Hz) |
|||
Internet Content Creation |
194 |
144 |
34,7% |
Office Productivity |
173 |
141 |
22,7% |
Overall Rating |
182 |
142 |
28,2% |
Kompresja MP3 |
|||
Kompresja MP3 |
290 |
318 |
8,8% |
Kompresja DivX |
|||
czas [sek] / [fps] |
703/48,3 |
1352/25,1 |
92,4% |
* - Integer MMX Enhanced |
Wydajność Pentium 4 1,4 GHz postanowiliśmy sprawdzić za pomocą kilku popularnych benchmarków. Z 3Dmarka 2000 wykorzystaliśmy test CPU Speed, z WinBencha 99 1.1 - CPUmarka i FPU WinMarka. Skorzystaliśmy także z SYSmarka 2000 i programu SiSoft Sandra 2001 z modułów CPU Benchmark, CPU Multimedia Benchmark oraz Memory Benchmark. Zweryfikowaliśmy też informacje o ponoć doskonałej wydajności Pentium 4 w kompresji audio i wideo. Za pomocą aplikacji Audio Catalyst 2.1 z kodekiem MP3 Xing skompresowaliśmy 18 utworów z płyty CD-Audio zapisanych na dysku w postaci ścieżek WAV, zajmujących około 770 MB. Wydajność P4 w kompresji wideo sprawdziliśmy przez przekonwertowanie filmu MPEG-2 o rozmiarze 280 MB na AVI w standardzie DivX;). Pomiary wykonaliśmy na komputerze z płytą główną Intel D850GB, dyskiem twardym Seagate Barracuda ATA II ST310210A, kartą graficzną Asus V7100 z chipsetem GeForce2 MX, 256 MB pamięci RDRAM w systemie Windows 98 SE PL. Wkrótce pokażemy Wam, jak Pentium 4 sprawował się w Windows 2000. Wyniki testów prezentujemy w tabelce i na wykresach.
Przeliczając zegar Pentium 4 1,4 GHz i Athlona 800 MHz, wychodzi, że P4 powinien pracować o 75% szybciej od Athlona. Czy tak jest, możecie sami ocenić, porównując wyniki testu. Praktycznie tylko w Quake'u (ustawienia Fastest 640x480x16) P4 1,4 GHz był szybszy od Athlona 800 MHz o prawie 74%. Potwierdziły się natomiast zapewnienia Intela, że P4 jest doskonałym procesorem do obróbki wideo. Film z MPEG-2 do DivX został skompresowany prawie dwa razy szybciej (92,4%) niż przez Athlona 800 MHz.
Nie można też nie wspomnieć o doskonałej wydajności pamięci RDRAM. Porównując wyniki z Sandry 2001, okazuje się, że RDRAM-y mają prawie pięciokrotnie większą przepustowość od SDRAM-ów. Można powiedzieć, że w końcu możliwości drzemiące w tych bardzo drogich pamięciach zostały wykorzystane, głównie za sprawą doskonałej współpracy z Pentium 4.
|
|
|
|
Podsumowując, uzyskaliśmy wyniki niższe od tych, których się spodziewaliśmy. Jednym z powodów jest na pewno brak w programach testujących implementacji SSE2. Nie zapominajmy, że w Pentium 4 i jego architekturze drzemie mocny potencjał, który obecnie nie jest w pełni wykorzystywany.
Zobacz także:
1,7 GHz na liczniku - Intel Pentium 4 1,7 GHz (procesory)
Intel Pentium 4 1,4 GHz (część II testu)