118 Anatomia PC
63 48 4 / 32 31 16 ’5 C
ioooamx»ooooooininiooinooo oporand 2
43 47 32 31 16 15 0
111H11I11111111 000101 nuuoom u operandj
48 47 T 32 3* T 18 15
iMCOOOOOOOOOOOOOiri-iiiinrii opcrar>d_2
Instrukcja pauusw dodaje 16-bitowe słowa (traktując je jako liczby zc znakiem) wskazane przez opcrcmd_ł i operand_2. Jeżeli wynik jest mniejszy od najmniejszej liczby z zakresu przewidzianego dla typu Signed Word, następuje ograniczenie do wartości 0x8000. W przypadku wyjścia poza zakres od drugiej strony wartość nasycenia wynosi 0x7fff.
Rozkaz przesyłania MOV w zależności od przyrostka (D lub Q) operuje na danych 32 lub 64-bitowych. Jest jedynym środkiem komunikacji pomiędzy klasycznymi rejestrami (EAX, ERX,...) a rejestrami MMX. Jednorazowa porcja przesłanej informacji nie może jednak w takim przypadku przekraczać 32 bilów. Dla załadowania 64 bitowego rejestru MMX parą rejestrów 32-bitowych trzeba uciekać się do następującej sekwencji:
MOVD MMO, edx MOVD MMI, eax PSLLQ MMO, 32 POR MMO, MMI
/ 2DX -> MMO ; £AX -> MMI ; shitt MMO o 32 MMI or MMO
Pomiary' wykazują, że P55C potrzebuje na wykonanie powyższej partii kodu trzech cykli zegarowych. Procesor MMX może istotnie grupować rozkazy, ale nie każdy z każdym. W tym wypadku połączeniu ulega drugi i trzeci z nich (dotyczą różnych rejestrów MMX).
Rozszerzenia MMX dobrane zostały pod kątem aplikacji multimedialnych. Główny zakres zastosowań to filtry cyfrowe przetwarzające dane audio i video oraz dekodery MPEG, dotychczas domena specjalnie projektowanych do tego celu układów DSP. Optymalizacji MMX poddają się najchętniej algorytmy mające następujące wspólne cechy:
• dane w formacie Integcr, maksymalnie jedno luli dwubajtowe,
• krótkie i często wywoływane pętle programowe.
• częste operacje dodawania i mnożenia,
• algorytmy bardzo czasochłonne.
• możliwość realizacji równoległej