Microsoft Word - AK1-7-09 Szybkie sumatory.doc

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Algorytm dodawania i odejmowania

k−2

k−1

FA/FS

k−2

FA/FS

Schemat dodawania/odejmowania binarnego

dodawanie (X+Y)

odejmowanie (X–Y)

)

(

)

(

⊕

)

(

)

(

⊕

Propagacja przeniesienia

•  obliczenie sumy/ró nicy na pozycji i wymaga przeniesienia z pozycji i−1
•  czas wytworzenia sumy/ró nicy – stały od chwili ustalenia przeniesienia
•  gwarantowany czas wykonania dodawania/odejmowania zale y od

najdłu szego czasu przesłania zmiany przeniesienia

z pozycji najni szej

• czas sekwencyjnego dodawania/odejmowania n-pozycyjnego – nT

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Wytwarzanie i propagacja przeniesie w dodawaniu

Funkcja przeniesienia mo e mie jedn z równowa nych form

)

(

)

(

⊕

poniewa a+b=a⊕b+ab (OR(a,b) = XOR(a,b) + ab). Składowymi wyra enia s :

• funkcja wytwarzania (generowania) przeniesienia, okre laj ca warunki

przy których przeniesienie wyj ciowe c

=1 niezale nie od c

g =

• funkcja półsumy, która tak e okre la warunki przekazywania (propagacji)

przeniesienia (

x ≠

⇒

⊕

W wyra eniach na przeniesienie mo e j zast pi

• (nadmiarowa) funkcja przekazywania przeniesienia (

– f. wygaszania)

UWAGA:
W wyra eniach na przeniesienie funkcje p

i h

s wzajemnie zamienne.

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Wytwarzanie i propagacja przeniesie w odejmowaniu

Funkcja po yczki (przeniesienia wstecznego) mo e mie jedn z form

)

(

)

(

⊕

poniewa a+b=a⊕b+ab (OR(a,b)=XOR(a,b)+ab). Składowymi wyra enia s :

• funkcja wytwarzania (generowania) po yczki, okre laj ca warunki przy

których po yczka z wy szej pozycji c

=1 niezale nie od c

g =

• funkcja półró nicy, która okre la te warunki przekazywania (wstecznej

propagacji

) po yczki (

x =

⇒

⊕

W wyra eniach na po yczki mo e j zast pi

• (nadmiarowa) funkcja przekazywania po yczki (

– f. wygaszania)

UWAGA:
W wyra eniach na po yczki funkcje p

i h

s wzajemnie zamienne.

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Propagacja i generowanie przeniesie – intuicje (1)

out

=1 je li:

• c

=1 jest przesyłane przez blok HL do wyj cia c

out

• wewn trz bloku HL jest wytwarzane c

out

=1, za c

jest dowolne

out

=1 je li:

• c

=1 jest przesyłane przez blok L do c

a nast pnie przez blok H do c

out

• wewn trz bloku H jest wytwarzane c

out

=1, za c

jest dowolne

• wewn trz bloku L jest wytwarzane c

=1,

a nast pnie przez blok H jest przekazywane do c

out

Uwaga

: Analogiczne zale no ci mo na poda dla po yczek w odejmowaniu

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Propagacja i generowanie przeniesie – intuicje (2)

HLF

out

HLF

out

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Funkcje grupowej antycypacji przeniesie

Wyznaczanie funkcji przekazywania (propagacji) przeniesienia P

przez bloki sumatora (iloczyn) jest działaniem ł cznym (asocjacyjnym)

HLF

Wyznaczanie funkcji wytwarzania (generowania) przeniesienia G

w bloku sumatora jest tak e działaniem ł cznym (asocjacyjnym)

HLF

Funkcje rekursywnie skojarzone

– takie, które opisuje operator asocjacyjny •

= x

•y

–1

, y

= x

Wyznaczanie funkcji rekursywnie skojarzonej – problem prefiksowania

Funkcje G,P s rekursywnie skojarzone przez wektorowy operator asocjacyjny

•

HLF

•

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Funkcje wytwarzania przeniesie i sum

Dla dowolnego bloku sumatora pomi dzy pozycjami i oraz k (k ≥ s ≥ i ):

przy tym

Poniewa

(lub

⊕

), wi c

∏

−

...

∏

– schemat wyznaczania funkcji G

i P

mo na optymalizowa

– wszystkie funkcje G

i P

mo na wyznaczy w sekwencji log

n

działa

Warto sumy s

zale y od h

, warto ci funkcji G

i−

1:0

, P

i−

1:0

oraz c

)

(

−

⊕

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumator z antycypacj przeniesie (carry look-ahead adder, CLA)

Funkcje c

mo na rozwija wzgl dem kilku kolejnych pozycji

• zło ono funkcji c

ro nie z kwadratem zasi gu s

• bariera technologiczna – ograniczona liczba wej bramki

)

(

...

)

(

−

)

,...,

(

)

,...,

(

)

,...,

(

)

,...,

(

Uwaga

: Analogiczne zale no ci mo na poda dla po yczek w odejmowaniu

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Moduł sumatora z antycypacj przeniesie (CLA)

CLA

+4:i

Czterobitowy sumator CLA z sygnałami G,P dla bloku CLG

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Wielomodułowy sumatorów z antycypacj przeniesie (CLA)

15:12

11:8

7:4

3:0

CLA

Sumator zbudowany z kaskady bloków CLA

3:0

7:4

11:8

15:12

11:8

7:4

3:0

CLA

CLG

Sumator CLA z blokiem wytwarzania przeniesie CLG

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumatory prefiksowe (PPA)

sumator prefiksowy – parallel prefix adder, PPA

blok GP – wytwarzanie warto ci wszystkich przeniesie

−

)

(

−

⊕

–1

i–

–1

i–

Je li c

=0, to c

–1:0

i wtedy

−

⊕

, w przeciwnym razie

problem: silne rozgał zienie sygnału przeniesienia wej ciowego c

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumator prefiksowy z redukcj rozgał zienia

Aby unikn

rozgał ziania sygnału c

w obliczaniu

−

mo na:

a) doł czy blok wej ciowy CSA, redukuj cy sygnał c

sumator PPA

b) potraktować c

jako funkcję generowania przeniesienia z pozycji „–1”:

–1

= c

, zaś c

–1

= 0. Wtedy w sumatorze obejmującym n+1 pozycji mamy:

)

(

−

⊕

co jest równowaŜne zastąpieniu sygnału g

przez

−

Tworzenie alternatywnego sygnału p

jest zbędne, bo c

–1

= 0, więc

c =

W obu wersjach opóźnienie T jest takie jak w realizacji funkcji G

–1:0

Podobne rozwiązania moŜna zastosować w uniwersalnym sumatorze U2.

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Zasady konstrukcji sieci prefiksowej GP

Węzeł sieci GP realizuje funkcje

)

(

)

(

)

(

)

(

•

Zasada konstrukcji struktury GP:

integracja funkcji G

i P

oraz G

i P

obejmujących sąsiadujące bloki H i L:

• bloki H i L

powinny być styczne

• bloki H i L

nie mogą być rozdzielone

• bloki H i L mogą mieć część wspólną – funkcje G

i P

są nadmiarowe

integracja nadmiarowa

integracja optymalna

integracja błędna

• regularne struktury dla n = 2

wejść (pozycji),

• w innych przypadkach przyjąć k = int (1+log

) i usunąć zbędne gałęzie

(sieć integrującą 2

–1

pozycji połączyć siecią integrującą pozostałe wejścia)

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Przekształcenie prefiksowe Ladnera-Fischera (Sklansky’ego)*

minimalna liczba elementów

= x

⊕ y

, G

= x

(i = 0, 1, … , n−1)

0:0

Poziom 1 (i = 0, 1, … , 2

− 1

n−

1:0

2i+1:2i

, P

2i+1:2i

) = ( G

2i+1:2i+1

, P

2i+1:2i+1

)l (G

2i:2i

, P

2i:2i

)

Poziom 2 (i = 0, 1, … , 2

− 2

n−

1; s = 2, 3)

3:0

, G

2:0

4i+s:4i

, P

4i+s:4i

) = ( G

4i+s:4i+2

, P

4i+s:4i+2

) l ( G

4i+1:4i

, P

4i+1:4i

)

Poziom 3 (i = 0, 1, … , 2

− 3

n−

1; s = 4, 5, 6, 7)

7:0

, …, G

4:0

8i+s,8i

, P

8i+s,8i

) = ( G

8i+s,8i+4

, P

8i+s,8i+4

) l ( G

8i+3,8i

, P

8i+3,8i

)

Poziom 4 (i = 0, 1, … , 2

− 4

n−

1; s = 8, 9, …, 15)

15:0

, …, G

8:0

16i+s,16i

, P

16i+s,16i

) = ( G

16i+s,16i+8

, P

16i+s,16i+8

) l ( G

16i+7,16i

, P

16i+7,16i

)

…

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Przekształcenie prefiksowe Kogge-Stone’a*

minimalizacja rozgał zie

= x

⊕ y

, G

= x

(i = 0, 1, … , n−1)

0:0

Poziom 1 (i = 0, 1, … , 2

− 1

n−

1:0

+1:i

, P

+1:i

) = ( G

+1:i+1

, P

+1:i+1

)l (G

i:i

, P

i:i

)

Poziom 2 (s = 0, 1; i = 0, 1, … , n−2

)

+2:0

= G

+2,s+1

+ P

+2,s+1

( G

3:0

) , G

2:0

+3:i

, P

+3:i

) = ( G

+3,i+2

, P

+3,i+2

)l (G

i,i

, P

i,i

)

3:0

Poziom 3 (s = 0, 1, …, 2

−1; i = 0, 1, … , n−2

)

+4:0

= G

+1,s+4

+ P

+1,s+4

7:0

) , G

6:0

, G

5:0

, G

4:0

+7:i

, P

+7:i

) = ( G

+7,i+4

, P

+7,i+4

)l (G

+3:i

, P

+3:i

)

7:0

Poziom 4 (s = 0, 1, …, 2

−1; i = 0, 1, … , n−2

)

+8:0

= G

+8,s+1

+ P

+8,s+1

15:0

) , … …, G

8:0

+15:i

, P

+15:i

) = ( G

+15,i+8

, P

+15,i+8

)l (G

+7:i

, P

+7:i

)

15:0

…

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Przekształcenie prefiksowe Brenta-Kunga*

optymalizacja struktury CMOS

= x

⊕ y

, G

= x

(i = 0, 1, … , n−1)

0:0

Poziom 1 (i = 0, 1, … , 2

− 1

n−

1:0

2i+1:2i

, P

2i+1:2i

) = ( G

2i+1:2i+1

, P

2i+1:2i+1

)l (G

2i:2i

, P

2i:2i

)

Poziom 2 (i = 0, 1, … , 2

− 2

n−

3:0

4i+3:4i

, P

4i+3:4i

) = ( G

4i+3:4i+2

, P

4i+3:4i+2

) l ( G

4i+1:4i

, P

4i+1:4i

)

Poziom 3 (i = 0, 1, … , 2

− 3

n−

7:0

8i+7:8i

, P

8i+7:8i

) = ( G

8i+7:8i+4

, P

8i+7:8i+4

) l ( G

8i+3:8i

, P

8i+3:8i

)

…

Poziom m = log

n

(T = 2

m−

)

3T−1:0

, P

3T−1:0

) = ( G

3T −1:2T

, P

3T −1:2T

)l (G

2T −1:0

, P

2T −1:0

)

3T:0

0,n−1:0

, P

n−

1:0

) = ( G

n−

1:2T

, P

n−

1:2T

)l (G

2T −1:0

, P

2T −1:0

)

n −

1:0

…
Poziom m+r (i = (0), 1, … , 2

−1, R = 2

m−

2−s

), r = 1, … , m−2

iR−

1:0

, P

iR−

1:0

) = ( G

iR−

1: 2R

, P

iR−

1: 2R

)l (G

2R −1:0

, P

2R −1:0

)

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Przekształcenie prefiksowe Han’a-Carlsona*

najpierw integracja rozł cznych par

= x

⊕ y

, G

= x

(i = 0, 1, … , n−1)

0:0

Poziom 1 (i = 0, 1, … , 2

− 1

n−

1:0

2i+1:2i

, P

2i+1:2i

) = ( G

2i+1:2i+1

, P

2i+1:2i+1

)l (G

2i:2i

, P

2i:2i

)

Poziom 2 (i = 0, 1, … , 2

− 2

n−

3:0

2i+3:2i

, P

2i+3:2i

) = ( G

2i+3:2i+2

, P

2i+3:2i+2

) l ( G

2i+1:2i

, P

2i+1:2i

)

Poziom 3 (i = 0, 1, … , 2

− 3

n−

1, s = 0, 1)

2i+7:2i

, P

2i+7:2i

) = ( G

2i+7:2i+4

, P

2i+7:2i+4

) l ( G

2i+3:2i

, P

2i+3:2i

)

2s+5:0

= G

2s+5,2s+1

+ P

2s+5,2s+1

2s:0

7:0

, G

5:0

Poziom 4 (s = 0, 1, …, 2

−1; i = 0, 1, … , 2

− 3

n−

2i+15:2i

, P

2i+15:2i

) = ( G

2i+15:2i+8

, P

2i+15:2i+8

) l ( G

2i+7:2i

, P

2i+7:2i

)

2s+9:0

= G

2s+9,2s+1

+ P

2s+9,2s+1

2s:0

15:0

, G

13:0

, G

11:0

, G

9:0

...
Poziom log

n

+1 (i = 0, 1, … , 2

− 1

n−

2i:0

= G

2i:2i

+ P

2i:2i

2i−1:0

2i:0

, … , G

4:0

, G

2:0

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Prefiksowe schematy generowania i propagacji przeniesienia (PPA)

15 14 13 12 11 10

Graf prefixowy (Sklansky / Ladner-Fischer)

15 14 13 12 11 10

Graf prefixowy (Kogge & Stone)

15 14 13 12 11 10

Graf prefixowy (Brent–Kung)

15 14 13 12 11 10

Graf prefixowy – (Han & Carlson)

– wytwarzanie funkcji G

= g

oraz P

= p

– przekazywanie G oraz P

– operator prefiksowy (G

) = (G

)

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Charakterystyki grafów prefiksowych

Ladner-Fischer

– log

poziomów logicznych, minimum elementów GP

nierównomierne obciąŜenia (Sklansky)

Kogge & Stone

– log

poziomów logicznych, więcej elementów GP,

rozłoŜona obciąŜalność wyjść

Brent-Kung

– >log

poziomów logicznych, mniej elementów GP,

stała obciąŜalność wyjść

Han & Carlson

– >log

poziomów logicznych, najmniej elementów GP,

najmniejsza obciąŜalność wyjść

Parametry sieci GP jako elementy PPA

Typ struktury

liczba ogniw GP liczba poziomów obciąŜenie

przełączenia

RCA

– 1

n /

Ladner-Fischer

½ n log

log

n /

¼ n log

Brent-Kung

2n – n log

–2

2 log

– 2

log

+ 1 ~

n log

Kogge & Stone

log

– n + 1

log

½ n log

Han & Carlson

½ n log

log

+ 1

¼ n log

Szybkie sumatory

© Janusz Biernat

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumator ELM – koncepcja*

Obliczona wartość początkowa sumy h

= s

i:i

na moŜe ulec zmianie, jeśli c

=1.

Niech s

i:r

oznacza tymczasow sumę na pozycji i z uwzględnieniem wszystkich

wcześniejszych wejść x

, y

, począwszy od wejścia x

, y

. Mamy:

)

(

−

⊕

Z rekurencyjnego powiązania funkcji G

i:j

wynika dalej, Ŝe (i>r>j):

))

(

)

(

−

⊕

Metodą indukcji moŜna pokazać, Ŝe

−

, skąd mamy:

−

⊕

przy tym bitami końcowej sumy są s

PoniewaŜ powyŜsze funkcje są niezaleŜne, więc moŜliwe jest wytworzenie
sumy końcowej w strukturze zawierającej log

poziomów.

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumator ELM – korekcja sum tymczasowych*

Z podanych zaleŜności wynika zasada konstrukcji sumatora, podobna jak PPA

+1:i

:j+1

+1:j

–1:i

Schemat sumatora ELM (strukturze Ladnera-Fischera)

Powiązania sum moŜna takŜe zrealizować w strukturze Kogge’a-Stone’a.

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumy warunkowe – koncepcja (Sklansky)

x +

1+0 0+0 1+1 1+0 0+1 1+1 1+0 0+1

—

2 +

—

4 +

—

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumator sum warunkowych (conditional sum adder, COSA)*

Tworzenie alternatywnych sum jedno-, dwu-, cztero-, ośmio-, ...-bitowych

Poziom 0 – sumy i przeniesienia warunkowe dla osobnych bitów (i = 0,1,...)

oraz

}

{

}

{

≡

⊕

}

{

}

{

Poziom p (|| – złoŜenie wektorów)

– warunkowe sumy

−

i przeniesienia

)

(

grup r = 2

bitów,

– dla i = 0,1,...,n·2

–p

 − 1

]

)

(

[

−

)

(

)

(

−

Końcowy wynik sumowania powstaje na poziomie k = log

n

(r = 2

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Schemat sumatora sum warunkowych

L 0

0/1

1 0

0/1

1 0

0/1

1 0

0/1

1 0

L 1

L 2

L 3

0/1

Ośmiobitowy sumator sum warunkowych

= 2 log

2 n , A = ½ (n log

+ 2n log

)= 3n log

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumator sterowany przeniesieniem (CSLA)

Sumator multipleksowany sterowany przeniesieniem

(carry-select adder)

wybór

-pozycyjnych sum warunkowych zaleŜnie od przeniesienia

m,l

l,k

k,i

m,l

l,k

k,i

m,l

l,k

k,i

CPA

MPX

CPA

MPX

CPA

MPX

m,l

l,k

k,i

m,l

l,k

k,i

m +1

Schemat logiczny sumatora multipleksowanego sterowanego przeniesieniem

Sumy blokowe obliczane jednocześnie ⇒ wyŜsze bity→większe bloki
Opóźnienie – > 2

2 (optymalna liczba bloków – około

2 )

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Sumator z przeskokiem przeniesień (CSKA)*

Suma w bloku s-bitowym zaleŜy od przeniesienia wej ciowego (carry-in).

propagacja przeniesienia przez cały blok → „przeskok” przeniesienia

n,m

CPA

m,l

CPA

l,k

CPA

j,i

CPA

...

Schemat sumatora z przeskokiem przeniesień CSKA (carry-skip adder)

Opóźnienie wnoszone przez sumator CSKA zaleŜy od
– czasu wytworzenia przeniesienia w bloku, w którym zaczyna się propagacja,
– czasu wytworzenia sumy w bloku, w którym kończy się propagacja,
– czasu przeskoku przeniesienia przez bloki wewnętrzne.
l

jednakowych bloków k-bitowych (n = kl) opóźnienie wyniesie

]

[

]

[

)]

(

)

[(

−

≥

−

∆

−

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Analiza szybkości sumatora z przeskokiem przeniesień*

Czas dodawania:

•  czas wytworzenia przeniesienia na wyjściu u–go bloku wejściowego
•  czas przeskoku przeniesienia przez [v−(u+1)] bloków
•  czas wytworzenia sumy od ustalenia przeniesienia na wejściu bloku v

)]

(

)

(

)

[(

)

(

−

∆

struktura

cieŜka

opóźnienie

max

6 bloków

4-4-4-4-4-4

(4−1)+4+(4−1) = 10

3-4-5-5-4-3

5-5

(5−1)+0+(5−1) = 8

2-5-6-5-4-2

5-6-5-4

(5−1)+2+(4−1) = 9

6-5-4

(6−1)+1+(4−1) = 9

8 bloków

1-2-3-6-6-3-2-1

3-6-6-3

(3−1)+2+(3−1) = 6

6-6

(6−1)+0+(6−1) = 10

1-2-4-5-5-4-2-1

4-5-5-4

(4−1)+2+(4−1) = 8

1-2-3-4-5-4-3-2

4-5-4

(4−1)+1+(4−1) = 7

9 bloków

1-2-3-4-4-4-3-2-1

2-3-4-4-4-3-2

(2−1)+5+(2−1) = 7

3-4-4-4-3

(3−1)+3+(3−1) = 7

3-4-4-4

(3−1)+2+(4−1) = 7

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Optymalizacja sumatora z przeskokiem przeniesień*

Zało enie: standardowe opó nienia prostych funkcji

Heureza

• łańcuchy optymalne:

jeśli rozmiar k bloków wytwarzających mniej znaczące pozycje sumy
jest typu

,...,k

−

, to maksymalne opóźnienie

u+k

= (g

+ i − 1)

+(k − i)

= (g

+ k − 1)

;

jeśli rozmiar s bloków wytwarzających bardziej znaczące pozycje sumy
jest typu

,...,s-

−

, to maksymalne opóźnienie

v+s

= (g

+ i − 1)

+(s − i)

= (g

+ s − 1)

;

• łańcuchy nieoptymalne:

jeśli skrajne bloki łańcucha nie są skrajnymi blokami łańcuchów
optymalnych, to tworzą cie k krytyczn propagacji przeniesienia.

Wnioski

• optymalna struktura sumatora powinna być typu 1-2-3-...-3-2-1.
• optymalną strukturą sumatora jest takŜe „1-2-3-...-3-2-1”\”1-2-…-s”.

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Optymalizacja sumatora z przeskokiem przeniesień – przykład*

• n-bitowy łańcuch optymalny 1-2-3-...-3-2-1 zawiera

−

bloków

• sumator n-bitowy powinien mieć najwyŜej 

−

 bloków

• (p–1)

≤ n ≤ p

–s

⇒ sumator n-bitowy powinien mieć ≤ 2(p–s) bloków

Przykład. Sumator 32-bitowy powinien mieć ≤ 8 bloków (32=6

–2

)

liczba grup struktura sumatora

maksymalne opóźnienie

2-3-4-5-4-5-4-3-2

(5−1)+1+(5−1) = 9

3-4-5-4-4-5-4-3

(5−1)+2+(5−1) = 10

2-3-4-6-6-5-4-2

(6−1)+2+(4−1) = 10

2-3-4-5-6-5-4-3

(6−1)+0+(5−1) = 9

Przykład. Sumator 24-bitowy powinien mieć ≤ 8 bloków (24=5

–1

)

liczba grup struktura sumatora

maksymalne opóźnienie

2-3-4-5-4-3-2-1

(5−1)+0+(4−1) = 7

1-2-3-4-5-4-3-2

(5−1)+0+(4−1) = 7

2-3-4-6-4-3-2

(6−1)+0+(4−1) = 8

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Inkrementer i dekrementer

wykonuje działanie X ±

→ wystarczy łańcuch półsumatorów (HA) lub półsubtraktorów (HS)

półsumator

(half adder, HA) – realizuje funkcje

⊕

półsubtraktor

(half subtracter, HS) – realizuje funkcje

⊕

k−2

k−1

HA/HS

k−2

HA/HS

sumator z inkrementacj wskutek przeniesienia (carry-increment adder, CIA

układ zliczaj cy

– inkrementer/dekrementer ze sprz eniem

)

(

)

(

i zapami tywaniem stanu

)

(

)

(

)

(

)

(

,...,

{

)

(

−

Szybkie sumatory

, AK1-7-09 Szybkie sumatory.doc, 4 listopada 2009

FAST–

Szybkość działania i złoŜoność sumatorów

Charakterystyki AT

• sumator pełny 1-bitowy FA – A = 7, T = 2 + 2 → A T = 28

– 2×XOR, 1×OR, 2×AND → opóźnienie przeniesienia 2 , sumy 2 + 2

• sumator RCA – A = 7n, T = 2n → A T = 14n

– n×FA → opóźnienie przeniesienia n ⋅ 2

• sumator kaskadowy CLA – A

≈

7n, T

≈

4 log n → A T

≈

56 n log n

– n×FA → log n bloków, opóźnienie przeniesienia 2 ⋅ 2 log n

• sumator PPA – A

≈

5n+3n log n , T

≈

3 + 2 log n → A T

≈

3n log

+14n log n

– log n poziomów GP, opóźnienie przeniesienia 2 log n

• sumator COSA – A = 3n log n, T = 2 + 2 log n → A T

≈

6 n log

– 2×RCA, log n poziomów MPX, opóźnienie przeniesienia 2 ⋅ log n

• sumator CSKA – A

≈

8n, T

≈

2 ⋅

→ A T

≈

32 n n

– n×FA+2 n ×MPX, 2 n bloków → opóźnienie przeniesienia 2 ⋅

• sumator CSLA – A

≈

2 ⋅ 7n, T

≈

→ A T

≈

39 n n

– 2×RCA,

2 bloków, opóźnienie przeniesienia 2 ⋅