Microsoft PowerPoint - 3_Przetw_danych-Typy_proces

Podstawy techniki

mikroprocesorowej

ETEW006

Typy procesorów

Przetwarzanie danych

Andrzej Stępień

Katedra Metrologii Elektronicznej i Fotonicznej

omplex

nstruction

omputer

[1#3]

http://en.wikipedia.org/wiki/Complex_instruction_set_computing

wspomaganie j

zyków wysokiego poziomu

– p

tle programowe

– wywołania podprogramów, funkcji

– przenoszenie parametrów do/z podprogramów, funkcji

– optymalizacja kodu wynikowego programu

– ograniczenie ilo

ci odwoła

do pami

– obni

enie kosztów systemu procesorowego (mniejsze wymagania

dotycz

ce pami

ci)

Complex Instruction Set Computer

[2#3]

Pravin R. Lakhe: A Technology In

Most Recent Processor Instruction Set Computers (CRISC): A Survey.

International Journal of Innovative Research & Studies, June 2013, Page 710 – 716

http://en.wikipedia.org/wiki/Complex_instruction_set_computing

cechy

procesorów typu

CISC

–

a liczba instrukcji, prostych i zło

onych

–

niewielka optymalizacja wykonywanych rozkazów, du

a liczba cykli

maszynowych konieczna do wykonania rozkazów (zwykle dłu

ej ni

cykl maszynowy)

–

zmienny rozmiar instrukcji, rozkazy o zmiennym formacie (długo

ci)

–

ró

norodne i zło

one tryby adresowania (przy dost

pie do pami

ci)

–

wspomaganie wykonywanych rozkazów mikrokodami (microcode)

–

segmentowy model pami

ci (adresowanie segmentowe)

–

mały zestaw rejestrów strukturalnych (dla u

ytkownika)

Complex Instruction Set Computer

[3#3]

cechy

procesorów typu

CISC

–

bezpo

redni dost

p do danych w pami

ci, bez konieczno

kopiowania zawarto

ci pami

ci do rejestrów roboczych

–

zło

ono

ść

i mała efektywno

ść

(szybko

ść

) działania dekodera

rozkazów

–

trudno

ci z racjonalnym wykorzystaniem zasobów procesora; przy

prostych, elementarnych operacjach wykorzystanie niewielkiej cz

ęś

zasobów procesora

–

brak przetwarzania potokowego

–

słaba wydajno

ść

operacji zmiennoprzecinkowych

Pravin R. Lakhe: A Technology In

Most Recent Processor Instruction Set Computers (CRISC): A Survey.

International Journal of Innovative Research & Studies, June 2013, Page 710 – 716

http://en.wikipedia.org/wiki/Complex_instruction_set_computing

Procesory CISC
C51 — Formaty instrukcji

MOV

@Ri, #dana

ró

ny, zmienny format rozkazów

r r r

ADD

A, Rn

0 1 1

dana

ACALL adr_11

0 0 0 1

adres A

CJNE

A, adr, rel

0 1 0 1

adres

rel

C500 Architecture and Instruction Set. User’s Manual.

Infineon, July 2000

Procesory CISC
8086 — Formaty instrukcji

procesor:

– o zło

onej li

cie rozkazów maj

cych

ró

ny, zmienny format

Intel Architecture Software Developer’s Manual.

Volume 2: Instruction Set Reference. Intel, 1997, p.2-1

Instruction

Prefixes

Opcode

ModR/M

SIB

Dispacement

Immediate

do czterech

1-bajtowych

prefixów

(opcjonalnie)

1 lub 2

bajty Op-

Code

przesuni

cie

adresu

(address

displacement)

0, 1, 2 lub 4

bajty

Mod

Reg/

Opcode

R/M

Scale

Index

Base

1 bajt

(je

wymagany)

1 bajt

(je

wymagany)

SIB (Scale-Index-Base)

przesuni

cie

adresu

(address

displacement)

0, 1, 2 lub 4

bajty

Procesory CISC
C51 — dostęp do pamięci

CISC

(

Complex Instruction Set Computer

) - procesor:

– predefiniowane przeznaczenie rejestrów, np. A (akumulator),

rejestry indeksowe do adresowania pami

ci (wiele rozkazów

wykonuj

cych operacje na komórkach pami

ci)

– o rozbudowanych trybach adresowania

wewn

trzna pami

ęć

RAM (dane)

MOV

A, @Ri

; A

←

(Ri)

IDATA

, i=0, 1

lub

MOV

@Ri, addr

; (Ri)

IDATA

←

(addr)

DATA

zewn

trzna pami

ęć

RAM (dane)

MOVX

A, @DPTR

; A

←

(DPTR)

XDATA

lub

MOVX

A, @Ri)

; A

←

(256

∗

P2 + Ri)

XDATA

pami

ęć

kodu (stałe)

MOVC

A, @A+PC

; A

←

(A + PC)

CODE

C500 Architecture and Instruction Set. User’s Manual.

Infineon, July 2000

Cechy procesora typu CISC

statystyka działania systemów operacyjnych i programów
u

ytkowych wskazuje na cz

ste wykonywanie operacji prostych

i rzadkie zło

onych

sterowanie przepływem rozkazów realizowane programowo

(

mikro-kody

); łatwa realizacja sterowania wykonywania zło

onych

rozkazów wymagaj

cych ró

nych okresów czasu

Czym jest "microcode" ?

[1#2]

Zło

ono

ść

mikroprocesora (miliony tranzystorów) i oprogramowania

(miliony linii kodu

ródłowego) sprzyja powstawaniu bł

dów projektantów

sprz

tu i oprogramowania

Dla systemów operacyjnych

(np. Microsoft Windows) s

dost

pne pakiety

programów (Service Pack), których zadaniem jest eliminacja bł

dów

znalezionych w dost

pnym oprogramowaniu (strony internetowe)

Procesory

, np. firmy Intel, mog

zawiera

sprz

towe

bł

dy działania

których eliminacja jest mo

liwa przez aktualizacj

mikrokodu procesora

Aktualizacje mikrokodu s

przechowywane nie w procesorze, s

tracone po

wył

czeniu zasilania procesora (aktualizacja przez BIOS przy ka

dym

starcie systemu operacyjnego)

Intel

IXP1200 Network. Processor Family. Microcode Programmer’s Reference Manual.

INTEL Corporation, March 2002, Part Number: 278304-011

80C196KB User's Guide. INTEL Corporation, November 1990, Order Number: 270651-003

www.intel.com: XP SP2 vs. Intel Prescott

Czym jest

"microcode" ?

[2#2]

MICROCODE

ENGINE

instrukcje dla procesora s

pobierane z kolejki

(queue) i tymczasowo przechowywane w
rejestrze rozkazów

maszyna stanów ’microcode’ dekoduje
instrukcje i generuje prawidłow

(koryguje) ich

sekwencj

80C196KB User's Guide.

INTEL Corporation, November 1990, Order Number: 270651-003

QUEUE

Cechy procesora typu RISC

[1#2]

uproszczon

struktur

mikroprocesora, o

zredukowanej li

cie

rozkazów

zaproponował John Cocke (IBM Research w Yorktown, New

York, 1974) wychodz

c z zało

enia,

e 20% dost

pnych instrukcji

zajmuje a

80% czasu pracy procesora

skrót

RISC

(

Reduced Instruction Set Computer

) zaproponował David

Patterson (University of California, Berkeley, 1985)

obecnie skrót

RISC

tłumaczony jako

Rational Instruction Set

Computer

idea RISC została wykorzystana w konstrukcji procesorów rodziny ARM

Reduced Instruction Set Computer

[2#2]

cechy

procesorów typu

RISC

– proste instrukcje i tryby adresowania

– jednolity format oraz stała długo

ść

instrukcji, ortogonalno

ść

instrukcji

– jednolite zasady dost

pu do pami

ci (load/store)

– przetwarzanie potokowe (pipelining)

– instrukcje wykonywane zwykle w 1 cyklu maszynowym

– sterowanie przepływem rozkazów realizowane sprz

towo (brak mikro-kodów,

eliminacja mikroprogramowania)

– wi

ksze mo

liwo

ci wyboru uniwersalnych rejestrów mikroprocesora

– dobra wydajno

ść

operacji zmiennoprzecinkowych

– implementacja pami

ci podr

cznych (cache)

– wykonanie operacji równowa

nej wymaga wi

kszej liczby rozkazów w

procesorze RISC ni

w procesorze CISC

Pravin R. Lakhe: A Technology In

Most Recent Processor Instruction Set Computers (CRISC): A Survey.

International Journal of Innovative Research & Studies, June 2013, Page 710 – 716

http://en.wikipedia.org/wiki/Reduced_instruction_set_computing

Procesor RISC
Cortex-M0/M0+

[1#3]

ARM Cortex™-M Programming Guide to

Memory Barrier Instructions. Application Note 321. ARM DAI 0321A, p.3

The

ARM Cortex-M

processors are high performance, low cost, low power,

32-bit RISC processors

, designed for microcontroller applications.

The range includes the Cortex-M3, Cortex-M4,

Cortex-M0, Cortex-M0+

and Cortex-M1 processors.

The

Cortex-M1

processor is targeted at implementation in

FPGA

devices.

Cortex-M

processors

differ

from

other ARM

processors, including the

Cortex-A/R

processors, because they

only execute Thumb instructions

They are based on the ARMv7-M and

ARMv6-M

architectures and have an

efficient instruction

pipeline

, with

low-latency Interrupt Service Routine

(ISR) entry and exit.

Procesor RISC
Cortex-M0/M0+

[2#3]

Cortex™-M0 Technical Reference Manual.

Rev. r0p0. ARM DDI 0432C, p.2-2

Cortex™-M0+ Technical Reference Manual.

Rev. r0p1. ARM DDI 0484C, p.2-2

Cortex-M0

Cortex-M0+

32-bit processor core

von Neumann architecture

3-stage pipeline

2-stage pipeline

ARMv6-M Thumb

instruction set; Thumb-2 technology

Optional

ARMv6-M compliant 24-bit SysTick timer

32-bit hardware multiplier

– single-cycle multiplier, in designs optimized for high performance
– 32-cycle multiplier, in designs optimized for low area

The ability to have deterministic, fixed-latency, interrupt handling

NVIC features

– 1, 2, 4, 8, 16, 24, or 32 external interrupt inputs, each with four levels of priority
– dedicated Non-Maskable Interrupt (NMI) input
– support for both level-sensitive and pulse-sensitive interrupt lines
–

optional Wake-up Interrupt Controller (WIC), providing ultra-low power sleep
mode support

—

optional Memory Protection Unit (MPU)

Low power sleep-mode entry using

Wait For Interrupt

(WFI),

Wait For Event

(WFE) instructions, or the return from interrupt sleep-on-exit feature

Procesor RISC

Cortex-M0/M0+

[3#3]

Cortex™-M0 Technical Reference Manual.

Rev. r0p0. ARM DDI 0432C, p.2-2

Cortex™-M0+ Technical Reference Manual.

Rev. r0p1. ARM DDI 0484C, p.2-2

Optional

Wakeup

Interrupt

Controller

(WIC)

Optional

Memory

Protection

Unit

(MPU)

Cortex-M0

Cortex-M0+

processor

core

Nested

Vectored

Interrupt

Controller

(NVIC)

Breakpoint

Watchpoint

Units

Optional

Debug

Access

Port

Debugger

interface

Bus matrix

Cortex-M0/

M0+

Components

Cortex-M0/

M0+

Processor

Interrupts

Optional

single cycle

I/O port

Optional

Serial-Wire or

JTAG debug port

Execution Trace Interface

System

timer

(SysTick

Timer)

AHB-Lite

interface

to system

Procesor typu CRISC

Procesory firmy Intel’s z serii Pentium nazwano

CRISC

(

omplex-

educe

nstruction

omputers)

Procesory serii Pentium s

hybryd

procesorów CISC i RISC

64-bitowe procesory serii x86

Intel Core 2 Duo

(2006 – dwurdzeniowe i

2007 – czterordzeniowe) s

oparte na architekturze Intel Core

microarchitecture (291 million of transistors)

Hasan Krad, Aws Yousif Al-Taie: A New Trend for CISC and RISC Architectures.
Asian Journal of Information Technology 6(11), 2007, p.1128

Pravin R. Lakhe: A Technology In Most Recent Processor Instruction Set Computers (CRISC):
A Survey. International Journal of Innovative Research & Studies, June 2013, Page 710 – 716

Intel

64 and IA-32 Architectures Software Developer’s Manual. Volume 1: Basic Architecture.

Intel, December 2009

Optymalizacja
Przetwarzanie Danych

Optymalizacja kompilatorów

rozkazy wykonywane przez procesor realizuj

funkcje, które najcz

ęś

ciej

powtarzaj

podczas kompilacji

lista rozkazów dostosowana do potrzeb kompilatorów, a nie własno

procesora

zało

enia przydatne przy projektowaniu nowych konstrukcji procesorów

Sposób przetwarzania danych

- obci

ąż

enie rejestrów procesora i pami

ci:

register-to-register

→

przestrzeni

robocz

rejestry ogólnego

przeznaczenia:

– accumulator-based

CPU, z akumulatorem zwi

zana jest

kszo

ść

instrukcji arytmetyczno-logicznych i wymiany danych

– register-based

CPU (register-to-register), rol

akumulatora pełni

rejestry ogólnego przeznaczenia

memory-to-memory

→

bloki pami

ci traktowane s

jako przestrze

robocza, zast

puj

ca rejestry ogólnego przeznaczenia

Przetwarzanie rozkazów

– sposób wykonania rozkazu w procesorze:

podział

wykonywanego

rozkazu

standardowe fazy

– pobierania

(

Fetch

)

rozkazu z pami

ci i umieszczenia w wewn

trznym

rejestrze rozkazów lub pami

ci buforuj

cej,

– dekodowania

(

Reg/Dec

)

rozkazu, ustalenie typu wykonywanej operacji,

np. pobrania argumentów,

– wykonania

(

Exec

)

rozkazu, np. wymaganej operacji arytmetyczno-

logicznej, obliczenia adresu itp.

– zapisu

(

)

wyniku w rejestrach lub pami

ci,

w przetwarzaniu

sekwencyjnym

(skalarnym) ka

da faza wykonywana jest

oddzielnie, niezale

nie od pozostałych,

w przetwarzaniu

potokowym

strumieniowym (pipeline processing)

poszczególne fazy ró

nych rozkazów s

w zasadzie wykonywane

równocze

nie.

Sekwencyjne przetwarzanie rozkazów

Sekwencyjne

(skalarne) - ka

da faza wykonywana jest oddzielnie,

niezale

nie od pozostałych.

Fetch

Cycle

Exec

Cycle

Fetch

Exec

Cycle

Fetch

Cycle

Fetch

Reg/Dec

Exec

pobierania

(

Fetch

)

rozkazu

dekodowania

(

Reg/Dec

)

rozkazu

wykonania

(

Exec

)

rozkazu

zapisu

(

)

wyniku

Reg/Dec

Cycle

Reg/Dec

Cycle

Potokowe przetwarzanie rozkazów

Fetch

Cycle

Fetch

Reg/Dec

Exec

pobierania

(

Fetch

)

rozkazu

dekodowania

(

Reg/Dec

)

rozkazu

wykonania

(

Exec

)

rozkazu

zapisu

(

)

wyniku

Fetch

Reg/Dec

Cycle

Potokowe

(strumieniowe, pipeline processing) - poszczególne fazy

ró

nych rozkazów s

wykonywana równocze

nie.

Exec

Cycle

Reg/Dec

Fetch

Cycle

Exec

Reg/Dec

Fetch

Cycle

Exec

Reg/Dec

Fetch

Cycle

Exec

Reg/Dec

Fetch

Cycle

Exec

Reg/Dec

Fetch

Cycle

Exec

Reg/Dec

Fetch

Problem

czynno

ść

czas trwania

pranie

30 minut

suszenie

40 minut

prasowanie + składanie

20 minut

Ala

Bartek

Czesiek

Dorota

pior

, susz

, prasuj

i składaj

Czynności wykonywane szeregowo

Ala

Bartek

Dorota

Czesiek

sumaryczny czas

wynosi

godzin

przetwarzanie sekwencyjne

Czynności
wykonywane
równolegle

Ala

Bartek

Dorota

Czesiek

sumaryczny czas

wynosi

3,5

godziny

Czynności
wykonywane
równolegle

Ala

Bartek

Dorota

Czesiek

sumaryczny czas

wynosi

3,5

godziny

• przetwarzanie

równoległe,

potokowe

(

pipeline

) nie skraca czasu trwania

poszczególnych faz ale skraca czas trwania całego zadania

• czas trwania poszczególnych faz w przetwarzaniu potokowym jest równy

najdłu

ej trwaj

cej fazie

• przetwarzanie potokowe umo

liwia równoczesne wykonywanie

niezale

nych zada

(

multiple tasks

)

• teoretyczna szybko

ść

jest równa liczbie niezale

nych faz (

pipe stages

)

• ró

ne długo

ci niezale

nych faz ograniczaj

szybko

ść

przetwarzania

konflikt

Konflikty przy przetwarzaniu
potokowym

zasobów

– ten sam zasób wykorzystywany jest przez dwie lub wi

cej

faz równocze

nie (ALU, rejestry lub pami

ęć

– ka

da operacja zapisu do rejestrów lub pami

ci mo

e by

konflikcie z faz

pobrania rozkazu lub argumentów

danych

– je

li argumentem nast

pnego rozkazu jest wynik

poprzedniego, który nie został obliczony:

– wykonanie nast

pnego rozkazu musi by

wstrzymane z powodu

niedost

pno

ci argumentu

sterowania

– gdy wykonywany jest rozkaz skoku warunkowego zale

od wska

ników ustalanych przez poprzednie, jeszcze nie zako

czone

rozkazy

Przetwarzanie potokowe - typ R

Instrukcja typu

(dost

p do rejestru) zło

ona z

cykli maszynowych:

• Fetch

pobranie kodu instrukcji z pami

ci programu

• Reg/Dec

: pobranie zawarto

ci rejestru i dekodowanie instrukcji

• Exec

ALU wykonuje operacj

na zawarto

ci 2 rejestrów

• Wr

wpis warto

ci zmiennej do rejestru

Fetch

Reg/Dec

Exec

Cycle 1 Cycle 2 Cycle 3 Cycle 4 Cycle 5

Fetch

Reg/Dec

Exec

Fetch

Reg/Dec

Exec

Cycle 6

– typ instrukcji znany po jej zdekodowaniu (

Fetch

Reg/Dec

)

Przetwarzanie potokowe - LOAD

Instrukcja typu

LOAD

zło

ona z

cykli maszynowych:

• Fetch

pobranie kodu instrukcji z pami

ci programu

• Reg/Dec

: pobranie zawarto

ci rejestru i dekodowanie instrukcji

• Exec

obliczenie adresu zmiennej w pami

ci danych

• Mem

odczyt warto

ci zmiennej z pami

ci danych

• Wr

wpis warto

ci zmiennej do rejestru

Fetch

Reg/Dec

Exec

Mem

Cycle 1 Cycle 2 Cycle 3 Cycle 4 Cycle 5

Fetch

Reg/Dec

Exec

Mem

Fetch

Reg/Dec

Exec

Mem

Cycle 6 Cycle 7

– instrukcja wykonywana w 5 niezale

nych blokach funkcjonalnych

– ka

da instrukcja korzysta tylko 1 raz z pojedynczego bloku funkcjonalnego

– pobranie kodu nast

pnej instrukcji mo

liwe po zako

czeniu poprzedniego

– czas trwania pojedynczej instrukcji wynosi 5 cykli maszynowych
–

redni czas trwania instrukcji w programie wynosi 1 cykl maszynowy

Konflikt zasobów

Fetch

Reg/Dec

Exec

Mem

Cycle 1 Cycle 2 Cycle 3 Cycle 4 Cycle 5

Fetch

Reg/Dec

Exec

Mem

Cycle 7

Fetch

Reg/Dec

Exec

LOAD

typ R

Cycle 6

• zasobów

– ten sam zasób wykorzystywany jest przez dwie lub wi

cej

faz równocze

nie (ALU, rejestry lub pami

ęć

– ka

da operacja zapisu do rejestrów lub pami

ci mo

e by

konflikcie z faz

pobrania rozkazu lub argumentów

Konflikt zasobów

Fetch

Reg/Dec

Exec

Mem

Cycle 1 Cycle 2 Cycle 3 Cycle 4 Cycle 5

Fetch

Reg/Dec

Exec

Mem

Cycle 7

Fetch

Reg/Dec

Exec

LOAD

typ R

Cycle 6

• zasobów

– ten sam zasób wykorzystywany jest przez dwie lub wi

cej

faz równocze

nie (ALU, rejestry lub pami

ęć

– ka

da operacja zapisu do rejestrów lub pami

ci mo

e by

konflikcie z faz

pobrania rozkazu lub argumentów

NOP

– w jednej z faz musi wyst

dodatkowy

cykl oczekiwania (

NOP

)

Konflikt danych

Fetch

Exec

Mem

Cycle 1

Cycle 3 Cycle 4

Reg/Dec

Exec

Mem

LOAD

Cycle 6

• danych

– je

li argumentem nast

pnego rozkazu jest wynik poprzedniego,

który nie został obliczony:

– wykonanie nast

pnego rozkazu (zatrzymanie potoku) wstrzymane z

powodu niedost

pno

ci argumentu

Cycle 5

Reg/Dec

Cycle 2

Fetch

Konflikt danych

Fetch

Exec

Mem

Cycle 1

Cycle 3 Cycle 4

Reg/Dec

Exec

Mem

LOAD

Cycle 6

• danych

– je

li argumentem nast

pnego rozkazu jest wynik poprzedniego,

który nie został obliczony:

– wykonanie nast

pnego rozkazu (zatrzymanie potoku) wstrzymane z

powodu niedost

pno

ci argumentu

Cycle 5

Reg/Dec

Cycle 2

Ifetch

– rozwi

zaniem konfliktu jest umieszczenie mi

dzy rozkazami instrukcji

niezale

nej od argumentów, np.

NOP

lub innej (problem

optymalizacji

kompilatorów

– rozkazy s

wykonywane nie w takiej kolejno

ci jak

zostały napisane w programie)

Reg/Dec

Exec

Mem

Reg/Dec

Exec

NOP

LOAD

Fetch

Reg/Dec

Fetch

Exec

wstrzymanie

potoku

Eliminacja konfliktów

• powielenie

niektórych wewn

trznych układów i

równoległe

wykonywanie tych samych operacji prowadzi do struktury

superskalarnej

• czasy realizacji

poszczególnych faz mog

ró

w zale

ci od

typu wykonywanej operacji,

• takty zegarowe

musz

tak dobrane, aby dłu

ej trwaj

ce fazy były

wykonywane przez całkowit

liczb

tych taktów, np. jałowe takty

oczekiwania,

• do

skrócenia czasu

wykonywanych operacji przyczynia si

umieszczenie argumentów w wewn

trznych rejestrach, a nie w pami

ci;

procesor musi by

wyposa

ony w du

żą

liczb

wewn

trznych rejestrów,

• zmniejszeniu liczby rozkazów

potrzebnych do wykonania zadania

sprzyja du

a długo

ść

słowa maszynowego.

Procesor RISC: Cortex-M0/M0+

ARM Cortex™-M Programming Guide to

Memory Barrier Instructions. Application Note 321. ARM DAI 0321A, p.16

dwie (16-bitowe) instrukcje s

pobierane równocze

nie

pobranie

(fetch)

dekodowanie

(decode)

wykonanie 1

(execution)

pobranie

(fetch)

dekodowanie

(decode)

wykonanie 2

(execution)

pobranie

(fetch)

dekodowanie

(decode)

wykonanie 3

(execution)

pobranie

(fetch)

dekodowanie

(decode)

wykonanie 4

(execution)

Rysunek 3

Przetwarzanie potokowe
w procesorze Cortex-M0

instrukcja 1

instrukcja 2

instrukcja 3

instrukcja 4

dwie (16-bitowe) instrukcje s

pobierane równocze

nie

pobranie

(fetch)

wykonanie 1

(execution)

pobranie

(fetch)

wykonanie 2

(execution)

pobranie

(fetch)

wykonanie 3

(execution)

pobranie

(fetch)

wykonanie 4

(execution)

Rysunek 4

Przetwarzanie potokowe
w procesorze Cortex-M0+

instrukcja 1

instrukcja 2

instrukcja 3

instrukcja 4

Skrócenie cykli maszynowych

szybsza reakcja na przerwania (Interrupt entry) oraz skoki (Branch)

szybsze GPIO oraz dost

p do układów peryferyjnych (peripheral access)

Mark Dunnett, Senior Field Application Engineer:

ARM Cortex-M0+ Core. Technical Introduction.

Hitex: ARM – The New Standard Across the Board ?

Freescale, May 2012, p.17

Cortex-M0+

Przetwarzanie potokowe

(Pipelining)

MCS51
Typy danych

Typ danej

Bity

Bajty

Zakres warto

bit

0 or 1

signed

char

–128 .. 0 ...... +127

unsigned

char

0 ......... 255

signed

short int

–32 768 .. 0 .. +32 767

unsigned

short int

0 .... 65 535

signed

int

–32 768 .. 0 .. +32 767

unsigned

int

0 .... 65 535

signed

long int

–2 147 483 648 .. 0 .. +2 147 483 647

unsigned

long int

0 .... 4 294 967 295

float

±1.175494E–38 .. 0 .. ±3.402823E+38

double

±1.175494E–38 .. 0 .. ±3.402823E+38

sbit

0 or 1

sfr

0 ......... 255

sfr16

0 .... 65 535

Uwaga: dane typu:

bit

sbit

sfr

oraz

sfr16

nie wyst

puj

w standardzie

ANSI C. To unikatowa cecha kompilatora Cx51.

Cx51 User's Guide.

ARM Ltd and ARM Germany GmbH.

MSP430
Typy danych

Typ danej

Rozmiar

Zakres warto

Uporz

dkowanie

bool

8 bitów

0 lub 1

char

8 bitów

0 ...... 255

signed

char

8 bitów

–128 .. 0 ...... 127

unsigned

char

8 bitów

0 ...... 255

signed

short

16 bitów

–32 768 .. 0 .. 32 767

unsigned

short

16 bitów

0 .. 65 535

signed

int

16 bitów

–32 768 .. 0 .. 32 767

unsigned

int

16 bitów

0 .. 65 535

signed

long

32 bity

–2

.. 0 .. 2

–1

unsigned

long

32 bity

0 .. 2

–1

signed

long long

64 bity

–2

.. 0 .. 2

–1

unsigned

long long

64 bity

0 .. 2

–1

MSP430 IAR C/C++ Compiler Reference Guide

for Texas Instruments’ MSP430 Microcontroller Family.

IAR Systems, Tab. 30 – Integer types

ARM
Typy danych

RealView

Compilation Tools. Compiler Reference Guide.

Version 4.0. ARM DUI 0348C, Tab.5.2

Rozmiar

Typ

w bitach

Uporz

dkowanie w bajtach

char

1 bajt (byte-aligned)

short

2 pół-słowo (halfword-aligned)

int

4 słowo (word-aligned)

long

4 słowo (word-aligned)

long long

8 podwójne-słowo (doubleword-aligned)

float

4 słowo (word-aligned)

double

8 podwójne-słowo (doubleword-aligned)

long double

8 podwójne-słowo (doubleword-aligned)

All pointers

4 słowo (word-aligned)

bool (C++ only)

1 bajt (byte-aligned)

_Bool (C only)

1 bajt (byte-aligned)

wchar_t (C++ only)

2 pół-słowo (halfword-aligned)

Bajt, pół-słowo

(half-word)

, słowo

(word)

podwójne słowo

(double word)

Word

Low
Byte

N+1

High
Byte

8 7

Doubleword

Low Word

N+2

High Word

Double Quardword

Low Quardword

N+8

High Quardword

127

32-bit microprocessor

ARM core

word

halfword

Figure 4-1. Fundamental

DataTypes

Intel

64 and IA-32 Architectures Software Developer’s

Manual. Volume 1: Basic Architecture. Intel, December 2009

Steve Furber: ARM System-on-chip Architecture.

Second edition. Addison-Wesley, 2000

Quardword

Low Doubleword

N+4

High Doubleword

Kolejność bajtów

(Byte order / Endianness)

Format: Little / Big Endian

A+1

bardziej

znacz

cy bajt

(High-order Byte)

Low Byte

High Byte

A+1

A+2

−

format: Little Endian

adres pami

(memory address)

A+1

format: Big Endian

High Byte

Low Byte

mniej

znacz

cy bajt

(Low-order Byte)

bardziej

znacz

cy bajt

(High-order Byte)

mniej

znacz

cy bajt

(Low-order Byte)

Cortex-M0
Kolejność zapisu bajtów

(Endianness)

Cortex™-M0 Devices. Generic User Guide.

ARM DUI 0497A, p.2-17

Cortex-Mx

taktuje pami

ęć

jak liniowy zbiór bajtów ponumerowanych

narastaj

co od warto

ci zerowej

Bajty

o numerach 0-3 przechowuj

pierwsze (32–bitowe) zapisane

słowo, bajty o numerach 4-7 przechowuj

drugie (32–bitowe) zapisane

słowo itp.

Kolejno

ść

zapisywanych bajtów w pami

ci zale

y od implementacji

zastosowanej przez producenta mikrokontrolera

Stosowane dwa

formaty zapisów

–

little-endian

(LPC1114–Cortex-M0, STM32L053–Cortex-M0+, ..)

–

byte-invariant big-endian

jako big-endian (zachowanie zgodno

ci z

procesorami ARM7TDMI i ujednolicenie sposobu przesyłania danych
we wn

trzu procesora)

Cortex-M0
Format little endian

A+2

A+3

najbardziej

znacz

cy b

ajt

(most significant byte)

(msbyte)

bardziej

znacz

cy bajt

A+1

mniej

znacz

cy b

ajt

najmniej

znacz

cy bajt

(least significant byte)

(lsbyte)

−

adres pami

(memory address)

A+1

A+2

A+3

A+4

Cortex™-M0 Devices. Generic User Guide.

ARM DUI 0497A, p.2-18

format

little-endian

lsbyte

msbyte

Implementacja przez

producentów

mikrokontrolerów

Cortex-M0
Format byte-invariant big-endian

(BE8)

A+2

A+3

najbardziej

znacz

cy b

ajt

(most significant byte)

(msbyte)

bardziej

znacz

cy bajt

Cortex™-M0 Devices. Generic User Guide.

ARM DUI 0497A, p.2-18

A+1

mniej

znacz

cy b

ajt

najmniej

znacz

cy bajt

(least significant byte)

(lsbyte)

−

adres pami

(memory address)

A+1
A+2
A+3
A+4

B1
B2
B3

w procesorach Cortex-Mx
format big-endian zast

piono

formatem

byte-invariant big-endian

lsbyte

msbyte

sposób składowania danych w pami

ci tak, by mogły by

efektywnie

wykorzystane

procesory

ARM

maj

bajtowy

(8-bitowy),

pół-słowowy

(16-bitowy) i

słowowy

(32-bitowy) dost

p do danych w pami

kompilator

procesorów

ARM

rozmieszcza dane w pami

ci wg. zasady:

ARM Uporządkowanie danych

(Data alignment)

typ

liczba

rozmieszczenie w pami

bajtów

char

od dowolnego adresu

short

od adresu podzielnego przez 2 bez reszty

float, int, long

od adresu podzielnego przez 4 bez reszty

long long, double

od adresu podzielnego przez 4 bez reszty

Big and Little Endian Byte Addressing. App Note 61

ARM,

DAI 0061A, p.4

ARM

Compiler toolchain. Using the Compiler. Version 4.1.

ARM DUI 0472C, p.6-43

ARM - efektywne programowanie w C

Struktury danych w pamięci

(Little-Endian Memory System)

struct {

char

int

;

char

;

short d

;

}

23 .. 16

wolne

7 .. 0

31 .. 24

wolne

15 .. 8

wolne

7 .. 0

Adres

uporz

dkowanie zmiennych w pami

struct {

char

;

short d

;

int

;

}

23 .. 16

7 .. 0

31 .. 24

15 .. 8

7 .. 0

Adres

uporz

dkowanie zmiennych w pami

efektywne wykorzystanie pami

A. Sloss, D. Symes, C. Wright: ARM System Developer’s

Guide. Desining and Optimizing System Software.

Morgan Kaufmann, 2004

USB Device Descriptor
Example

code struct usb_st_device_descriptor usb_device_descriptor =
{

0x12,

/* Size of this descriptor in bytes

0x01,

/* DEVICE descriptor type

0x1001,

/* Binay Coded Decimal Spec. release

0x00,

/* Class code assigned by the USB

0x00,

/* Sub-class code assigned by the USB

0x00,

/* Protocol code assigned by the USB

0x08,

/* Max packet size for EP0 (8, 16, 32, 64)

EB03

/* Vendor ID (

0x03EB

- Atmel)

0320

/* Product ID assigned by the manufacturer

(

0x2003

- HID Keyboard)

0x0001,

/* Device release number

0x01,

/* Index of manu. string descriptor

0x02,

/* Index of prod. string descriptor

0x03,

/* Index of S.N. string descriptor

0x01

/* Number of possible configurations

};

Problemy i pytania

1. Jakie typy danych okre

laj

skróty: char, short, int, float ?

2. Jaki jest zakres zmienno

ci danych typu: char, short, int, float ?

3. Ile bajtów licz

zmienne typu: bajt, half-word, word, double-word ?

4. Jaka jest kolejno

ść

bajtów zmiennej typu word przy zapisie typu little-endian ?

5. Jaka jest kolejno

ść

bajtów zmiennej typu word przy zapisie typu big-endian ?

6. Jaki jest wpływ uporz

dkowania danych w pami

ci na szybko

ść

działania CPU ?

7. Jakie fazy mo

na wyró

w trakcie wykonywania rozkazu przez procesor ?

8. Na czym polega przetwarzanie sekwencyjne (skalarne) ?

9. Jakie s

wady i zalety przetwarzania sekwencyjnego ?

10. Na czym polega przetwarzanie potokowe (strumieniowe) ?

11. Jakie s

wady i zalety przetwarzania potokowego ?

12. Jakie typy konfliktów wyst

puj

przy przetwarzaniu potokowym ?

13. Co oznaczaj

poj

cia: CISC oraz RISC ?

14. Jakie s

wady i zalety procesorów typu CISC ?

15. Jakie s

wady i zalety procesorów typu RISC ?