Wykład 6 6 kodowanie mowy

background image

Instytut Systemów Łączności

Wydział Elektroniki

WOJSKOWA AKADEMIA TECHNICZNA

prowadzący:

por. mgr inż. PIOTROWSKI Zbigniew

WEL ISŁ ZRiWRE

konsultacje: czwartek godz. 16:30-18:00 p.104/47

tel. 0-501-334-151

E-mail:

zpiotrowski@wel.wat.waw.pl

SYSTEMY RADIOKOMUNIKACJI RUCHOMEJ

Przedmiot wybieralny

„Systemy łączności bezprzewodowej”

rok akademicki 2000/2001 grupa szkoleniowa: E-

45za, E-45zb

background image

Organizacja zajęć

Cyfrowe przetwarzanie mowy. Przegląd metod

kodowania mowy

        -

przetwarzanie wstępne

     -

teoria próbkowania

-

kwantyzacja

    

-

pojęcie filtracji cyfrowej; filtry NOI, SOI

-

transformata Fouriera

-

algorytmy przetwarzania mowy

Wokodery LPC-10e, CELP, MELP, GSM 6.10

background image

Algorytmy przetwarzania mowy:

PCM

– modulacja kodowo-impulsowa

DM

– modulacja delta

DPCM

– różnicowa modulacja kodowo-impulsowa

ADM

– adaptacyjna modulacja delta

ADPCM

– adaptacyjna różnicowa PCM

APC

– adaptacyjne kodowanie predykcyjne

SBC

– kodowanie na podpasma

CVSD

– modulacja DM o ciągłej zmianie

nachylenia

LPC

– liniowe kodowanie predykcyjne

MELP

– wokoder z pobudzeniem mieszanym

wokoder hybrydowy GSM

background image

Przetwarzanie wstępne:

wybielanie wstępne

Cel:

zmniejszenie szybkości zmian gęstości widmowej mocy w funkcji

częstotliwości. Pomocne przy usuwaniu szumu addytywnego,
nieliniowości przetwarzania, modulacji skrośnej.

Przed rozpoczęciem analizy sygnału dobrze jest przeprowadzić wstępne
uwydatnienie lub wygładzenie większych częstotliwości widma. Ideałem
byłoby sprowadzenie widma sygnału do widma szumu białego (stała
gęstość widmowa) i dlatego proces ten nazywa się wybielaniem
wstępnym.

usuwanie trendu

Cel:

usunięcie liniowego lub wolnozmiennego błędu systematycznego

towarzyszącemu interesującemu nas przebiegowi. Trend jest
wprowadzany przez samą metodę zbierania lub zapisu danych i wyraża
się stałym, jednokierunkowym przesunięciem punktu odniesienia
zapisanej zmiennej.

Ważnym jest usunięcie trendu zanim sygnał poddamy operacji
całkowania np. przekształcenie Fouriera (wyznaczenie funkcji gęstości
widmowej mocy lub podobne obliczenia będą obarczone znacznym
błędem).

Usunięcie trendu: oszacowanie wartości średniej i odjęcie od

sygnału podczas przetwarzania wstępnego.

background image

Prawo Shannona o przepływności kanału

telekomunikacyjnego:

C = W lg

2

(1+S/N)

C – przepływność kanału w bitach na sekundę

W – szerokość pasma przenoszenia sygnału w
Hz

S – moc sygnału użytecznego

N – moc szumu

background image

Prawo Shannona a problem

próbkowania:

Jeśli funkcja f(t) nie zawiera częstotliwości wyższych niż W cykli
na sekundę (Hz), wówczas jest ona całkowicie określona przez
podanie jej rzędnych jako ciągu punktów oddzielonych od siebie
o czas równy okresowi 1/2W.

W celu osiągnięcia dokładnej reprezentacji sygnału analogowego
minimalna częstotliwość próbkowania powinna być co najmniej
dwa razy wyższa od składowej o najwyższej częstotliwości
sygnału oryginalnego.

częstotliwość Nyquista lub granica Nyquista

f

s

≥ 2f

N

background image

Prawo Shannona a problem

próbkowania:

próbkowany sygnał analogowy

widmo częstotliwościowe

background image

widmo próbkowane: f

s

>2f

m

– widmo powtarza się co

każde f

s

background image

f

s

< 2f

m

– pasma częstotliwościowe nakładają się na siebie, co

powoduje interferencję sygnału wejściowego. Efekt ten nazywa
się aliasingiem, czyli utożsamianiem.

background image

wpływ f

s

na sygnał wejściowy

dla różnych częstotliwości próbkowania sygnału sinusoidalnego
o częstotliwości f

a

gdy f

s

=2f

a

– próbkowanie na granicy Nyquista

background image

wpływ f

s

na sygnał wejściowy

f

s

< 2f

a

łącząc między sobą miejsca próbkowania liniami prostymi

nie możemy osiągnąć żadnych cech oryginalnego sygnału
sinusoidalnego.

background image

aliasing a filtracja dolnoprzepustowa

usunięcie wszystkich częstotliwości leżących powyżej f

m

(zmniejszenie szerokości pasma sygnału wejściowego)

background image

wpływ f

s

na sygnał

wejściowy

f

s

>> f

a

– im stosunek częstotliwości jest większy, tym lepsza jest

dokładność reprezentacji cyfrowej sygnału wejściowego.

background image

kwantyzacja:

Przedstawienie szeregu dyskretnych wartości próbek o
zmiennych amplitudach w postaci szeregu liczb
dyskretnych reprezentujących wartości tych amplitud.
proces jest przybliżeniem sygnału analogowego
wartości numeryczne skwantowanej zmiennej można
zakodować za pomocą kodu binarnego

wpływ kwantyzatora: x

q

(t)=x(t)+x

n

(t)

błąd kwantyzacji: E <= ½ * A/2

N

= +/- q/2

background image

kwantyzacja

Funkcje jakie muszą być zrealizowane aby przetworzyć

sygnał analogowy w postać zrozumiałą przez DSP

background image

kwantyzacja

Im więcej zastosujemy przedziałów, tym dokładniej opiszemy
wejściowy sygnał analogowy. Najczęściej systemy DSP
wykorzystują przetwarzanie a/c o 10-12 bitach. Oznacza to, że
sygnał wejściowy będzie mierzony z dokładnością 2

10

(1024) lub

2

12

(4096) poziomów.

Tak więc, jeżeli mamy sygnał wejściowy, którego amplituda
zmienia się w granicach od 0V do 5V, wówczas najmniej
znaczący bit (LSB), tzn. pojedynczy bit będzie odpowiadał
wartości 4.88 mV dla 10-bitowego przetwornika a/c i 1.22mV dla
12-bitowego przetwornika c/a.

background image

background image

background image

background image

dyskretne przekształcenie Fouriera:

DFT jest procedurą matematyczną używaną do wyznaczenia
zawartości harmonicznej, lub częstotliwościowej sygnału
dyskretnego. DFT pochodzi od ciągłego przekształcenia Fouriera
X(f):

dt

x(t)e

X(f)

j2π2π

DFT zapisujemy następująco:

1

0

/

2

)

(

)

(

N

n

N

nm

j

e

n

x

m

X

x(n) jest dyskretnym ciągiem próbkowanych wartości w dziedzinie
czasu, e – podstawa logarytmu naturalnego,

1

j

background image

dyskretne przekształcenie Fouriera:

background image

-3 dB

|A| (dB)

f (Hz)

tętnienia pasma
przepustowego

tętnienia pasma
zaporowego

filtracja cyfrowa

cechy idealnych filtrów cyfrowych
charakterystyka filtrów

cyfrowych:

-

charakterystyka amplitudowa

-

charakterystyka fazowa

-

odpowiedź impulsowa

typy filtrów: NOI, SOI

background image

klasyfikacja algorytmów przetwarzania mowy:

KODOWANIE

PARAMETRYCZNE

(WOKODERY)

KODOWANIE

PRZEBIEGU

SYGNAŁU

W DZIEDZINIE

CZASU

W DZIEDZINIE

CZĘSTOTLIWOŚCI

HOMOMORFICZNE

LPC

FORMANTOWE

KANAŁOWE

BEZ PAMIĘCI:

PCM

Z PAMIĘCIĄ

Z PODZIAŁ

EM NA

PODPASMA:

SBC

APC

RÓWNOLEGŁE

SZEREGOWE

STAŁY

KROK

ZMIENNY

KROK

DPCM

DM

ADPCM

ADM

MPE

RPE

RELP

CELP

ACELP

VSELP

RCELP

MELP

background image

FS1015 LPC-10e
female

FS1015 LPC-10e
male

FS1015 LPC-10e
music

femal
e

mal
e

musi
c

FS1016 CELP
female

FS1016 CELP male

FS1016 CELP
music

G.721 ADPCM
female

G.721 ADPCM
male

G.721 ADPCM
music

GSM 6.10 full rate
female

GSM 6.10 full rate
female

GSM 6.10 full rate
music

przykładowe nagrania dla podstawowych koderów mowy

background image

PCM – modulacja kodowo-
impulsowa

wartość próbki sygnału jest przesyłana w postaci cyfry

wyrażonej w kodzie binarnym.

Sygnał analogowy podlega próbkowaniu i kwantowaniu, czyli
aproksymacji za pomocą przebiegu schodkowego o skończonej
liczbie przebiegów.

W następnym etapie realizuje się kodowanie wartości próbek za
pomocą k-pozycyjnego kodu binarnego. Poszczególne pozycje
(bity) kodu mogą przyjmować wartości 1 lub 0, które są
reprezentowane przez obecność lub brak impulsu na
odpowiedniej pozycji ciągu kodowego.

Impulsy te są przesyłane do kanału telekomunikacyjnego
bezpośrednio lub po zastosowaniu wtórnej modulacji ciągłej fali
nośnej.

Strona odbiorcza – dekodowanie liczb binarnych (przejście do
modulacji amplitudy impulsów), wydzielenie sygnału
modulującego za pomocą filtru dolnoprzepustowego

background image

Przy kwantowaniu równomiernym, moc szumu wynosi:

E

2

= d

2

/12

Wymaganie: S/N=25dB (11 bitów – 2048 poziomów) przy
f

p

=8kHz przepływność binarna wynosi wówczas 88000 bit/s.

Wniosek: redukcja poziomów kwantowania.

Sposoby redukcji:

kompresor sygnału (dużo wzmacnia słabe sygnały i mało

wzmacnia sygnały silne)

koder nierównomierny

koder równomierny z małym krokiem kwantowania z

kompresorem cyfrowym

PCM – modulacja kodowo-impulsowa

background image

PCM – modulacja kodowo-
impulsowa

Kodowanie i kwantowanie próbek sygnału w PCM

 

7

6

5

4

3

2

1

0

1 1 1

1 1 0

1 0 1

1 0 0

0 1 1

0 1 1

1

0 0

0

0

0

1 0 0 1

1

0

0

1 1 1

1 1

0 1 1

0

0 0

0 0 1

1

0

0

Kod

dwójko

wy

Nr przedziału

4

5

7

6

5

0

1

2

Sygnał

background image

0

Sygnał

Sygnał

0

t

t

t

PCM

PAM

PAM

t

t

fg

fg

KODER

DEKODER

fp>2fg

PCM – modulacja kodowo-
impulsowa

zasada pracy systemu z modulacją impulsowo-kodową

background image

modulacja
delta

1

1 1

1

1

1

0

0

0

0

0

1

1

0

y(t)

x(t)

1

2

3

4

5

6

7

t

t

background image

modulacja
delta

 pozwala na wyeliminowanie niektórych bitów nadmiarowych
 mniej wrażliwa na błędy kanału transmisyjnego
 używamy częstotliwości o wartości 1/n w stosunku do
częstotliwości wymaganej przez PCM (n – liczba
bitów wymaganych przez metodę PCM)
 dwie podstawowe przyczyny błędów: przeciążenie
nachylenia i ziarnistość

KWANTYZER

J EDNOBITOWY

UKŁAD

PROGNOZUJ ACY

PIERWSZEGO

RZĘDU

UKŁAD

PROGNOZUJ ACY

PIERWSZEGO

RZĘDU

x(n)

+

-

x'(n)

d(n)

e(n)

kanał

y'(n)

z(n)

+

+

+

+

s(n)

background image

t

t

modulacja delta przy pojawieniu się ziarnistości związanej ze zbyt

dużym

rozmiarem kroku

modulacja typu delta przy pojawieniu się przeciążenia nachylenia

związanego ze zbyt małym rozmiarem kroku

modulacja
delta

background image

DPCM – różnicowa PCM

lepszy stosunek S/N – wyższa jakość sygnału
wyjściowego
DPCM zakłada kwantyzację jedynie różnicy miedzy
sygnałami , a nie wielkości absolutnych, wprowadza
mniejszy błąd kwantyzacji

background image

 

 

Modulator i demodulator dla różnicowej metody PCM

KWANTYZATOR

(p POZIOMÓW)

UKŁAD

PROGNOZUJ ACY

UKŁAD

PROGNOZUJ ACY

x(n)

+

-

x'(n)

d(n)

kanał

y'(n)

z(n)

+

+

+

+

s(n)

y(n)

DPCM – różnicowa PCM

Ogólna postać węzła prognozującego DPCM może być wyrażona
następującym równaniem:

gdzie h

R

jest zbiorem współczynników prognozowania. Zauważymy, że

jeśli , a pozostałe współczynniki są równe zeru, wówczas mamy do
czynienia z modulatorem typu delta.

)

(

)

(

1

'

R

n

s

h

n

x

N

R

R

background image

BUFOR

KWANTYZATOR

/KODER

DEKODER

PROGNOZOWANIE

POZIOMU

PROGNOZOWANIE

POZIOMU

KWANTYZATOR

/KODER

PROGNOZOWANIE

POZIOMU

DEKODER

PROGNOZOWANIE

POZIOMU

x(n)

x(n)

y(n)

y(n)

AQF

AQB

DPCM – różnicowa PCM

modulacja i demodulacja typu DPCM-AQF i

DPCM-AQB

background image

ADPCM – adaptacyjna
DPCM

KONWERSJ A

FORMATU

OBLICZANIE RÓŻ

NICY

KANTYZATOR

ADAPTACYJ NY UKŁ

AD PROGNOZUJ Ą

CY

KWANTYZATOR

WSPÓŁCZYNNIK

SKALUJ ĄCY
ADAPTACJ A

STEROWANIE

SZYBKOŚCIĄ

ADAPTACJ I

INWERSYJ NY

KWANTYZATOR

ADAPTACYJ NY

KODER

x(n)

x'(n)

d(n)

y(n)

a(n)

r(n)

r(n)

d'(n)

+

+

Obliczanie sygnału

zrekonstruowanego

S (n)

e

x''(n)

INWERSYJ NY

KWANTYZATOR

ADAPTACYJ NY

ADAPTACYJ NY UKŁ

AD PROGNOZUJ Ą

CY

KWANTYZATOR

WSPÓŁCZYNNIK

SKALUJ ĄCY
ADAPTACJ A

STEROWANIE

SZYBKOŚCIĄ

ADAPTACJ I

OBLICZANIE SYGNAŁU

ZREKONSTRUOWANEGO

KONWERSJ A

FORMATU

NASTRAJ ANIE

KODOWANIA

SYNCHRONICZNEGO

y(n)

DEKODER

d'(n)

S (n)

e

S (n)

p

z(n)

S (n)

o

r(n)

a(n)

r(n)

background image

CVSD – DM z ciągłą zmianą nachylenia

ADAPTACJ A

ROZMIARU

KROKU

KODER

KWANTYZATOR

UKŁAD

PROGNOZUJ ĄCY

n

Kanał

y(n)

+

x'(n)

x''(n)

x(n)

KODER

ADAPTACJ A

ROZMIARU

KROKU

DEKODER

UKŁAD

PROGNOZUJ ĄCY

y'(n)

n

+

+

y''(n)

DEKODER

background image

DECYMACJ A

DECYMACJ A

KODOWANIE

1

KODOWANIE

n

Mux

DEKODOWANIE

1

DEKODOWANIE

n

INTERPOLACJ A

INTERPOLACJ A

Demux

1

n

+

+

1

n

y(n)

x(n)

SBC - kodowanie podpasmowe

background image

wokoder kanałowy

Detekcje

tonów

wysokich

Prostownik

a/c

Prostownik

a/c

Detekcje dź

więków głoś

nych

1

16

Mux

Wyjście

Wejście

a/c

a/c

Częstotliwoś

ć tonów

wysokich

Informacje o

dźwiękach gł

ośnych

Źródlo

szumów

Źródło

impulsów

x

x

Zsyntezowany

sygnał mowy

Demux

Wejście

cyfrowe

1

16

+

+

background image

512 punktowe

FFT

Moduł w

postaci

logarytmicznej

IFFT

x

x(n)

Analizator

c(n)

512 punktowe

FFT

IFFT

Postać wykł

adnicza

Splot

Generator

pobudzający

c(n)

Syntezator

Parametry

pobudzenia

x(n)

wokoder
homomorficzny

background image

Formant-1

Formant-2

Formant-3

Nadajnik

Kanał

Mowa

Generator 1

Generator 2

Generator 3

Nadajnik

Kanał

Mowa

wokoder
formantowy

background image

u(n) =-

p=1

p

a

p

u(n-p)

wokoder liniowej predykcji LPC

a - współczynniki predykcji,

p = 1,2,...,P, P- rząd
predykcji,

p

Liniowy

predyktor

rzędu p

p=1

P

a

p

u(n-p)

k

v(n)

u(n)

-

~

u

background image

wokoder liniowej predykcji LPC

Podział na ramki

o długości 22,5

ms

Analiza sygnału

mowy 10-tego rzędu

Obliczanie współ

czynnika

wzmocnienia

fragmentu mowy

Analiza dźwięczności

fragmentu mowy

K

O
D

E

R

M

U

L

T

I

P

L

E
K
S
E

R

Synchronizacja

Liczba bitów

Wejście sygnału

mowy

m

7

w

5

10k

i

wyjście mowy

syntetycznej

54 bity

A N A L I Z A

Generator impulsów

fragmentów dźwię

cznych mowy

Generator szumu biał

ego fragmentów
bezdźwięcznych

mowy

LPC

filtr 10-tego

rzędu

Demultiplekser

Dekoder

Wejście sygnału

mowy

Informacja o dźwięczności fragmentu mowy

Wyznaczanie współczynnika wzmocnienia

10k

i

Wyjscie mowy

syntetycznej

S Y N T E Z A

background image

Filtr

dolnoprzepustowy

4 kHz

A/C

Filtr

preemfazy

Filtr
LPC

Filtr

dolnoprzepustowy

Koder
RPE

Obliczanie

parametrów

filtru LPC

+

Układ LTP

M
U
L
T
I
P
L
E
K
S
E
R

.

.

8 kHz

.

.

.

.

.

.

.

Sygnał
zakodowany

13 kbit/s

LPC

LTP

RPE

2 parametry LTP
8 parametrów LPC

Sygnał mowy

.

wokoder GSM

Dekoder

RPE

Moduł

LTP

Odwrotny

filtr LPC

Filtr

deemfazy

Sygnał

mowy

104 kbit/s

Próbki
sygnału
8.8 kbit/s

Parametry

modułów

4.2 kbit/s

.

.

background image

generator

szumu

filtr

przeciwszumowy

generator

impulsów

jitter

impulsów

filtr

filtr traktu
głosowego

filtr

adaptacyjny

dyspersja

impulsów

mowa

syntezowana

wokoder MELP

background image

G

G

1

A(z)

1

P(z)

.

.

.

.

.

+

Stały zbiór

sygnałów

pobudzeń

Wzmocnienie

Filtr LTP

Adaptacyjny zbiór sygnałów

pobudzeń

WE

sygnał mowy

-

Pętla optymalizacyjna

wokoder CELP

background image

 

techniki kodowania sygnału mowy

metoda kodowania

przepływność binarna (kbit/s)

liniowa PCM

80 - 120

kompandowana PCM

50-100

modulacja delta

50-80

DPCM (differential PCM)

40-80

ADM (adaptative delta modulation)

16-40

koder pasmowy (subband coder)

10-32

ATC (adaptive transform coder)

8-32

APC (adaptive predictive coder)

8-32

MPLPC (multi-pulse excited LPC)

8-16

CELP (code excited LPC)

4-16

SEV (self-excited vocoder)

4-16

LPC wokoder (m.in. MELP)

0.6-2.4

background image

dziękuję za
uwagę !


Document Outline


Wyszukiwarka

Podobne podstrony:
Plan wykładu - zaburzenia mowy, Logopedia
Plan wykładu - zaburzenia mowy, Logopedia
WYKŁAD Kodowanie podpasmowe TELEKOMUNIKACJA
Kodowanie zbior pytan wykład
Kodowanie nowy wykład, Przestrzenie wektorowe, 3
Wykład VIII Przykłady kodowania automatów asynchronicznycvh II
Wykład III Przykłady kodowania automatów synchronicznych
KSZTAŁTOWANIE SIĘ MOWY DZIECKA WYKŁADY 2012
Wykład II Kodowanie z rachunkiem podziałów
Model regresji - kodowanie quasi-eksperymentalne, II rok, Medotologia badań psychologicznych, wykład
Z Wykład 24.02.2008, Zajęcia, II semestr 2008, Teoria informacji i kodowania
Wykład XIV- Układy asynchroniczn e kodowanie
Z Wykład 30.03.2008, Zajęcia, II semestr 2008, Teoria informacji i kodowania
Zastosowanie metod kodowania w programach graficznych, Nauka, Studia, Wykłady, Grafika komputerowa
Wykład VII Przykłady kodowania automatów asynchronicznycvh
Kodowanie zbior pytan wykład
Wykład VI Kodowanie automatów asynchronicznych
02 wykład dla pedagogiki akt mowy, zdanie performatywne

więcej podobnych podstron