Wpływ typu rejestratora na rozmieszczenie formatów sygnału mowy

background image

Rozwój myœli technicznej w dzie-

dzinie nagrywania i odtwarzania
dŸwiêku z wykorzystaniem noœników
magnetycznych, zapocz¹tkowany
przez Valdemara Poulsena ponad sto
lat temu [1], by³ jedn¹ z przes³anek
powstania pó³ wieku póŸniej dzia³u
kryminalistyki o nazwie „fonoskopia”
(³ac. fono – dŸwiêk, skopeo – pa-
trzeæ). Przedmiotem badañ fonosko-
pijnych s¹ dzisiaj analizy wszelkich
zapisów sygna³ów akustycznych bez
wzglêdu na typ noœnika i rejestratora.

Utworzenie pierwszej w Polsce

placówki fonoskopii niemal zbieg³o
siê w czasie ze skonstruowaniem
w 1963 r. przez firmê Philips pierwo-
wzoru kasety magnetofonowej typu
Compact [4]. By³ to krok milowy
w upowszechnianiu rejestracji ma-
gnetycznej dŸwiêku, który przez lata
stanowi³ najbardziej popularny no-
œnik, obecnie wypierany przez gene-
racjê cyfrow¹.

Zarówno w przypadku techniki

analogowej, jak i cyfrowej rynek za-
akceptowa³ ca³y szereg noœników,
pocz¹wszy od wspomnianej kasety
typu Compact, przez mikrokasetê
(ró¿nych formatów, zale¿nie od pro-
ducenta), liczne typy i standardy ka-
set wideo rejestruj¹cych œcie¿kê
dŸwiêkow¹, do taœm DAT, dyktafo-
nów cyfrowych z wbudowanymi lub
wymiennymi pamiêciami pó³prze-
wodnikowymi flash, komputerowych
dysków twardych itd. Przedmiotem
zleconych badañ fonoskopijnych mo-
g¹ byæ nagrania dokonane na
wszystkich typach dostêpnych noœni-
ków dŸwiêku. W zakres takich badañ
najczêœciej wchodzi spisanie treœci
rozmowy dowodowej, badanie auten-
tycznoœci nagrania i identyfikacja
mówców.

Jednym z etapów identyfikacji

mówców jest analiza rozmieszczenia

formantów w widmie sygna³u mowy.
Ich uk³ad jest bowiem zale¿ny m.in.
od anatomicznego ukszta³towania
struktur zaanga¿owanych w mówie-
nie [3]. Silna korelacja rozmieszcze-
nia formantów w wypowiedziach do-
wodowych i porównawczych to jedno
z kryteriów (przy identyfikacji mówcy
oprócz analizy formantowej przepro-
wadza siê tak¿e analizê struktury jê-
zykowej wypowiedzi), pozwalaj¹ce
na sformu³owanie wniosku, ¿e auto-
rem obydwu porównywanych wypo-
wiedzi jest ten sam mówca. W prak-
tycznych zastosowaniach analizy for-
mantowej korelacja ta nigdy jednak
nie osi¹ga wartoœci zupe³nej (wspó³-
czynnik korelacji r=1). Wp³ywa na ni¹
bowiem szereg czynników, takich jak
subtelne ró¿nice pomiêdzy poszcze-
gólnymi realizacjami s³ownymi tych
samych ci¹gów alofonów, ró¿nica ja-
koœci nagrania dowodowego i porów-
nawczego czy b³¹d
pomiaru [5]. W prak-
tyce badañ fonosko-
pijnych do utrwalenia
wypowiedzi porów-
nawczych wykorzy-
stuje siê profesjonal-
ne urz¹dzenia reje-
struj¹ce mowê, po-
nadto czynnoϾ ta
najczêœciej odbywa
siê w

warunkach

zbli¿onych do studyj-
nych. Zapisy dowo-
dowe realizowane s¹
z u¿yciem ró¿nych
typów rejestratorów
analogowych i cyfro-
wych, przy czym wiêkszoœæ rejestra-
torów cyfrowych wykorzystuje zjawi-
sko kompresji, w tym tak¿e tzw. kom-
presji stratnej (w celu wyd³u¿enia
czasu nagrywania), która w zale¿no-
œci od zastosowanego stopnia wp³y-

wa na jakoœæ utrwalanego sygna³u
mowy. Powsta³a zatem koniecznoœæ
rozstrzygniêcia w¹tpliwoœci, czy sto-
sowanie ró¿nych rejestratorów ma
wp³yw na rozmieszczenie formantów
w widmie sygna³u dowodowego i po-
równawczego. Celem wyjaœnienia ni-
niejszego problemu przeprowadzono
stosowny eksperyment w warunkach
izolacji akustycznej.

Materia³ i metody

Materia³ do badañ stanowi³y wy-

powiedzi mê¿czyzny, utrwalane rów-
noczeœnie przez piêæ rejestratorów.
Dobór warunkowany by³ chêci¹ prze-
œledzenia ewentualnych zmian roz-
k³adu formantów – w odniesieniu do
zapisu analogowego – przy ró¿nych
typach rejestratorów cyfrowych. Wy-
korzystano:

Analogowy magnetofon repor-

terski firmy Marantz, model CP 430;
prêdkoœæ przesuwu taœmy – 4,75 cm/s,
taœmê kompaktow¹ firmy TDK typu
D60. Do urz¹dzenia pod³¹czono dwa
mikrofony pojemnoœciowe firmy

PROBLEMY KRYMINALISTYKI 253/06

72

Z PRAKTYKI

Wp³yw typu rejestratora
na rozmieszczenie formantów sygna³u mowy

Ryc. 1. Rozmieszczenie mikrofonów urz¹dzeñ rejestruj¹cych
Fig. 1. Placement of microphones connected to recording devices

background image

Schoeps, symbol CMC6U (P12-48),
z koñcówk¹ MK-4 o charakterystyce
kardioidalnej. Para rozstawiona
(ustawienie A–B). Wykorzystano
przedwzmacniacz firmy SONOSAX
typu SX-M2.

Dysk twardy komputera. Zapis

na dysku odbywa³ siê w nastepuj¹cy
sposób: sygna³ z mikrofonu stoj¹ce-
go firmy Creative (bez oznaczeñ,
charakterystyka kierunkowa) poprzez
zewnêtrzn¹ kartê dŸwiêkow¹ (USB)
Exdigy Sound Blaster firmy Creative
transmitowany by³ z u¿yciem sieci in-
ternetowej i komputerowego oprogra-
mowania o nazwie „Skype”, s³u¿¹ce-
go do internetowych rozmów telefo-
nicznych w standardzie VoIP (ang.
Voice over Internet Protocol). Na-
stêpnie na drugim zestawie kompute-
rowym, poprzez wewnêtrzn¹ kartê
AC97 firmy ASUS, rejestrowano
sygna³ zwrotny, wykorzystuj¹c
oprogramowanie Cool Edit Pro
w wersji 2.0 firmy Syntrillium.

Cyfrowy dyktafon firmy Olym-

pus, model DW-90, tryb SP (Nor-
mal), czêstotliwoœæ próbkowania
11 kHz. Urz¹dzenie rejestruje
z kompresj¹ bezstratn¹ w postaci
plików WAVE.

Portadisc (MiniDisc) firmy

HHB, model MDP500. Urz¹dzenie
zapisuje dŸwiêk na noœnikach mi-
nidisc w postaci PCM, czêstotli-
woœæ próbkowania – 44,1 kHz, roz-
dzielczoœæ 16 bitów, z wykorzysta-
niem kodu ATRAC 4.5. Jest to sys-
tem stratnej kompresji dŸwiêku,
w którym dane ulegaj¹ redukcji
w proporcji 5:1 z wykorzystaniem fi-
zjologicznych w³asnoœci s³yszenia
(np. maskowanie tonów cichych
przez wspó³brzmi¹ce tony g³oœne
o s¹siednich czêstotliwoœciach), co
jest wykorzystywane przez liczne al-
gorytmy kompresji stratnej [2]. Do
urz¹dzenia pod³¹czono dwa mikrofo-
ny pojemnoœciowe firmy Schoeps;
pierwszy o symbolu CCM40 i charak-
terystyce kardioidalnej, a

drugi

o symbolu BLM03C i charakterystyce
dookólnej.

Telefon komórkowy firmy Sie-

mens, model SL45i (urz¹dzenie nie
by³o po³¹czone z sieci¹ telefonii ko-
mórkowej – usuniêto kartê SIM). Da-
ne audio zapisywane s¹ w pamiêci
telefonu, z w³asn¹ kompresj¹ stratn¹,
do plików w formacie .vmo.

Przebieg eksperymentu

Spiker (mê¿czyzna, 30 lat) znajdo-

wa³ siê w komorze bezechowej,
bêd¹cej w wyposa¿eniu Akademii
Górniczo-Hutniczej w Krakowie. W³a-
snoœci komory: objêtoœæ 60 m

3

, po-

ziom ciœnienia akustycznego (SPL)
ok. 16 dB w charakterystyce A. Przed
mówc¹, w odleg³oœci ok. 1 m od ust,
na wyœcie³anym stoliku umieszczono
mikrofony pod³¹czone do opisanych

powy¿ej rejestratorów. Ze wzglêdu
na poziom generowanych zak³óceñ
zestaw komputerowy znajdowa³ siê
na zewn¹trz pomieszczenia badaw-
czego.

Eksperyment rozpoczêto od od-

czytania samog³osek w kolejnoœci: a,
e, y, o, u, i. Nastêpnie mówca wypo-
wiedzia³ wczeœniej dobrane s³owa
i zdania: „mama”, „by³em”, „borsuk”,
„kino”, „umizgi”, „wymyty”, „bolo”,
„bergen”, „lufa”, „gaderypoluki” oraz
„Jaka ³adna dziœ pogoda”, „Du¿y dom
sta³ daleko”, „Muzyka buduje harmo-

nijny ³ad”. W celu eliminacji przypad-
kowych b³êdów jêzykowych, samo-
g³oski i kwestie zdaniowe powtórzo-
no trzykrotnie. Zgromadzony materia³
dŸwiêkowy zosta³ nastêpnie zarchi-
wizowany na dysku twardym kompu-
tera w postaci plików .wav z kodowa-
niem Windows PCM, o czêstotliwoœci
próbkowania 44,1 kHz i rozdzielczo-
œci 16 bitów.

Kolejnym etapem eksperymentu

by³a analiza widmowa dla wszystkich
nagrañ pod k¹tem wyznaczenia po³o-
¿enia poszczególnych formantów
w odpowiadaj¹cych sobie alofonach.
Na wstêpie, z wykorzystaniem kom-
puterowego oprogramowania Cool
Edit Pro w wersji 2.1. firmy Syntril-
lium, przeprowadzono analizê spek-
traln¹ struktury zarejestrowanego sy-

gna³u. Badanie wyko-
nano na tym samym
dla wszystkich próbek
odcinku czasowym,
zawieraj¹cym ciszê.
Nastêpnie przyst¹pio-
no do pomiarów sy-
gna³u mowy. Przepro-
wadzono je dwuetapo-
wo. Najpierw za pomo-
c¹ komputerowego
oprogramowania Praat
(wersja 4.2.04) zosta³y
zmierzone wartoœci
formantów dla poje-
dynczych samog³osek
oraz dla samog³osek
w otoczeniu fonetycz-
nym. Dobór i wartoœci

po³o¿enia formantów realizowano
tzw. sposobem rêcznym. Drugim eta-
pem by³a analiza spektralna sygna³u,
a do jej przeprowadzenia wykorzy-
stano wy¿ej opisane oprogramowa-
nie Cool Edit Pro (ustawienia: FFT-
16384, okno Hanninga). W tej czêœci
eksperymentu zliczano maksima am-
plitud zaznaczone uprzednio w tych
samych miejscach po³o¿enia samo-
g³osek i o tej samej d³ugoœci czaso-
wej dla wszystkich analizowanych
próbek. Uzyskane wyniki badañ ze-
stawiono w formie tabelarycznej i na

PROBLEMY KRYMINALISTYKI 253/06

73

Z PRAKTYKI

Ryc. 2. Widok pomieszczenia badawczego – komory bezechowej
Fig. 2. Examination room

background image

ich podstawie przeprowadzono anali-
zê.

Wyniki i dyskusja

Analiza korelacji po³o¿enia for-

mantów zosta³a przeprowadzona
w odniesieniu do zapisu analogowe-
go, uzyskanego z u¿yciem magneto-
fonu firmy Marantz, model CP 430.
Prezentowane poni¿ej wykresy kore-
lacji to odniesienie uzyskanych wyni-
ków dla nagrañ cyfrowych do pomia-
rów rozk³adu formantów w zapisie
analogowym.

Zaprezentowano równie¿ spektro-

gramy przedstawiaj¹ce rozk³ad ener-
gii w tej samej wypowiedzi, utrwalo-
nej z wykorzystaniem szeœciu torów
transmisji.

W wyniku analizy po³o¿enia for-

mantów ka¿dorazowo uzyskano bar-
dzo wysoki, zbli¿ony do 1, wspó³-
czynnik korelacji. Ma to istotny wp³yw
na praktykê fonoskopijn¹, gdy¿ wyko-
rzystanie tak ró¿nych urz¹dzeñ reje-
struj¹cych nie wprowadzi³o istotnych
ró¿nic w rozk³adzie maksimów lokal-
nych w

widmie sygna³u mowy,

uwzglêdnianym w procesie identyfi-
kacji mówców. Dla bieg³ych i techni-
ków kryminalistyki konkluzja ta ozna-
cza, ¿e do utrwalenia wypowiedzi po-
równawczych nie jest wymagane
u¿ycie takiego samego rejestratora
jak dowodowy. Zakres przeprowa-
dzonego eksperymentu nie uprawnia
do wnioskowania o wp³ywie na po³o-
¿enie formantów transmisji telefo-
nicznej czy innych nietestowanych
urz¹dzeñ.

Odwo³anie siê do praktyki fono-

skopijnej pozwala dostrzec, ¿e uzy-
skana wysoka korelacja po³o¿enia
formantów w obrêbie rejestratorów
u¿ytych do eksperymentu jest silniej-
sza ni¿ w realiach kryminalistycz-
nych. W nagraniach dowodowych do-
datkowo pojawiaj¹ siê bowiem czyn-
niki, które nie wyst¹pi³y w ekspery-
mencie, jak np. odmienny stan emo-
cjonalny mówcy w trakcie wypowie-
dzi dowodowych i porównawczych,

PROBLEMY KRYMINALISTYKI 253/06

74

Z PRAKTYKI

Ryc. 3. Spektrogram wypowiedzi testowej utrwalonej z u¿yciem rejestratora Marantz
Fig. 3. Spectrogram of test utterance recorded with Marantz device

0

500

1000

1500

2000

2500

3000

3500

4000

4500

0

1000

2000

3000

4000

minidisc-dook

marantz

Ryc. 4. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów Marantz i portadisc (mikrofon
kardioidalny). Poni¿ej spektrogram wypowiedzi testowej utrwalonej z u¿yciem rejestratora portadisc (mi-
krofon kardioidalny).
Fig. 4. Correlation of utterances recorded with Marantz devices and portadisc (cordioidal microphone).
Below: spectrogram of test utterance recorded with portadisc (cardioidal microphone)

Ryc. 5. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów Marantz i portadisc (mikrofon
dookólny). Poni¿ej spektrogram wypowiedzi testowej utrwalonej z u¿yciem rejestratora portadisc (mikro-
fon dookólny).
Fig. 5. Correlation of utterances recorded with Marantz devices and portadisc (surround microphone).
Below: spectrogram of test utterance recorded with portadisc (surround microphone)

r=9997

r=9996

background image

nie zawsze pe³na zgodnoœæ ci¹gów
alofonów w badanych samog³o-
skach.

Odrêbne zagadnienie stanowi

b³¹d pomiaru po³o¿enia formantów.
Nale¿y przyj¹æ, ¿e jest to jeden
z czynników, który bez wzglêdu na

sposób rejestracji
i dobór próbek za-
wsze wp³ywa na
os³abienie korela-
cji rozk³adu for-
mantów, tak ¿e
nie jest ona rów-
na 1.

Wnioski

Na podstawie

p r z e p r o w a d z o -
nych badañ sfor-
mu³owano nastê-
puj¹ce wnioski:

– sposób zapi-

su rejestratorów
cyfrowych u¿y-
tych w ekspery-
mencie nie wp³y-
wa w istotny spo-
sób na rozmiesz-

czenie formantów w widmie sygna³u
mowy;

– identyfikacja mówców w oparciu

o analizê formantow¹ nie wymaga
wiernego odwzorowania specyfiki za-
pisu dowodowego w nagraniu porów-
nawczym;

– uogólnienie uzyskanych wyni-

ków na nagrania utrwalone z wyko-
rzystaniem transmisji telefonicznej
wymaga przeprowadzenia kolejnego
eksperymentu.

Grzegorz Œlusarczyk

Jacek Rzeszotarski

Tadeusz Sikora

Jacek Wierzbicki

zdj.: autorzy

BIBLIOGRAFIA

1. Blair Benson K.: Audio Engine-

ering Handbook, McGraw-Hill Book Com-
pany, 1988.

2. Haines R.: Cyfrowe przetwarzanie

dŸwiêku, Wydawnictwo MIKOM, Warsza-
wa 2002.

3. Jassem W.: Podstawy fonetyki aku-

stycznej, Pañstwowe Wydawnictwo Na-
ukowe, Warszawa 1973.

4. Kominek M.: Zaczê³o siê od fono-

grafu, Polskie Wydawnictwo Muzyczne,
Kraków 1986.

5. Rzeszotarski J., Witkowska-Pa-

wlak W.: Identyfikacja mówców w obrêbie
materia³u dowodowego, „Problemy Kry-
minalistyki” 2004, nr 246, s. 15–18.

PROBLEMY KRYMINALISTYKI 253/06

75

Z PRAKTYKI

0

500

1000

1500

2000

2500

3000

3500

4000

4500

0

1000

2000

3000

4000

olympus

marantz

0

500

1000

1500

2000

2500

3000

3500

4000

0

1000

2000

3000

4000

voip

marantz

0

500

1000

1500

2000

2500

3000

3500

4000

0

1000

2000

3000

4000

siemens

marantz

Ryc. 7. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów
Marantz i Siemens. Poni¿ej spektrogram wypowiedzi testowej utrwalonej
z u¿yciem rejestratora Siemens.
Fig. 7. Correlation of utterances recorded with Marantz and Siemens
devices. Below: spectrogram of test utterance recorded with Siemens
recorder

Ryc. 6. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów
Marantz i Olympus. Poni¿ej spektrogram wypowiedzi testowej utrwalonej
z u¿yciem rejestratora Olympus.
Fig. 6. Correlation of utterances recorded with Marantz and Siemens
devices. Below: spectrogram of test utterance recorded with Olympus
recorded

Ryc. 8. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów
Marantz i VoIP. Poni¿ej spektrogram wypowiedzi testowej utrwalonej z u¿y-
ciem rejestratora VoIP.
Fig. 8. Correlation of utterances recorded with Marantz and VolP devices.
Below: spectrogram of test utterance recorded with VolP recorder

r=9994

r=9993

r=9995


Wyszukiwarka

Podobne podstrony:
Wpływ podłoża na rozmieszczenie?ntosu
WPŁYW USZKODZENIA SŁUCHU NA ROZUMIENIE I ROZWÓJ MOWY
Wpływ podłoża na rozmieszczenie?ntosu
Wpływ hydrolizatów sojowych na zmiany zawartości cholesterolu i produktów jego utleniania w kiełbasi
Wpływ karmienia piersią na rozwój mowy dzieci
Hortis Dzierzbicka M , Komorowska A (2005), Wpływ warunków anatomicznych na rehabilitację mowy dziec
Wpływ promieniowania jonizującego na materiał biologiczny
Wpływ pyłów i promieniowania na uszkodzenie j ustenj(2)
Wpływ stylów kierowania na motywację pracowników
Lab5 Analiza sygnalu mowy Lab5 Nieznany
Druk podania o rejestrację na semestr letni 2010-2011, Nauka, budownictwo, żelbet EC przykłądy
Wpływ otoczenia społecznego na rozwój jednostki, Psychologia
WPŁYW KWAŚNYCH OPADÓW NA ROZWÓJ ORGANIZMÓW
tariov,podstawy transmicji?nych,Przetwarzanie sygnałów mowy
Wpływ promieniowania jądrowego na komórki żywe
Podanie 5 rejestracja na sem z brakiem studia stacjonarne
Negatywny wpływ doświadczeń z dzieciństwa na funkcjonowanie DDA
Wpływ wysiłku fizycznego na organizm
26.Wpływ realizmu socjalistycznego na twórczość i życie literackie w Polsce, Filologia polska, wiedz

więcej podobnych podstron