PODSTAWY SŁYSZENIA I PERCEPCJA DŻWIEKU PYTANIA DO ZALICZENIA I ODPOWIEDZI

background image

PODSTAWY SŁYSZENIA I PERCEPCJA DŹWIĘKU

(Pytania do zaliczenia)



BUDOWA UKŁADU SŁUCHOWEGO

1. Jakie są podstawowe części obwodowego (peryferyjnego) układu słuchowego?

Peryferyjny układ słuchowy składa się z ucha umownie podzielonego na ucho zewnętrzne,
środkowe i wewnętrzne oraz nerwu ślimakowego.


2. Jaką rolę pełni małżowina uszna?

Małżowina uszna jest nieregularnym, wydłużonym fałdem skóry, którego długość jest prawie
dwukrotnie większa od szerokości. Małżowina spełnia ważną rolę przy ocenie kierunku, z
którego dochodzą fale akustyczne, czyli przy ocenie położenia źródła dźwięku. U niektórych
zwierząt jest to część ruchoma. Jej kształt pomaga również odbierać fale dźwiękowe i
kierować je do przewodu słuchowego oraz podbija częstotliwości wokół 5 kHz.


3. Co to jest HRTF (Head Related Transfer Function)?

HRTF zwana inaczej charakterystyką przenoszenia głowy jest to funkcja przenoszenia
związana z głową Pojedynczy HRTF składa się z dwóch filtrów, po jednym dla każdego
ucha, które zawierają wszystkie informacje o dźwięku (np. IID, ITD) istotne dla
słuchającego. Filtry zmieniają się w zależności od miejsca, z którego dochodzą dźwięki do
słuchającego. Kompletny HRTF zawiera zestaw wielu filtrów, które opisują sferyczne
środowisko dźwiękowe - 360 stopni we wszystkich kierunkach.
Jest to również zbiór odpowiedzi impulsowych u wejścia do kanału słuchowego zmierzone
dla sygnałów z różnych punktów przestrzeni. Te dane pozwalają tak modelować dźwięk w
słuchawkach, aby możliwa była jego eksternalizacja


4. Podać cechy charakterystyczne przebiegu transmitancji zewnętrznego przewodu

słuchowego.

Przewód słuchowy zewnętrzny stanowi swego rodzaju układ rezonansowy w kształcie rurki o
zmiennej szerokości i kształcie. Powyżej częstotliwości 1000Hz pojawiają się wyraźne
maksima rezonansowe w przebiegach charakterystyk częstotliwościowych przewodu
słuchowego. Najwyraźniejsze z nich przypada na częstotliwość ok. 2,6 kHz (ok. 12dB).
Charakterystyki częstotliwościowe nie wykazują pełnej symetrii dla położeń źródła przód –
tył. Charakterystyki są bardziej złożone, gdy sygnały akustyczne prezentowane są za pomocą
słuchawek.


5. Jaką rolę pełni ucho środkowe?

Ucho środkowe pełni następujące funkcje:

- poprzez drgania bębenka dopasowuje impedancję powietrza w przewodzie słuchowym i

impedancję płynu znajdującego się w ślimaku,

background image

- stymuluje okienko owalne,
- wyrównuje ciśnienie między uchem wewnętrznym a przewodem zewnętrznym.
- posiada mechanizmy ochrony przed nadmiernym hałasom.


6. Co to jest odruch strzemiączkowy?

Odruch strzemiączkowy (inaczej refleks ucha środkowego) jest to efekt obronny przed
dźwiękami o zbyt dużym natężeniu. Występuje on symetrycznie w obu uszach i polega na
tym, że pierwszy z mięśni napina błonę bębenkową i wciąga ją w kierunku jamy bębenkowej,
co znacznie ogranicza jej wychylenia, a drugi mięsień zmienia kierunek drgań podstawy
strzemiączka. Odruch ten włącza się z pewnym opóźnieniem (ok. 10ms), więc jest
nieskuteczny w przypadku głośnych dźwięków impulsowych (np. wystrzały). Ciekawostką
jest, że odruch ten włącza się również bezpośrednio przed wokalizacją.


7. Wymienić podstawowe elementy budowy ucha wewnętrznego?

Ucho wewnętrzne leży w części skalistej kości skroniowej. Składa się ono z błędnika
kostnego i leżącego w nim błędnika błoniastego. Przestrzeń między błędnikiem kostnym i
błoniastym wypełnia ciecz zwana perilimfą, natomiast wewnątrz błędnika błoniastego
znajduje sie ciecz zwana endolimfą. Błędnik kostny dzieli się na przedsionek, trzy kanały
półkoliste i kanał zwinięty w spiralę zwany ślimakiem. Ślimak kończy się w miejscu zwanym
osklepkiem. W uchu wewnętrznym znajdują się również okienka owalne i okrągłe oraz
narządy związane z równowagą.


8. Na czym polega mechanizm aktywny ucha wewnętrznego?

Ślimak spełnia rolę nie tylko odbiornika i procesora energii, ale również jest miejscem
aktywnych procesów wspomagających ruch błony podstawnej. Czułość i selektywność
częstotliwościowa wynika z aktywności zewnętrznych komórek słuchowych, które są
rezonatorami o bardzo dużej dobroci i selektywnie reagują na drgania wprawiając w ruch
błonę pokrywkową. Błona oddziałuje na wewnętrzną komórkę słuchową, która odprowadza
sygnały do mózgu. Częstotliwość dźwięku związana z maksymalnym wychyleniem błony
podstawnej nazywa się częstotliwością charakterystyczną. Maksymalne wychylenie błony
zmniejsza się, jeśli błonę tę stymuluje się równocześnie tonem o częstotliwość zbliżonej do
CF. Efektu tego nie obserwuje się dla ślimaka uszkodzonego


9. W jaki sposób dokonuje się analizy widma dźwięku w uchu wewnętrznym?

Analiza widmowa dźwięku w uchu wewnętrznym oparta jest na filtracji składowych
spektralnych dźwięku złożonego. Każdemu punktowi błony podstawnej można
przyporządkować filtr pasmowoprzepustowy o określonej częstotliwości środkowej,
bezwzględnej szerokości pasma i nachyleniu zboczy. Nachylenie zboczy charakterystyki
filtru opisać można liczbą decybeli jej spadku na oktawę częstotliwości, a bezwzględną
różnicę pasma określa się jako różnicę pomiędzy dwiema częstotliwościami, dla których
różnica poziomów ciśnienia względem poziomu maksymalnego wynosi –3dB.

background image

10. Na czym polega synchronizacja impulsów neuronowych z przebiegiem czasowym

sygnału akustycznego?

Badania pokazały, że wyładowania neuronów jako odpowiedź na powtarzany sygnał
pobudzający pojawiają się najczęściej dla tej samej fazy sygnału, czyli są zsynchronizowane
z przebiegiem czasowym sygnału pobudzającego. Efekt ten występuje tylko dla
częstotliwości 4-5 kHz.



FILTR SŁUCHOWY I MASKOWANIE

11. Czym objawia się pasmowość słuchu w odniesieniu do zjawiska maskowania?

W czasie jednego z eksperymentów badano położenie progu słyszalności w funkcji
szerokości pasma szumu maskującego. Gęstość spektralna mocy maskera była stała, podczas
gdy rosła moc całkowita wraz ze wzrostem szerokości pasma częstotliwości. Badania te
pokazały, że poszerzenie pasma szumu maskującego wpływało na podwyższanie progu
słyszalności sygnału tylko do pewnej szerokości tego pasma. Aby wyjaśnić to zjawisko
przyjęto, że peryferyjny system słuchowy zachowuje się jak zespół liniowych filtrów
pasmowych o zachodzących na siebie pasmach przepuszczania i charakterystykach
przenoszenia w kształcie prostokąta. Bazą tych filtrów jest błona podstawna, której
poszczególne miejsca reagują na określone częstotliwości, każdemu więc punktowi tej błony
odpowiada określona częstotliwość środkowa filtru i określone pasmo przepuszczania.


12. Jak zmienia się głośność szumu pasmowego (zachowując jego stałą moc) przy

rozszerzaniu jego pasma w zakresie do szerokości filtru słuchowego, a następnie poza tę
szerokość?

Podczas zwiększania szerokości pasma szumu do szerokości filtru słuchowego poziom
natężenia dźwięku ustala się na pewnym poziomie. Gdy szerokość pasma szumu przekracza
szerokość pasma filtru słuchowego, głośność zwiększa się.


13. Jak zmienia się szerokość pasma filtru słuchowego w funkcji częstotliwości środkowej:

a) według pomiarów „niemieckich” tj. szerokość tzw. pasma krytycznego (critical

bandwidth)

b) według pomiarów „angielskich” tj. tzw. równoważna szerokość prostokątna filtru

ERB?

Najważniejszym parametrem charakteryzującym filtr słuchowy jest szerokość jego pasma.
Według pomiarów niemieckich rolę filtrów słuchowych pełniły pasma krytyczne, których
szerokość była zarazem szerokością pasm filtrów słuchowych. Szerokość filtrów słuchowych
można wyrażać za pomocą szerokości połówkowej określonej na wysokości –3dB poniżej
maksymalnej wartości charakterystyki przenoszenia. Analityczna postać wyrażenia
określająca wartość szerokości prostokątnej filtru słuchowego w funkcji częstotliwości
środkowej f [kHz] ma postać:

background image

a) Dla częstotliwości poniżej 700-800Hz szerokość jest stała i wynosi ok. 100Hz. Powyżej

rośnie i stanowi stałą procentową szerokość pasma (w przybliżeniu filtr tercjowy)

(wzór przybliżony),

69

,

0

2

)

4

,

1

1

(

75

25

f

ERB

Z

+

+

=

b) Szerokość filtrów zmienia się jednostajnie (podobnie jak filtry tercjowe) osiągając

szerokość do ok. 20-30 Hz dla częstotliwości równej 100Hz

)

1

37

,

4

(

7

,

24

+

=

f

ERB

GM

.

Ekwiwalentne szerokości filtrów słuchowych odbiegają od szerokości pasm krytycznych
otrzymanych przez Zwickera dla częstotliwości poniżej 500 Hz.


14. Czy filtry słuchowe mają charakterystykę niezależną od poziomu sygnału?

Nie. Wyniki badań pokazały, że kształt filtrów słuchowych w liniowej skali częstotliwości
jest dość symetryczny dla średnich poziomów ciśnienia akustycznego. Natomiast dla dużych
poziomów, kształt ten staje się niesymetryczny – po stronie niskich częstotliwości obwiednia
filtru jest mniej stroma, niż po stronie wyższych.


15. Co to są filtry Roex, Gammatone i Gammachirp?

W.w. filtry to filtry modelujące filtry słuchowe.
• Filtr Roex jest to taki filtr, który ma jeden bezwymiarowy parametr

β

r

, opisujący

szerokość pasma krytycznego. Filtr jest opisany przez specjalną funkcję eksponencjalną:

g

r

r

e

g

f

H

β

β

+

=

)

1

(

)

(

2

,

gdzie g jest znormalizowanym odchyleniem częstotliwości od częstotliwości środkowej
filtru. Jego ekwiwalentna szerokość wynosi:

r

c

f

ERB

β

4

=

.

• Charakterystyka filtrów Gammatone i Gammachirp oparta jest na tzw. funkcji gamma.

Funkcja ta ma tę zaletę, że charakteryzuje ona filtr na podstawie jego odpowiedzi
impulsowej.


16. Na czym polega zjawisko maskowania?

Maskowaniem nazywa się proces, w którym próg słyszalności dźwięku maskowanego
(sygnału) podnosi się na skutek obecności dźwięku maskującego (maskera). Wartość
podwyższenia tego progu wyraża się najczęściej w dB.


17. Jakie występują rodzaje maskowania i czym się różnią?

- całkowite – sygnał przestaje być słyszany na tle maskera,
- częściowe – obniża się głośność sygnału na tle maskera,
- równoczesne – sygnał i masker występują równocześnie w czasie,
- nierównoczesne – oba bodźce są przesunięte względem siebie w czasie:

• resztkowe (pobodźcowe) – sygnał występuje po maskerze,

background image

• wsteczne (przedbodźcowe) – masker występuje po sygnale,

- monoauralne (jednouszne) – sygnał i masker są prezentowane słuchaczowi jednousznie,
- centralne – do jednego ucha podajemy sygnał, do drugiego masker.


18. Na czym polega asymetria maskowania w funkcji częstotliwości?

Dla poziomów ciśnienia maskera większych niż 60dB SPL krzywe maskowania przestają być
symetryczne. Ich stromość po stronie wyższych częstotliwości jest znacznie mniejsza, niż
stromość po stronie niższych. Jeśli w takiej sytuacji częstotliwość środkowa jednego dźwięku
jest większa, niż częstotliwość drugiego dźwięku – to dźwięk drugi bardziej zagłusza
pierwszy, niż pierwszy zagłusza drugi.


GŁOŚNOŚĆ DŹWIĘKU

19. Jaki cechy ma przebieg absolutnego progu słyszenia i co na to wpływa?

Próg absolutny określany jest przez najmniejszą wartość poziomu ciśnienia akustycznego,
która wywołuje zaledwie spostrzegalne wrażenie słuchowe. Próg ten pokazuje, że czułość
słuchu jest największa (poziom ciśnienia akustycznego ma wartość najmniejszą) w zakresie
częstotliwości średnich (1000-4000Hz) i wyraźnie maleje w pasmie częstotliwości niskich i
wysokich. Spadek czułości poniżej 1000Hz wynosi ok. 6dB na oktawę, natomiast powyżej
4000Hz – ok. 24dB/okt. Wysoka czułość słuchu w zakresie średnich częstotliwości wynika z
rezonansowego charakteru działania przewodu słuchowego oraz szczególnie efektywnego
działania ucha środkowego w tym zakresie częstotliwości.


20. Jak konstruowany jest audiogram?

Badania słuchu rozpoczyna się od pomiaru przewodnictwa powietrznego, zaczynając od ucha
lepszego. Najpierw wyznacza się wartość progu słyszalności podając ton o częstotliwości
1000Hz. Następnie zmienia się częstotliwość kolejno na 2, 4, 8, 10 i ponownie na 1 kHz
(badanie kontrolne). Dalsze badania wyznaczania kolejnych wartości progu wykonuje się dla
częstotliwości 125, 250 i 500Hz. Podobne pomiary przeprowadza się dla ucha gorzej
odbierającego dźwięki. W przypadku dużej asymetrii można do ucha przeciwległego
podawać szum maskujący. Wyznaczoną zależność poziomu ciśnienia od częstotliwości
przenosi się na wykres ubytku słuchu (różnicy między wartością zmierzoną, a wartością
średniego progu uzyskanego dla osób normalnie słyszących) od częstotliwości.


21. Co to jest zjawisko wyrównania głośności?

Zjawisko wyrównania głośności jest to niewspółmiernie silny wzrost głośności dla słuchu
uszkodzonego wraz ze wzrostem poziomu ciśnienia akustycznego, w porównaniu ze
wzrostem głośności dla słuchu normalnego. Można wyróżnić zjawisko wyrównania głośności
całkowite, częściowe i odwrotne.



background image

22. Co to jest czasowe przesunięcie progu i kiedy występuje?

Czasowe przesunięcie progu występuje na skutek zmęczenia słuchowego, powstającym pod
wpływem działania silnych bodźców dźwiękowych. Zjawisko zmęczenia ustępuje dopiero po
dłuższym czasie (nawet do kilku dni) od chwili zaprzestania stymulacji.


23. Podać psychofizyczne prawo Webera-Fechnera i jego związek ze skalą decybeli?

Odbierana wartość wrażenia jest logarytmiczną funkcją natężenia bodźca fizycznego:

b

I

a

Wr

+

= ln

, gdzie Wr – wrażenie, I – natężenie bodźca, zaś a i b to stałe. Z prawem tym

wiąże się w ogólności dyskryminacja wrażenia sensorycznego. W efekcie prawa Webera-
Fechnera stosowane są logarytmiczne skale do charakterystyki zjawisk fizycznych, które
pierwotnie opierały się na subiektywnym wrażeniu ich wartości (np. poziom natężenia
dźwięku w dB).


24. Co to są izofony i jak się je tworzy?

Izofony są to krzywe jednakowego poziomu głośności. Każda z krzywych przyporządkowana
jest określonemu poziomowi głośności w fonach, przy którym tony o różnych
częstotliwościach mają taką głośność, jak ton wzorcowy o częstotliwości 1000Hz. Krzywe
tworzy się dokonując pomiaru poziomu ciśnienia akustycznego tonów o różnych
częstotliwościach zrównanych pod względem głośności z tonem wzorcowym. Aby otrzymać
rodzinę izofonów, należy przeprowadzić badanie dla różnych poziomów głośności.


25. Na czym polega wyrażenie głośności w sonach, czym skala sonów różni się od skali

fonów?

Son jest to jednostka głośności tonu o częstotliwości 1000Hz i poziomie ciśnienia 40dB SPL.
Wyrażanie głośności w sonach polega na ilościowej zależności głośności od jego natężenia.
Dźwięki o danej liczbie fonów wywołują to samo wrażenie głośności, podczas gdy skala
sonów wiąże liczbowo głośność z poziomem natężenia dźwięku.


26. Co to są częstotliwościowe krzywe korekcyjne „A” i „C” i dlaczego stosuje się w

pomiarach akustycznych?

Krzywa korekcyjna A stanowi przybliżenie odwróconej krzywej izofonicznej 30 fonów,
dzięki czemu ograniczony jest wpływ składowych o niskich częstotliwościach na wynik
pomiaru. Krzywa B stosowana jest przy pomiarach średnich poziomów ciśnienia
akustycznego, ma jednak niewielkie zastosowanie. Krzywa C jest prawie płaska w całym
zakresie częstotliwości i jest wykorzystywana przy pomiarach dużych poziomów ciśnienia.
Krzywe te stosuje się w urządzeniach elektroakustycznych, gdyż przy małych poziomach
ciśnienia (np. przy cichym odtwarzaniu dźwięków) narząd słuchu jest znacznie mniej czuły
na tony o niskich częstotliwościach, niż przy większych.




background image

27. Na czym polega i jak odbywa się sumowanie głośności w czasie?

Głośność dźwięku zależy od czasu jego trwania. Dla bardzo krótkich czasów (do 200ms),
głośność rośnie wraz ze wzrostem tego czasu. Efekt ten nazywa się sumowaniem głośności.
Sumowanie głośności można opisać formułą eksponencjalną wyznaczoną doświadczalnie:

τ

t

e

I

t

I

=

1

)

(

,

gdzie I(t) – natężenie dźwięku wymagane dla uzyskania stałej głośności,

– natężenie dla

długich czasów trwania, t – czas trwania bodźca,

τ

– stała czasowa równa 80ms. Z punktu

widzenia anatomii nie wydaje się możliwe, aby system słuchowy sumował energię sygnału –
sumowanie to odnosi się głównie do aktywności neuronów i ich wyładowań w czasie.
Niekiedy sądzi się też, że obserwowanie obniżenia progu detekcji dźwięku tłumaczy się
lepszą możliwością jego spostrzeżenia dzięki powtarzanemu w czasie przetwarzaniu.

I


28. Co to jest i ile wynosi próg różnicy głośności (różnicy natężenia). Czy jest on stały w

funkcji poziomu ciśnienia akustycznego?

Weber sformułował prawo, które głosi, że najmniejsza spostrzegalna (progowa) zmiana
natężenia dźwięku

L jest proporcjonalna do jego wypadkowego natężenia. Badania

wykazały, że dla szumów i sygnałów szerokopasmowych dla poziomów ponadprogowych
prawo to jest dość dobrze spełnione. W zakresie od 20 do 100dB próg różnicy głośności
wynosi 0,5 – 1dB. Przy progu słyszenia wielkość ta jest większa. Dla tonów obserwuje się
efekt zwany odstępstwem od prawa Webera.

L maleje, a prosta ma współczynnik

kierunkowy ok. 0,9. Próg wynosi 1,5dB dla 20 dB SL, 0,7dB dla 40dB SL, itd.



PERCEPCJA ZMIAN CZASOWYCH

29. Jakie są graniczne (najmniejsze) progi postrzegania zmian parametrów czasowych

sygnałów, w sytuacji gdy:
a) przy zmianach czasowym pojawiają się różnice w widmie mocy sygnałów?

Jeśli przy zmianie parametrów czasowych zachodzą zmiany w widmie sygnału, to
rozdzielczość czasowa sięga kilkudziesięciu mikrosekund.
Łatwiej jest spostrzegać asynchroniczność w procesie narastania (próg detekcji wynosi
ok. 1ms), niż w procesie zanikania składowych dźwięku (próg był 3-10 razy mniejszy).

b) przy zmianach czasowych nie ma zmian widma mocy sygnałów?

Przy założeniu równości poziomów odczucia dwóch impulsów szumowych próg detekcji
przerwy czasowej między nimi wynosi ok. 3ms. Wartość tego progu jest większa dla
poziomów odczucia poniżej 30dB SL. W badaniach kolejności czasowej kolejność pary
impulsów o tym samym widmie mocy była praktycznie niemożliwa do ustalenia gdy
całkowity czas trwania bodźców osiągał wartość mniejszą niż 2ms.

background image

30. Co to jest funkcja przeniesienia modulacji (TMTF) i jak przebiega?

Funkcja przeniesienia modulacji charakteryzuje zdolność systemu słuchowego do percepcji
zmian amplitudowych bodźca, dla różnych prędkości tych zmian. Funkcja jest w przybliżeniu
stała dla częstotliwości modulacji do ok. 40Hz. Jednakże, powyżej tej częstotliwości detekcja
modulacji amplitudowej maleje z prędkością ok. 3dB/oktawę, aż do częstotliwości 1 kHz,
powyżej której nie jest słyszana.


31. Czy próg postrzegania zmian czasowych zależy od szerokości pasma sygnału?

Dane pokazują, że próg detekcji przerwy czasowej zmienia się w przybliżeniu odwrotnie
proporcjonalnie do pierwiastka kwadratowego z szerokości pasma częstotliwości bodźców.
Natomiast rozróżnienie czasu trwania bodźców nie zależy od szerokości ich pasma
częstotliwości.



32. Czym tłumaczy się ograniczoną rozdzielczość czasową układu słuchowego?

Ograniczenie rozdzielczości czasowej wiąże się z ograniczonym przetwarzaniem sygnału na
poziomie peryferyjnym bądź też centralnym. Na poziomie peryferyjnym wynika między
innymi z filtrującego działania błony podstawnej i występuje głównie w zakresie niskich
częstotliwości. Ograniczenie rozdzielczości na poziomie centralnym wynika z ograniczeń
przetwarzania informacji słuchowej na drodze powyżej nerwu słuchowego, aż do mózgu.



NIELINIOWOŚĆ SŁUCHU

33. Jakie rodzaje produktów nieliniowości, czyli tzw. tonów kombinacyjnych, występują w

układzie słuchowym?

Tony typu:
- f

2

f

1

– ton różnicowy

- (n + 1)f

1

nf

2

, w tym zwłaszcza 2f

1

f

2


34. Jakie są typowe poziomy tonu różnicowego?

Rodzaj i poziomy tonu kombinacyjnego zależą od stosunku częstotliwości tonów
pierwotnych do ich poziomu. Dla tonu różnicowego:

Poziom t. różnicowego L

r

poziom t. pierwotnych L

1,2

f

1

f

2

20 dB

80 dB

1000 Hz

1400 Hz

poziom progowy

50 – 60dB

700 – 5000 Hz f

1

+ 100, 200, 400 Hz

poziom progowy

30 dB

800 Hz

1500 Hz

30 dB

60 dB

300 – 900 Hz 1,3 f

1

background image

35. Jakie są poziomy tonu kombinacyjnego 2f

1

-f

2

?

Rodzaj i poziomy tonu kombinacyjnego zależą od stosunku częstotliwości tonów
pierwotnych do ich poziomu. Dla tonu 2f

1

f

2

:

Poziom t. różnicowego L

r

poziom t. pierwotnych L

1,2

f

1

f

2

/f

1

-15 – -20 dB

20 – 80 dB

250 - 8000 Hz 1,1

poziom progowy

1,4 – 1,7


36. W jakim przeciętnie zakresie częstotliwości tonów pierwotnych występują zauważalne

tony kombinacyjne?

Zauważalne tony występują dla częstotliwości 300 – 8000 Hz, przy stosunku f

2

/f

1

na poziomie

0 – 3.



WYSOKOŚĆ DŹWIĘKU

37. Wysokość tonów (przebiegów sinusoidalnych) – na czym polega skala meli?

Skala meli charakteryzuje się tym, że dwukrotna liczba meli odpowiada podwojeniu
wysokości tonu. W rzeczywistości można spotkać kilka skal melowych różniących się w
zależności od procedury ich wyznaczania. Umownie przyjęto, że wysokość 1000 meli ma ton
o częstotliwości 1000Hz i poziomie ciśnienia akustycznego 40dB SPL. Między skalą meli i
skalą pasm krytycznych istnieje znacznie prostsza zależność: 1 bark odpowiada 100 melom.


38. Od jakich parametrów sygnału sinusoidalnego i w jaki sposób zależy postrzegana

wysokość?

O wysokości dźwięku w głównej mierze decyduje częstotliwość jego przebiegu falowego. W
przypadku tonu częstotliwością tą jest odwrotność jego okresu, natomiast dla wielotonu
harmonicznego – o wysokości w głównej mierze decyduje częstotliwość podstawowa, choć
nie tylko. Na ocenę wysokości dźwięku wpływ mają również natężenie, czas trwania, postać
widma i obwiedni, a także obecność innych dźwięków. Wysokość dźwięku jest wielkością
subiektywną, jednak rośnie ona z częstotliwością.


39. Jak zmienia się wysokość dźwięku przy obecności drugiego tonu lub szumu dolno-

/górno-pasmowego i czym to się tłumaczy?

Jeśli szum pasmowy, bądź inny sygnał maskujący ma niższą częstotliwość niż ton
maskowany, można zaobserwować podwyższenie wysokości tego tonu o ok. 1-2%. W
przeciwnym razie, obserwuje się obniżenie wysokości w tych samych granicach. W
przypadku szumu szerokopasmowego wysokość tonu maskowanego ulega przesunięciu w
górę.

background image

40. Jakie są przeciętne wartości progów różnicy częstotliwości w różnym zakresie

częstotliwości?

W tabelce znajdują się wartości przybliżone:

Częstotliwość [Hz] Próg

∆F [Hz]

500
2000
4000
8000

1
3
10
50


41. W jaki sposób tworzona jest wysokość dźwięków złożonych widmowo, w szczególności

dźwięków o widmie harmonicznym?

Po odfiltrowaniu składowej podstawowej nie zauważa się zmiany wysokości dźwięku. Można
więc sądzić, że wysokość dźwięku zależy od wysokości jego harmonicznych. Dźwięk
złożony może zawierać nawet kilka różnych wysokości, odpowiadającym najczęściej
harmonicznym o niskich częstotliwościach. Możliwa również jest percepcja wysokości
wytworzonej w wyniku ich oddziaływania, niezwiązana bezpośrednio z żadną ze
składowych. Wysokość tworzona przez grupę harmonicznych nazywa się wysokością
rezydualną.



SŁYSZENIE DWUUSZNE

42. Co oznaczają następujące terminy: lokalizacja, lateralizacja, odsłuch monauralny,

binauralny, diotyczny i dychotyczny?

- lokalizacja – subiektywna ocena położenia źródła dźwięku w przestrzeni,
- lateralizacja – wrażenie przemieszczania się obrazu dźwiękowego wewnątrz głowy

wzdłuż linii łączącej oboje uszu,

- ods. monauralny – percepcja dźwięku dokonywana jednousznie,
- ods. binauralny – percepcja dźwięku dokonywana dwuusznie,
- ods. dychotyczny – odsłuch dwóch różnych sygnałów podawanych na oboje uszu.
- ods. diotyczny – odsłuch tego samego sygnału podawanego na oboje uszu.


43. Na czym polega „eksternalizacja” obrazu słuchowego?

Jest to efekt polegający na tym, że podczas odsłuchu binauralnego np. z głośnika, obraz
dźwiękowy tworzy się na zewnątrz głowy słuchacza.


44. Co to jest międzyuszna różnica czasu i międzyuszna różnica natężenia?

Jeśli fala akustyczna dociera do słuchacza z boku tworzy się binauralna różnica odległości, w
wyniku której natężenia i czasy dotarcia dźwięków do obojga uszu nie są takie same. Dzięki

background image

temu możliwe jest zlokalizowanie źródła dźwięku w płaszczyźnie poziomej. Różnica
natężenia spełnia rolę dominującą dla częstotliwości wysokich.

ITD:

c

D

t

=

. Zmienia się w zakresie od 0 do 690

µs.


45. Jakiego rzędu międzyuszna różnica czasu powoduje przesunięcie obrazu słuchowego

całkowicie w jedną stronę (tak, że dźwięk odbierany jest z boku)?

ok. 690 mikrosekund


46. Jakiego rzędu międzyuszna różnica natężenia powoduje przesunięcie obrazu

słuchowego całkowicie na jedną stronę (tak, że dźwięk odbierany jest z boku)?

ok. 7 – 8 dB dla częstotliwości 1kHz


47. W jakich zakresach częstotliwości o lokalizacji decyduje międzyuszna różnica czasu lub

międzyuszna różnica natężenia. Co powoduje taki przebieg tych zależności i czy takie
samo zróżnicowanie występuje przy odsłuchu słuchawkowym?

ITD (międzyuszna różnica czasu) ma większy wpływ przy niskich częstotliwościach,
IID (międzyuszna różnica natężeń) dominuje przy wysokich częstotliwościach.

Dla niskich częstotliwości (do ok. 200Hz) fale uginają się wokół głowy obserwatora, w
wyniku czego międzyuszna różnica poziomu ciśnienia nie zależy praktycznie od azymutu
źródła. Natomiast dla wysokich częstotliwości, tzn. gdy długość fali akustycznej jest
porównywalna lub mniejsza od wymiarów głowy, powstaje po jednej stronie tzw. cień
akustyczny. Wówczas wartości międzyusznej różnicy poziomu ciśnienia wyraźnie zależą od
azymutu źródła. Dla częstotliwości pośrednich tzn. ok. 1500Hz lokalizacja dźwięku jest dość
trudna i obarczona największym błędem.

W przypadku odsłuchu słuchawkowego w całym przedziale częstotliwości o lokalizacji

źródła decyduje jedynie różnica natężeń. Dzieje się tak dlatego, iż w tym systemie odsłuchu
głowa nie stanowi przeszkody dla fal, nie ulegają one dyfrakcji.


48. Co to jest tzw. stożek niepewności?

Dla ustalonej wartości międzyusznej różnicy czasu istnieje powierzchnia w kształcie stożka,
dla której wszystkie źródła dźwięku znajdujące się na niej powinny wywoływać takie same
międzyuszne różnice czasu.


49. Które z wielkości – międzyuszna różnica fazy sygnału (opóźnienie w przebiegu

czasowym) czy międzyuszne opóźnienie obwiedni sygnału mają znaczenie przy
lokalizacji?

Międzyuszna różnica fazy jest bezpośrednio związana z różnicą czasu, zatem obie mają
znaczenie przy wyznaczaniu lokalizacji źródła.

background image

50. Na czym polega dwuuszne sumowanie głośności?

Dwuuszne sumowanie głośności polega na tym, że sygnał słyszany dwuusznie wydaje się
głośniejszy


51.

Ile (ogólnie) wynoszą kątowe progi różnicowe przesunięcia źródła dźwięku w
płaszczyźnie poziomej?

Najmniejszą wartość kątową progu różnicowego przesunięcia otrzymuje się dla źródła
dźwięku zlokalizowanego na wprost obserwatora, szczególnie w zakresie częstotliwości do
1000Hz. Wówczas próg detekcji międzyusznej różnicy czasu wynosi 10

µs, co odpowiada

przesunięciu o 1

o

. Wzrost azymutu powoduje pogorszenie się rozdzielczości, zwłaszcza dla

częstotliwości ok. 2000Hz. Dla przykładu dla azymutu równego 60

o

może on wynieść nawet

30

o

.


52. Co to jest zjawisko dominacji (pierwszeństwa)?

Zgodnie z tym efektem, dla lokalizacji źródła w przestrzeni najważniejsza jest fala, która jako
pierwsza dochodzi do obserwatora. Zjawisko to występuje dla dźwięków impulsowych i
tłumaczy się tym, że pierwsza fala (bezpośrednia) wnosi najwięcej informacji o kierunku
źródła dźwięku. Aby efekt wystąpił maksymalne czasy opóźnienia poszczególnych odbić,
liczone względem dźwięku bezpośredniego nie powinny przekraczać kilkudziesięciu
milisekund. Poziom ciśnienia akustycznego dźwięku odbitego względem dźwięku
bezpośredniego nie powinien przekraczać wartości 10dB.


53. W jakim zakresie opóźnień sygnału występuje zjawisko dominacji?

W przypadku, gdy różnica czasu pomiędzy dźwiękami docierającymi do uszu jest mniejsza
niż 1ms efekt nie występuje lub jest bardzo słaby. Aby efekt wystąpił maksymalne czasy
opóźnienia poszczególnych odbić, liczone względem dźwięku bezpośredniego również nie
powinny przekraczać kilkudziesięciu milisekund.


54. Na czym polega odmaskowanie dwuuszne (BMLD)?

Jest to odmaskowanie wynikające z dochodzenia do obojga uszu różnych sygnałów. Efekt ten
powstaje wtedy, gdy międzyuszne różnice parametrów fizycznych dla sygnału lub maskera są
różne. Efekt ten powoduje w pewnych przypadkach obniżenie progu detekcji sygnału
maskowanego.


55. Podać typowe wartości odmaskowania dwuusznego.

T(x/y) – odmaskowanie sygnału x maskowanego przez y przy różnej prezentacji dwuusznej:
T(x/y) wartość odmaskowania
T(M/M) 0

dB

T(M/0) 6

dB

T(0/0) 0

dB

background image

T(π/0) 12

dB

T(π/π) 0

dB

M- monauralnie
0 – binauralnie w fazie
π – binauralnie w przeciwfazie

KOMPRESJA DŹWIĘKU

56. W jaki sposób wyznacza się profil maskowania w modelu psychoakustycznym przy

stratnej kompresji dźwięku?

Profil maskowania wyznacza się przez zsumowanie krzywej progu słyszenia oraz krzywych
maskowania przez wyróżniające się tony i pasma szumowe. Zapisaniu podlega wyłącznie to
co leży powyżej otrzymanej sumy.



POMIARY SŁUCHU

57. Na czym polegają metody: granic, dostrajania i stałego bodźca?

• Metoda stałych bodźców wykorzystywana jest do wyznaczania progu absolutnego lub

progu różnicy pewnej wielkości fizycznej. W pierwszym przypadku polega ona na
wielokrotnym prezentowaniu bodźców różniących się między sobą w zakresie pewnego
przedziału. Bodźce prezentuje się słuchaczowi wielokrotnie w porządku losowym, przy
czym każdy bodziec taką samą liczbę razy (np. 100). Zadaniem słuchacza jest
odpowiedzieć na pytanie, czy słyszał bodziec w systemie tak/nie.

• Metoda granic jest mniej dokładna w porównaniu z metodą stałych bodźców, ale ma tę

zaletę, że jest mniej czasochłonna. Przy pomiarze progu absolutnego eksperymentator
prezentuje słuchaczowi ciąg bodźców w tzw. serii malejącej (rozpoczynając od natężeń
zdecydowanie powyżej progu) i rosnącej (rozpoczynając od bodźców niesłyszalnych). Po
przeprowadzeniu kilku serii na przemian uzyskuje się wypadkowy próg absolutny jako
średnią wartość progów otrzymanych dla wszystkich serii.

• Charakterystyczną cechą metody dostrajania jest to, że słuchacz sam dobiera natężenie

bodźca w czasie eksperymentu. Ponadto natężenie zmienia się w sposób ciągły. W każdej
kolejnej serii pomiarowej eksperymentator powinien zmienić początkową wartość
natężenia bodźca. Zarówno tę, jak i poprzednią metodę można stosować do wyznaczania
progu dyskryminacji natężenia. W tym wypadku dopasowując natężenie, aż do uzyskania
wrażenia zrównania ich głośności.

58. Czego dotyczy statystyczna teoria detekcji? Co reprezentuje krzywa ROC?

Teoria detekcji zakłada, że decyzje dotyczące detekcji sygnału zależą od wartości pewnej
zmiennej losowej x, której natura nie jest ściśle sprecyzowana. Zakłada się, że wartość
średnia tej zmiennej rośnie monotonicznie wraz ze wzrostem natężenia bodźca. Teoria

background image

detekcji pozwala odróżnić reakcje słuchacza wynikające z czynników czysto sensorycznych
od pozostałych.
Krzywa ROC (charakterystyka funkcjonowania odbiornika) reprezentuje zależność między
względną liczbą trafień (poprawnego wykrycia sygnału) danego słuchacza, a względną liczbą
fałszywych alarmów (wykrycia niesłyszalnego sygnału).


59. Co to jest wskaźnik detekcji d’?

d’ jest miarą wrażliwości systemu słuchowego na sygnał (miarą wykrywalności sygnału) i
wskazuje na zdolność słuchacza do odróżnienia sygnału od szumu w tym sensie, że im
zdolność jest lepsza, tym wartość d’ jest większa. Miara ma charakter obiektywny i jest
definiowana jako:

N

N

S

d

σ

µ

µ

=

'

,


gdzie

µ

S

– wartość średnia sygnału,

µ

N

– wartość średnia szumu,

σ

N

– odchylenie

standardowe szumu.


60.

Jakie typowe paradygmaty układu bodźców są stosowane w pomiarach
psychoakustycznych prowadzonych z udziałem słuchaczy?

Procedura TAK / NIE
Procedura 2AFC - Two Alternative Forced Choice
Procedura n-AFC - n Alternative Forced Choice
Procedura "same-different"


61. Na czym polegają procedury adaptacyjne stosowane w pomiarach słuchu?

Procedury adaptacyjne charakteryzują się tym, że przebieg eksperymentu zależy od
odpowiedzi słuchacza. Procedury te charakteryzują się dużą efektywnością, gdyż większość
pomiarów koncentruje się w obszarze progowym. Warunkiem ich stosowania jest spełnienie
założenia, że prawdopodobieństwo poprawnej odpowiedzi wzrasta monotonicznie wraz ze
wzrostem natężenia bodźca. Eksperyment oparty na procedurze adaptacyjnej polega na
szybkim zawężeniu przedziału zmienności ocenianej wielkości do wartości okołoprogowych.
Rozpoczyna się go od takiej wartości, dla której uzyskuje się odpowiedź poprawną. Przez
stopniowe zmniejszanie wartości tego natężenia dochodzi się do odpowiedzi niepoprawnej.
Wówczas ponownie zwiększa się wartość natężenia, aż do usłyszenia poprawnej odpowiedzi.


Document Outline


Wyszukiwarka

Podobne podstrony:
Pytania do zaliczenia ZLwSK odpowiedzi
patofizjologia pytania do zaliczenia, Wykłady
Pytania do zaliczenia przedmiotu Jaworzno,Mysłowice j
Anna Zielińska - Podstawy prawne pracy socjalnej (pytania do egzaminu), Pedagogika UW
pytania do zaliczenia, Studia, geologia
Kopia Podstawy nauki o przedsiebiorstwie turystycznym, pytania do egzaminu - licencjat HIT WSETINS
Podstawy nauki o przedsiebiorstwie turystycznym, pytania do egzaminu - licencjat HIT WSETINS
21-25, EIT, FPGA, Opracowane pytania do zaliczenia wykładu
Pytania do zaliczenia ćw 1 WL, medycyna, Patofizjologia, Pytania
Pytania do zaliczenia-Socjologia-procesow-migracyjnych, socjologia 3 rok, Socjologia migracji
mrówek, EIT, FPGA, Opracowane pytania do zaliczenia wykładu
1-16 {7}, EIT, FPGA, Opracowane pytania do zaliczenia wykładu
Pytania do zaliczenia z krwi, hematologia
31-35, EIT, FPGA, Opracowane pytania do zaliczenia wykładu
Pytania do testu z odpowiedziami uzupełnienie na dzień1 07 2006r
pytania do egzaminu odpowiedzi
NOO Ä WICZENIA PYTANIA NA ZALICZENIE+ODPOWIEDZI, Zarządzanie, Sem III, NOO
PLD - 16-20, EIT, FPGA, Opracowane pytania do zaliczenia wykładu

więcej podobnych podstron