PODSTAWY SŁYSZENIA I PERCEPCJA DŻWIEKU PYTANIA DO ZALICZENIA I ODPOWIEDZI


PODSTAWY SAYSZENIA I PERCEPCJA DyWIKU
(Pytania do zaliczenia)
BUDOWA UKAADU SAUCHOWEGO
1. Jakie są podstawowe części obwodowego (peryferyjnego) układu słuchowego?
Peryferyjny układ słuchowy składa się z ucha umownie podzielonego na ucho zewnętrzne,
środkowe i wewnętrzne oraz nerwu ślimakowego.
2. Jaką rolę pełni małżowina uszna?
Małżowina uszna jest nieregularnym, wydłużonym fałdem skóry, którego długość jest prawie
dwukrotnie większa od szerokości. Małżowina spełnia ważną rolę przy ocenie kierunku, z
którego dochodzą fale akustyczne, czyli przy ocenie położenia zródła dzwięku. U niektórych
zwierząt jest to część ruchoma. Jej kształt pomaga również odbierać fale dzwiękowe i
kierować je do przewodu słuchowego oraz podbija częstotliwości wokół 5 kHz.
3. Co to jest HRTF (Head Related Transfer Function)?
HRTF zwana inaczej charakterystyką przenoszenia głowy jest to funkcja przenoszenia
związana z głową Pojedynczy HRTF składa się z dwóch filtrów, po jednym dla każdego
ucha, które zawierają wszystkie informacje o dzwięku (np. IID, ITD) istotne dla
słuchającego. Filtry zmieniają się w zależności od miejsca, z którego dochodzą dzwięki do
słuchającego. Kompletny HRTF zawiera zestaw wielu filtrów, które opisują sferyczne
środowisko dzwiękowe - 360 stopni we wszystkich kierunkach.
Jest to również zbiór odpowiedzi impulsowych u wejścia do kanału słuchowego zmierzone
dla sygnałów z różnych punktów przestrzeni. Te dane pozwalają tak modelować dzwięk w
słuchawkach, aby możliwa była jego eksternalizacja
4. Podać cechy charakterystyczne przebiegu transmitancji zewnętrznego przewodu
słuchowego.
Przewód słuchowy zewnętrzny stanowi swego rodzaju układ rezonansowy w kształcie rurki o
zmiennej szerokości i kształcie. Powyżej częstotliwości 1000Hz pojawiają się wyrazne
maksima rezonansowe w przebiegach charakterystyk częstotliwościowych przewodu
słuchowego. Najwyrazniejsze z nich przypada na częstotliwość ok. 2,6 kHz (ok. 12dB).
Charakterystyki częstotliwościowe nie wykazują pełnej symetrii dla położeń zródła przód 
tył. Charakterystyki są bardziej złożone, gdy sygnały akustyczne prezentowane są za pomocą
słuchawek.
5. Jaką rolę pełni ucho środkowe?
Ucho środkowe pełni następujące funkcje:
- poprzez drgania bębenka dopasowuje impedancję powietrza w przewodzie słuchowym i
impedancję płynu znajdującego się w ślimaku,
- stymuluje okienko owalne,
- wyrównuje ciśnienie między uchem wewnętrznym a przewodem zewnętrznym.
- posiada mechanizmy ochrony przed nadmiernym hałasom.
6. Co to jest odruch strzemiączkowy?
Odruch strzemiączkowy (inaczej refleks ucha środkowego) jest to efekt obronny przed
dzwiękami o zbyt dużym natężeniu. Występuje on symetrycznie w obu uszach i polega na
tym, że pierwszy z mięśni napina błonę bębenkową i wciąga ją w kierunku jamy bębenkowej,
co znacznie ogranicza jej wychylenia, a drugi mięsień zmienia kierunek drgań podstawy
strzemiączka. Odruch ten włącza się z pewnym opóznieniem (ok. 10ms), więc jest
nieskuteczny w przypadku głośnych dzwięków impulsowych (np. wystrzały). Ciekawostką
jest, że odruch ten włącza się również bezpośrednio przed wokalizacją.
7. Wymienić podstawowe elementy budowy ucha wewnętrznego?
Ucho wewnętrzne leży w części skalistej kości skroniowej. Składa się ono z błędnika
kostnego i leżącego w nim błędnika błoniastego. Przestrzeń między błędnikiem kostnym i
błoniastym wypełnia ciecz zwana perilimfą, natomiast wewnątrz błędnika błoniastego
znajduje sie ciecz zwana endolimfą. Błędnik kostny dzieli się na przedsionek, trzy kanały
półkoliste i kanał zwinięty w spiralę zwany ślimakiem. Ślimak kończy się w miejscu zwanym
osklepkiem. W uchu wewnętrznym znajdują się również okienka owalne i okrągłe oraz
narządy związane z równowagą.
8. Na czym polega mechanizm aktywny ucha wewnętrznego?
Ślimak spełnia rolę nie tylko odbiornika i procesora energii, ale również jest miejscem
aktywnych procesów wspomagających ruch błony podstawnej. Czułość i selektywność
częstotliwościowa wynika z aktywności zewnętrznych komórek słuchowych, które są
rezonatorami o bardzo dużej dobroci i selektywnie reagują na drgania wprawiając w ruch
błonę pokrywkową. Błona oddziałuje na wewnętrzną komórkę słuchową, która odprowadza
sygnały do mózgu. Częstotliwość dzwięku związana z maksymalnym wychyleniem błony
podstawnej nazywa się częstotliwością charakterystyczną. Maksymalne wychylenie błony
zmniejsza się, jeśli błonę tę stymuluje się równocześnie tonem o częstotliwość zbliżonej do
CF. Efektu tego nie obserwuje się dla ślimaka uszkodzonego
9. W jaki sposób dokonuje się analizy widma dzwięku w uchu wewnętrznym?
Analiza widmowa dzwięku w uchu wewnętrznym oparta jest na filtracji składowych
spektralnych dzwięku złożonego. Każdemu punktowi błony podstawnej można
przyporządkować filtr pasmowoprzepustowy o określonej częstotliwości środkowej,
bezwzględnej szerokości pasma i nachyleniu zboczy. Nachylenie zboczy charakterystyki
filtru opisać można liczbą decybeli jej spadku na oktawę częstotliwości, a bezwzględną
różnicę pasma określa się jako różnicę pomiędzy dwiema częstotliwościami, dla których
różnica poziomów ciśnienia względem poziomu maksymalnego wynosi  3dB.
10. Na czym polega synchronizacja impulsów neuronowych z przebiegiem czasowym
sygnału akustycznego?
Badania pokazały, że wyładowania neuronów jako odpowiedz na powtarzany sygnał
pobudzający pojawiają się najczęściej dla tej samej fazy sygnału, czyli są zsynchronizowane
z przebiegiem czasowym sygnału pobudzającego. Efekt ten występuje tylko dla
częstotliwości 4-5 kHz.
FILTR SAUCHOWY I MASKOWANIE
11. Czym objawia się pasmowość słuchu w odniesieniu do zjawiska maskowania?
W czasie jednego z eksperymentów badano położenie progu słyszalności w funkcji
szerokości pasma szumu maskującego. Gęstość spektralna mocy maskera była stała, podczas
gdy rosła moc całkowita wraz ze wzrostem szerokości pasma częstotliwości. Badania te
pokazały, że poszerzenie pasma szumu maskującego wpływało na podwyższanie progu
słyszalności sygnału tylko do pewnej szerokości tego pasma. Aby wyjaśnić to zjawisko
przyjęto, że peryferyjny system słuchowy zachowuje się jak zespół liniowych filtrów
pasmowych o zachodzących na siebie pasmach przepuszczania i charakterystykach
przenoszenia w kształcie prostokąta. Bazą tych filtrów jest błona podstawna, której
poszczególne miejsca reagują na określone częstotliwości, każdemu więc punktowi tej błony
odpowiada określona częstotliwość środkowa filtru i określone pasmo przepuszczania.
12. Jak zmienia się głośność szumu pasmowego (zachowując jego stałą moc) przy
rozszerzaniu jego pasma w zakresie do szerokości filtru słuchowego, a następnie poza tę
szerokość?
Podczas zwiększania szerokości pasma szumu do szerokości filtru słuchowego poziom
natężenia dzwięku ustala się na pewnym poziomie. Gdy szerokość pasma szumu przekracza
szerokość pasma filtru słuchowego, głośność zwiększa się.
13. Jak zmienia się szerokość pasma filtru słuchowego w funkcji częstotliwości środkowej:
a) według pomiarów  niemieckich tj. szerokość tzw. pasma krytycznego (critical
bandwidth)
b) według pomiarów  angielskich tj. tzw. równoważna szerokość prostokątna filtru
ERB?
Najważniejszym parametrem charakteryzującym filtr słuchowy jest szerokość jego pasma.
Według pomiarów niemieckich rolę filtrów słuchowych pełniły pasma krytyczne, których
szerokość była zarazem szerokością pasm filtrów słuchowych. Szerokość filtrów słuchowych
można wyrażać za pomocą szerokości połówkowej określonej na wysokości  3dB poniżej
maksymalnej wartości charakterystyki przenoszenia. Analityczna postać wyrażenia
określająca wartość szerokości prostokątnej filtru słuchowego w funkcji częstotliwości
środkowej f [kHz] ma postać:
a) Dla częstotliwości poniżej 700-800Hz szerokość jest stała i wynosi ok. 100Hz. Powyżej
rośnie i stanowi stałą procentową szerokość pasma (w przybliżeniu filtr tercjowy)
2
ERBZ = 25 + 75(1+1,4 f )0,69 (wzór przybliżony),
b) Szerokość filtrów zmienia się jednostajnie (podobnie jak filtry tercjowe) osiągając
szerokość do ok. 20-30 Hz dla częstotliwości równej 100Hz
ERBGM = 24,7(4,37 f +1) .
Ekwiwalentne szerokości filtrów słuchowych odbiegają od szerokości pasm krytycznych
otrzymanych przez Zwickera dla częstotliwości poniżej 500 Hz.
14. Czy filtry słuchowe mają charakterystykę niezależną od poziomu sygnału?
Nie. Wyniki badań pokazały, że kształt filtrów słuchowych w liniowej skali częstotliwości
jest dość symetryczny dla średnich poziomów ciśnienia akustycznego. Natomiast dla dużych
poziomów, kształt ten staje się niesymetryczny  po stronie niskich częstotliwości obwiednia
filtru jest mniej stroma, niż po stronie wyższych.
15. Co to są filtry Roex, Gammatone i Gammachirp?
W.w. filtry to filtry modelujące filtry słuchowe.
" Filtr Roex jest to taki filtr, który ma jeden bezwymiarowy parametr r, opisujący
szerokość pasma krytycznego. Filtr jest opisany przez specjalną funkcję eksponencjalną:
2
r
H ( f ) = (1+ r g)e- g ,
gdzie g jest znormalizowanym odchyleniem częstotliwości od częstotliwości środkowej
filtru. Jego ekwiwalentna szerokość wynosi:
fc
ERB = 4 .
r
" Charakterystyka filtrów Gammatone i Gammachirp oparta jest na tzw. funkcji gamma.
Funkcja ta ma tę zaletę, że charakteryzuje ona filtr na podstawie jego odpowiedzi
impulsowej.
16. Na czym polega zjawisko maskowania?
Maskowaniem nazywa się proces, w którym próg słyszalności dzwięku maskowanego
(sygnału) podnosi się na skutek obecności dzwięku maskującego (maskera). Wartość
podwyższenia tego progu wyraża się najczęściej w dB.
17. Jakie występują rodzaje maskowania i czym się różnią?
- całkowite  sygnał przestaje być słyszany na tle maskera,
- częściowe  obniża się głośność sygnału na tle maskera,
- równoczesne  sygnał i masker występują równocześnie w czasie,
- nierównoczesne  oba bodzce są przesunięte względem siebie w czasie:
" resztkowe (pobodzcowe)  sygnał występuje po maskerze,
" wsteczne (przedbodzcowe)  masker występuje po sygnale,
- monoauralne (jednouszne)  sygnał i masker są prezentowane słuchaczowi jednousznie,
- centralne  do jednego ucha podajemy sygnał, do drugiego masker.
18. Na czym polega asymetria maskowania w funkcji częstotliwości?
Dla poziomów ciśnienia maskera większych niż 60dB SPL krzywe maskowania przestają być
symetryczne. Ich stromość po stronie wyższych częstotliwości jest znacznie mniejsza, niż
stromość po stronie niższych. Jeśli w takiej sytuacji częstotliwość środkowa jednego dzwięku
jest większa, niż częstotliwość drugiego dzwięku  to dzwięk drugi bardziej zagłusza
pierwszy, niż pierwszy zagłusza drugi.
GAOŚNOŚĆ DyWIKU
19. Jaki cechy ma przebieg absolutnego progu słyszenia i co na to wpływa?
Próg absolutny określany jest przez najmniejszą wartość poziomu ciśnienia akustycznego,
która wywołuje zaledwie spostrzegalne wrażenie słuchowe. Próg ten pokazuje, że czułość
słuchu jest największa (poziom ciśnienia akustycznego ma wartość najmniejszą) w zakresie
częstotliwości średnich (1000-4000Hz) i wyraznie maleje w pasmie częstotliwości niskich i
wysokich. Spadek czułości poniżej 1000Hz wynosi ok. 6dB na oktawę, natomiast powyżej
4000Hz  ok. 24dB/okt. Wysoka czułość słuchu w zakresie średnich częstotliwości wynika z
rezonansowego charakteru działania przewodu słuchowego oraz szczególnie efektywnego
działania ucha środkowego w tym zakresie częstotliwości.
20. Jak konstruowany jest audiogram?
Badania słuchu rozpoczyna się od pomiaru przewodnictwa powietrznego, zaczynając od ucha
lepszego. Najpierw wyznacza się wartość progu słyszalności podając ton o częstotliwości
1000Hz. Następnie zmienia się częstotliwość kolejno na 2, 4, 8, 10 i ponownie na 1 kHz
(badanie kontrolne). Dalsze badania wyznaczania kolejnych wartości progu wykonuje się dla
częstotliwości 125, 250 i 500Hz. Podobne pomiary przeprowadza się dla ucha gorzej
odbierającego dzwięki. W przypadku dużej asymetrii można do ucha przeciwległego
podawać szum maskujący. Wyznaczoną zależność poziomu ciśnienia od częstotliwości
przenosi się na wykres ubytku słuchu (różnicy między wartością zmierzoną, a wartością
średniego progu uzyskanego dla osób normalnie słyszących) od częstotliwości.
21. Co to jest zjawisko wyrównania głośności?
Zjawisko wyrównania głośności jest to niewspółmiernie silny wzrost głośności dla słuchu
uszkodzonego wraz ze wzrostem poziomu ciśnienia akustycznego, w porównaniu ze
wzrostem głośności dla słuchu normalnego. Można wyróżnić zjawisko wyrównania głośności
całkowite, częściowe i odwrotne.
22. Co to jest czasowe przesunięcie progu i kiedy występuje?
Czasowe przesunięcie progu występuje na skutek zmęczenia słuchowego, powstającym pod
wpływem działania silnych bodzców dzwiękowych. Zjawisko zmęczenia ustępuje dopiero po
dłuższym czasie (nawet do kilku dni) od chwili zaprzestania stymulacji.
23. Podać psychofizyczne prawo Webera-Fechnera i jego związek ze skalą decybeli?
Odbierana wartość wrażenia jest logarytmiczną funkcją natężenia bodzca fizycznego:
Wr = a ln I + b , gdzie Wr  wrażenie, I  natężenie bodzca, zaś a i b to stałe. Z prawem tym
wiąże się w ogólności dyskryminacja wrażenia sensorycznego. W efekcie prawa Webera-
Fechnera stosowane są logarytmiczne skale do charakterystyki zjawisk fizycznych, które
pierwotnie opierały się na subiektywnym wrażeniu ich wartości (np. poziom natężenia
dzwięku w dB).
24. Co to są izofony i jak się je tworzy?
Izofony są to krzywe jednakowego poziomu głośności. Każda z krzywych przyporządkowana
jest określonemu poziomowi głośności w fonach, przy którym tony o różnych
częstotliwościach mają taką głośność, jak ton wzorcowy o częstotliwości 1000Hz. Krzywe
tworzy się dokonując pomiaru poziomu ciśnienia akustycznego tonów o różnych
częstotliwościach zrównanych pod względem głośności z tonem wzorcowym. Aby otrzymać
rodzinę izofonów, należy przeprowadzić badanie dla różnych poziomów głośności.
25. Na czym polega wyrażenie głośności w sonach, czym skala sonów różni się od skali
fonów?
Son jest to jednostka głośności tonu o częstotliwości 1000Hz i poziomie ciśnienia 40dB SPL.
Wyrażanie głośności w sonach polega na ilościowej zależności głośności od jego natężenia.
Dzwięki o danej liczbie fonów wywołują to samo wrażenie głośności, podczas gdy skala
sonów wiąże liczbowo głośność z poziomem natężenia dzwięku.
26. Co to są częstotliwościowe krzywe korekcyjne  A i  C i dlaczego stosuje się w
pomiarach akustycznych?
Krzywa korekcyjna A stanowi przybliżenie odwróconej krzywej izofonicznej 30 fonów,
dzięki czemu ograniczony jest wpływ składowych o niskich częstotliwościach na wynik
pomiaru. Krzywa B stosowana jest przy pomiarach średnich poziomów ciśnienia
akustycznego, ma jednak niewielkie zastosowanie. Krzywa C jest prawie płaska w całym
zakresie częstotliwości i jest wykorzystywana przy pomiarach dużych poziomów ciśnienia.
Krzywe te stosuje się w urządzeniach elektroakustycznych, gdyż przy małych poziomach
ciśnienia (np. przy cichym odtwarzaniu dzwięków) narząd słuchu jest znacznie mniej czuły
na tony o niskich częstotliwościach, niż przy większych.
27. Na czym polega i jak odbywa się sumowanie głośności w czasie?
Głośność dzwięku zależy od czasu jego trwania. Dla bardzo krótkich czasów (do 200ms),
głośność rośnie wraz ze wzrostem tego czasu. Efekt ten nazywa się sumowaniem głośności.
Sumowanie głośności można opisać formułą eksponencjalną wyznaczoną doświadczalnie:
I"
I(t) = ,
t
1- e
gdzie I(t)  natężenie dzwięku wymagane dla uzyskania stałej głośności, I"  natężenie dla
długich czasów trwania, t  czas trwania bodzca,   stała czasowa równa 80ms. Z punktu
widzenia anatomii nie wydaje się możliwe, aby system słuchowy sumował energię sygnału 
sumowanie to odnosi się głównie do aktywności neuronów i ich wyładowań w czasie.
Niekiedy sądzi się też, że obserwowanie obniżenia progu detekcji dzwięku tłumaczy się
lepszą możliwością jego spostrzeżenia dzięki powtarzanemu w czasie przetwarzaniu.
28. Co to jest i ile wynosi próg różnicy głośności (różnicy natężenia). Czy jest on stały w
funkcji poziomu ciśnienia akustycznego?
Weber sformułował prawo, które głosi, że najmniejsza spostrzegalna (progowa) zmiana
natężenia dzwięku "L jest proporcjonalna do jego wypadkowego natężenia. Badania
wykazały, że dla szumów i sygnałów szerokopasmowych dla poziomów ponadprogowych
prawo to jest dość dobrze spełnione. W zakresie od 20 do 100dB próg różnicy głośności
wynosi 0,5  1dB. Przy progu słyszenia wielkość ta jest większa. Dla tonów obserwuje się
efekt zwany odstępstwem od prawa Webera. "L maleje, a prosta ma współczynnik
kierunkowy ok. 0,9. Próg wynosi 1,5dB dla 20 dB SL, 0,7dB dla 40dB SL, itd.
PERCEPCJA ZMIAN CZASOWYCH
29. Jakie są graniczne (najmniejsze) progi postrzegania zmian parametrów czasowych
sygnałów, w sytuacji gdy:
a) przy zmianach czasowym pojawiają się różnice w widmie mocy sygnałów?
Jeśli przy zmianie parametrów czasowych zachodzą zmiany w widmie sygnału, to
rozdzielczość czasowa sięga kilkudziesięciu mikrosekund.
Aatwiej jest spostrzegać asynchroniczność w procesie narastania (próg detekcji wynosi
ok. 1ms), niż w procesie zanikania składowych dzwięku (próg był 3-10 razy mniejszy).
b) przy zmianach czasowych nie ma zmian widma mocy sygnałów?
Przy założeniu równości poziomów odczucia dwóch impulsów szumowych próg detekcji
przerwy czasowej między nimi wynosi ok. 3ms. Wartość tego progu jest większa dla
poziomów odczucia poniżej 30dB SL. W badaniach kolejności czasowej kolejność pary
impulsów o tym samym widmie mocy była praktycznie niemożliwa do ustalenia gdy
całkowity czas trwania bodzców osiągał wartość mniejszą niż 2ms.
30. Co to jest funkcja przeniesienia modulacji (TMTF) i jak przebiega?
Funkcja przeniesienia modulacji charakteryzuje zdolność systemu słuchowego do percepcji
zmian amplitudowych bodzca, dla różnych prędkości tych zmian. Funkcja jest w przybliżeniu
stała dla częstotliwości modulacji do ok. 40Hz. Jednakże, powyżej tej częstotliwości detekcja
modulacji amplitudowej maleje z prędkością ok. 3dB/oktawę, aż do częstotliwości 1 kHz,
powyżej której nie jest słyszana.
31. Czy próg postrzegania zmian czasowych zależy od szerokości pasma sygnału?
Dane pokazują, że próg detekcji przerwy czasowej zmienia się w przybliżeniu odwrotnie
proporcjonalnie do pierwiastka kwadratowego z szerokości pasma częstotliwości bodzców.
Natomiast rozróżnienie czasu trwania bodzców nie zależy od szerokości ich pasma
częstotliwości.
32. Czym tłumaczy się ograniczoną rozdzielczość czasową układu słuchowego?
Ograniczenie rozdzielczości czasowej wiąże się z ograniczonym przetwarzaniem sygnału na
poziomie peryferyjnym bądz też centralnym. Na poziomie peryferyjnym wynika między
innymi z filtrującego działania błony podstawnej i występuje głównie w zakresie niskich
częstotliwości. Ograniczenie rozdzielczości na poziomie centralnym wynika z ograniczeń
przetwarzania informacji słuchowej na drodze powyżej nerwu słuchowego, aż do mózgu.
NIELINIOWOŚĆ SAUCHU
33. Jakie rodzaje produktów nieliniowości, czyli tzw. tonów kombinacyjnych, występują w
układzie słuchowym?
Tony typu:
- f2  f1  ton różnicowy
- (n + 1)f1  nf2, w tym zwłaszcza 2f1  f2
34. Jakie są typowe poziomy tonu różnicowego?
Rodzaj i poziomy tonu kombinacyjnego zależą od stosunku częstotliwości tonów
pierwotnych do ich poziomu. Dla tonu różnicowego:
Poziom t. różnicowego Lr poziom t. pierwotnych L1,2 f1 f2
20 dB 80 dB 1000 Hz 1400 Hz
poziom progowy 50  60dB 700  5000 Hz f1 + 100, 200, 400 Hz
poziom progowy 30 dB 800 Hz 1500 Hz
30 dB 60 dB 300  900 Hz 1,3 f1
35. Jakie są poziomy tonu kombinacyjnego 2f1-f2?
Rodzaj i poziomy tonu kombinacyjnego zależą od stosunku częstotliwości tonów
pierwotnych do ich poziomu. Dla tonu 2f1  f2:
Poziom t. różnicowego Lr poziom t. pierwotnych L1,2 f1 f2/f1
-15  -20 dB 20  80 dB 250 - 8000 Hz 1,1
poziom progowy 1,4  1,7
36. W jakim przeciętnie zakresie częstotliwości tonów pierwotnych występują zauważalne
tony kombinacyjne?
Zauważalne tony występują dla częstotliwości 300  8000 Hz, przy stosunku f2/f1 na poziomie
0  3.
WYSOKOŚĆ DyWIKU
37. Wysokość tonów (przebiegów sinusoidalnych)  na czym polega skala meli?
Skala meli charakteryzuje się tym, że dwukrotna liczba meli odpowiada podwojeniu
wysokości tonu. W rzeczywistości można spotkać kilka skal melowych różniących się w
zależności od procedury ich wyznaczania. Umownie przyjęto, że wysokość 1000 meli ma ton
o częstotliwości 1000Hz i poziomie ciśnienia akustycznego 40dB SPL. Między skalą meli i
skalą pasm krytycznych istnieje znacznie prostsza zależność: 1 bark odpowiada 100 melom.
38. Od jakich parametrów sygnału sinusoidalnego i w jaki sposób zależy postrzegana
wysokość?
O wysokości dzwięku w głównej mierze decyduje częstotliwość jego przebiegu falowego. W
przypadku tonu częstotliwością tą jest odwrotność jego okresu, natomiast dla wielotonu
harmonicznego  o wysokości w głównej mierze decyduje częstotliwość podstawowa, choć
nie tylko. Na ocenę wysokości dzwięku wpływ mają również natężenie, czas trwania, postać
widma i obwiedni, a także obecność innych dzwięków. Wysokość dzwięku jest wielkością
subiektywną, jednak rośnie ona z częstotliwością.
39. Jak zmienia się wysokość dzwięku przy obecności drugiego tonu lub szumu dolno-
/górno-pasmowego i czym to się tłumaczy?
Jeśli szum pasmowy, bądz inny sygnał maskujący ma niższą częstotliwość niż ton
maskowany, można zaobserwować podwyższenie wysokości tego tonu o ok. 1-2%. W
przeciwnym razie, obserwuje się obniżenie wysokości w tych samych granicach. W
przypadku szumu szerokopasmowego wysokość tonu maskowanego ulega przesunięciu w
górę.
40. Jakie są przeciętne wartości progów różnicy częstotliwości w różnym zakresie
częstotliwości?
W tabelce znajdują się wartości przybliżone:
Częstotliwość [Hz]
Próg "F [Hz]
500 1
2000 3
4000 10
8000 50
41. W jaki sposób tworzona jest wysokość dzwięków złożonych widmowo, w szczególności
dzwięków o widmie harmonicznym?
Po odfiltrowaniu składowej podstawowej nie zauważa się zmiany wysokości dzwięku. Można
więc sądzić, że wysokość dzwięku zależy od wysokości jego harmonicznych. Dzwięk
złożony może zawierać nawet kilka różnych wysokości, odpowiadającym najczęściej
harmonicznym o niskich częstotliwościach. Możliwa również jest percepcja wysokości
wytworzonej w wyniku ich oddziaływania, niezwiązana bezpośrednio z żadną ze
składowych. Wysokość tworzona przez grupę harmonicznych nazywa się wysokością
rezydualną.
SAYSZENIE DWUUSZNE
42. Co oznaczają następujące terminy: lokalizacja, lateralizacja, odsłuch monauralny,
binauralny, diotyczny i dychotyczny?
- lokalizacja  subiektywna ocena położenia zródła dzwięku w przestrzeni,
- lateralizacja  wrażenie przemieszczania się obrazu dzwiękowego wewnątrz głowy
wzdłuż linii łączącej oboje uszu,
- ods. monauralny  percepcja dzwięku dokonywana jednousznie,
- ods. binauralny  percepcja dzwięku dokonywana dwuusznie,
- ods. dychotyczny  odsłuch dwóch różnych sygnałów podawanych na oboje uszu.
- ods. diotyczny  odsłuch tego samego sygnału podawanego na oboje uszu.
43. Na czym polega  eksternalizacja obrazu słuchowego?
Jest to efekt polegający na tym, że podczas odsłuchu binauralnego np. z głośnika, obraz
dzwiękowy tworzy się na zewnątrz głowy słuchacza.
44. Co to jest międzyuszna różnica czasu i międzyuszna różnica natężenia?
Jeśli fala akustyczna dociera do słuchacza z boku tworzy się binauralna różnica odległości, w
wyniku której natężenia i czasy dotarcia dzwięków do obojga uszu nie są takie same. Dzięki
temu możliwe jest zlokalizowanie zródła dzwięku w płaszczyznie poziomej. Różnica
natężenia spełnia rolę dominującą dla częstotliwości wysokich.
"D
ITD: " t = . Zmienia się w zakresie od 0 do 690s.
c
45. Jakiego rzędu międzyuszna różnica czasu powoduje przesunięcie obrazu słuchowego
całkowicie w jedną stronę (tak, że dzwięk odbierany jest z boku)?
ok. 690 mikrosekund
46. Jakiego rzędu międzyuszna różnica natężenia powoduje przesunięcie obrazu
słuchowego całkowicie na jedną stronę (tak, że dzwięk odbierany jest z boku)?
ok. 7  8 dB dla częstotliwości 1kHz
47. W jakich zakresach częstotliwości o lokalizacji decyduje międzyuszna różnica czasu lub
międzyuszna różnica natężenia. Co powoduje taki przebieg tych zależności i czy takie
samo zróżnicowanie występuje przy odsłuchu słuchawkowym?
ITD (międzyuszna różnica czasu) ma większy wpływ przy niskich częstotliwościach,
IID (międzyuszna różnica natężeń) dominuje przy wysokich częstotliwościach.
Dla niskich częstotliwości (do ok. 200Hz) fale uginają się wokół głowy obserwatora, w
wyniku czego międzyuszna różnica poziomu ciśnienia nie zależy praktycznie od azymutu
zródła. Natomiast dla wysokich częstotliwości, tzn. gdy długość fali akustycznej jest
porównywalna lub mniejsza od wymiarów głowy, powstaje po jednej stronie tzw. cień
akustyczny. Wówczas wartości międzyusznej różnicy poziomu ciśnienia wyraznie zależą od
azymutu zródła. Dla częstotliwości pośrednich tzn. ok. 1500Hz lokalizacja dzwięku jest dość
trudna i obarczona największym błędem.
W przypadku odsłuchu słuchawkowego w całym przedziale częstotliwości o lokalizacji
zródła decyduje jedynie różnica natężeń. Dzieje się tak dlatego, iż w tym systemie odsłuchu
głowa nie stanowi przeszkody dla fal, nie ulegają one dyfrakcji.
48. Co to jest tzw. stożek niepewności?
Dla ustalonej wartości międzyusznej różnicy czasu istnieje powierzchnia w kształcie stożka,
dla której wszystkie zródła dzwięku znajdujące się na niej powinny wywoływać takie same
międzyuszne różnice czasu.
49. Które z wielkości  międzyuszna różnica fazy sygnału (opóznienie w przebiegu
czasowym) czy międzyuszne opóznienie obwiedni sygnału mają znaczenie przy
lokalizacji?
Międzyuszna różnica fazy jest bezpośrednio związana z różnicą czasu, zatem obie mają
znaczenie przy wyznaczaniu lokalizacji zródła.
50. Na czym polega dwuuszne sumowanie głośności?
Dwuuszne sumowanie głośności polega na tym, że sygnał słyszany dwuusznie wydaje się
głośniejszy
51. Ile (ogólnie) wynoszą kątowe progi różnicowe przesunięcia zródła dzwięku w
płaszczyznie poziomej?
Najmniejszą wartość kątową progu różnicowego przesunięcia otrzymuje się dla zródła
dzwięku zlokalizowanego na wprost obserwatora, szczególnie w zakresie częstotliwości do
1000Hz. Wówczas próg detekcji międzyusznej różnicy czasu wynosi 10s, co odpowiada
przesunięciu o 1o. Wzrost azymutu powoduje pogorszenie się rozdzielczości, zwłaszcza dla
częstotliwości ok. 2000Hz. Dla przykładu dla azymutu równego 60o może on wynieść nawet
30o.
52. Co to jest zjawisko dominacji (pierwszeństwa)?
Zgodnie z tym efektem, dla lokalizacji zródła w przestrzeni najważniejsza jest fala, która jako
pierwsza dochodzi do obserwatora. Zjawisko to występuje dla dzwięków impulsowych i
tłumaczy się tym, że pierwsza fala (bezpośrednia) wnosi najwięcej informacji o kierunku
zródła dzwięku. Aby efekt wystąpił maksymalne czasy opóznienia poszczególnych odbić,
liczone względem dzwięku bezpośredniego nie powinny przekraczać kilkudziesięciu
milisekund. Poziom ciśnienia akustycznego dzwięku odbitego względem dzwięku
bezpośredniego nie powinien przekraczać wartości 10dB.
53. W jakim zakresie opóznień sygnału występuje zjawisko dominacji?
W przypadku, gdy różnica czasu pomiędzy dzwiękami docierającymi do uszu jest mniejsza
niż 1ms efekt nie występuje lub jest bardzo słaby. Aby efekt wystąpił maksymalne czasy
opóznienia poszczególnych odbić, liczone względem dzwięku bezpośredniego również nie
powinny przekraczać kilkudziesięciu milisekund.
54. Na czym polega odmaskowanie dwuuszne (BMLD)?
Jest to odmaskowanie wynikające z dochodzenia do obojga uszu różnych sygnałów. Efekt ten
powstaje wtedy, gdy międzyuszne różnice parametrów fizycznych dla sygnału lub maskera są
różne. Efekt ten powoduje w pewnych przypadkach obniżenie progu detekcji sygnału
maskowanego.
55. Podać typowe wartości odmaskowania dwuusznego.
T(x/y)  odmaskowanie sygnału x maskowanego przez y przy różnej prezentacji dwuusznej:
T(x/y) wartość odmaskowania
T(M/M) 0 dB
T(M/0) 6 dB
T(0/0) 0 dB
T(Ą/0) 12 dB
T(Ą/Ą) 0 dB
M- monauralnie
0  binauralnie w fazie
Ą  binauralnie w przeciwfazie
KOMPRESJA DyWIKU
56. W jaki sposób wyznacza się profil maskowania w modelu psychoakustycznym przy
stratnej kompresji dzwięku?
Profil maskowania wyznacza się przez zsumowanie krzywej progu słyszenia oraz krzywych
maskowania przez wyróżniające się tony i pasma szumowe. Zapisaniu podlega wyłącznie to
co leży powyżej otrzymanej sumy.
POMIARY SAUCHU
57. Na czym polegają metody: granic, dostrajania i stałego bodzca?
" Metoda stałych bodzców wykorzystywana jest do wyznaczania progu absolutnego lub
progu różnicy pewnej wielkości fizycznej. W pierwszym przypadku polega ona na
wielokrotnym prezentowaniu bodzców różniących się między sobą w zakresie pewnego
przedziału. Bodzce prezentuje się słuchaczowi wielokrotnie w porządku losowym, przy
czym każdy bodziec taką samą liczbę razy (np. 100). Zadaniem słuchacza jest
odpowiedzieć na pytanie, czy słyszał bodziec w systemie tak/nie.
" Metoda granic jest mniej dokładna w porównaniu z metodą stałych bodzców, ale ma tę
zaletę, że jest mniej czasochłonna. Przy pomiarze progu absolutnego eksperymentator
prezentuje słuchaczowi ciąg bodzców w tzw. serii malejącej (rozpoczynając od natężeń
zdecydowanie powyżej progu) i rosnącej (rozpoczynając od bodzców niesłyszalnych). Po
przeprowadzeniu kilku serii na przemian uzyskuje się wypadkowy próg absolutny jako
średnią wartość progów otrzymanych dla wszystkich serii.
" Charakterystyczną cechą metody dostrajania jest to, że słuchacz sam dobiera natężenie
bodzca w czasie eksperymentu. Ponadto natężenie zmienia się w sposób ciągły. W każdej
kolejnej serii pomiarowej eksperymentator powinien zmienić początkową wartość
natężenia bodzca. Zarówno tę, jak i poprzednią metodę można stosować do wyznaczania
progu dyskryminacji natężenia. W tym wypadku dopasowując natężenie, aż do uzyskania
wrażenia zrównania ich głośności.
58. Czego dotyczy statystyczna teoria detekcji? Co reprezentuje krzywa ROC?
Teoria detekcji zakłada, że decyzje dotyczące detekcji sygnału zależą od wartości pewnej
zmiennej losowej x, której natura nie jest ściśle sprecyzowana. Zakłada się, że wartość
średnia tej zmiennej rośnie monotonicznie wraz ze wzrostem natężenia bodzca. Teoria
detekcji pozwala odróżnić reakcje słuchacza wynikające z czynników czysto sensorycznych
od pozostałych.
Krzywa ROC (charakterystyka funkcjonowania odbiornika) reprezentuje zależność między
względną liczbą trafień (poprawnego wykrycia sygnału) danego słuchacza, a względną liczbą
fałszywych alarmów (wykrycia niesłyszalnego sygnału).
59. Co to jest wskaznik detekcji d ?
d jest miarą wrażliwości systemu słuchowego na sygnał (miarą wykrywalności sygnału) i
wskazuje na zdolność słuchacza do odróżnienia sygnału od szumu w tym sensie, że im
zdolność jest lepsza, tym wartość d jest większa. Miara ma charakter obiektywny i jest
definiowana jako:
S - N
d'= ,

N
gdzie S  wartość średnia sygnału, N  wartość średnia szumu, N  odchylenie
standardowe szumu.
60. Jakie typowe paradygmaty układu bodzców są stosowane w pomiarach
psychoakustycznych prowadzonych z udziałem słuchaczy?
Procedura TAK / NIE
Procedura 2AFC - Two Alternative Forced Choice
Procedura n-AFC - n Alternative Forced Choice
Procedura "same-different"
61. Na czym polegają procedury adaptacyjne stosowane w pomiarach słuchu?
Procedury adaptacyjne charakteryzują się tym, że przebieg eksperymentu zależy od
odpowiedzi słuchacza. Procedury te charakteryzują się dużą efektywnością, gdyż większość
pomiarów koncentruje się w obszarze progowym. Warunkiem ich stosowania jest spełnienie
założenia, że prawdopodobieństwo poprawnej odpowiedzi wzrasta monotonicznie wraz ze
wzrostem natężenia bodzca. Eksperyment oparty na procedurze adaptacyjnej polega na
szybkim zawężeniu przedziału zmienności ocenianej wielkości do wartości okołoprogowych.
Rozpoczyna się go od takiej wartości, dla której uzyskuje się odpowiedz poprawną. Przez
stopniowe zmniejszanie wartości tego natężenia dochodzi się do odpowiedzi niepoprawnej.
Wówczas ponownie zwiększa się wartość natężenia, aż do usłyszenia poprawnej odpowiedzi.


Wyszukiwarka