PODSTAWY SŁYSZENIA I PERCEPCJA DŻWIEKU PYTANIA DO ZALICZENIA I ODPOWIEDZI
PODSTAWY SAYSZENIA I PERCEPCJA DyWIKU (Pytania do zaliczenia) BUDOWA UKAADU SAUCHOWEGO 1. Jakie są podstawowe części obwodowego (peryferyjnego) układu słuchowego? Peryferyjny układ słuchowy składa się z ucha umownie podzielonego na ucho zewnętrzne, środkowe i wewnętrzne oraz nerwu ślimakowego. 2. Jaką rolę pełni małżowina uszna? Małżowina uszna jest nieregularnym, wydłużonym fałdem skóry, którego długość jest prawie dwukrotnie większa od szerokości. Małżowina spełnia ważną rolę przy ocenie kierunku, z którego dochodzą fale akustyczne, czyli przy ocenie położenia zródła dzwięku. U niektórych zwierząt jest to część ruchoma. Jej kształt pomaga również odbierać fale dzwiękowe i kierować je do przewodu słuchowego oraz podbija częstotliwości wokół 5 kHz. 3. Co to jest HRTF (Head Related Transfer Function)? HRTF zwana inaczej charakterystyką przenoszenia głowy jest to funkcja przenoszenia związana z głową Pojedynczy HRTF składa się z dwóch filtrów, po jednym dla każdego ucha, które zawierają wszystkie informacje o dzwięku (np. IID, ITD) istotne dla słuchającego. Filtry zmieniają się w zależności od miejsca, z którego dochodzą dzwięki do słuchającego. Kompletny HRTF zawiera zestaw wielu filtrów, które opisują sferyczne środowisko dzwiękowe - 360 stopni we wszystkich kierunkach. Jest to również zbiór odpowiedzi impulsowych u wejścia do kanału słuchowego zmierzone dla sygnałów z różnych punktów przestrzeni. Te dane pozwalają tak modelować dzwięk w słuchawkach, aby możliwa była jego eksternalizacja 4. Podać cechy charakterystyczne przebiegu transmitancji zewnętrznego przewodu słuchowego. Przewód słuchowy zewnętrzny stanowi swego rodzaju układ rezonansowy w kształcie rurki o zmiennej szerokości i kształcie. Powyżej częstotliwości 1000Hz pojawiają się wyrazne maksima rezonansowe w przebiegach charakterystyk częstotliwościowych przewodu słuchowego. Najwyrazniejsze z nich przypada na częstotliwość ok. 2,6 kHz (ok. 12dB). Charakterystyki częstotliwościowe nie wykazują pełnej symetrii dla położeń zródła przód tył. Charakterystyki są bardziej złożone, gdy sygnały akustyczne prezentowane są za pomocą słuchawek. 5. Jaką rolę pełni ucho środkowe? Ucho środkowe pełni następujące funkcje: - poprzez drgania bębenka dopasowuje impedancję powietrza w przewodzie słuchowym i impedancję płynu znajdującego się w ślimaku, - stymuluje okienko owalne, - wyrównuje ciśnienie między uchem wewnętrznym a przewodem zewnętrznym. - posiada mechanizmy ochrony przed nadmiernym hałasom. 6. Co to jest odruch strzemiączkowy? Odruch strzemiączkowy (inaczej refleks ucha środkowego) jest to efekt obronny przed dzwiękami o zbyt dużym natężeniu. Występuje on symetrycznie w obu uszach i polega na tym, że pierwszy z mięśni napina błonę bębenkową i wciąga ją w kierunku jamy bębenkowej, co znacznie ogranicza jej wychylenia, a drugi mięsień zmienia kierunek drgań podstawy strzemiączka. Odruch ten włącza się z pewnym opóznieniem (ok. 10ms), więc jest nieskuteczny w przypadku głośnych dzwięków impulsowych (np. wystrzały). Ciekawostką jest, że odruch ten włącza się również bezpośrednio przed wokalizacją. 7. Wymienić podstawowe elementy budowy ucha wewnętrznego? Ucho wewnętrzne leży w części skalistej kości skroniowej. Składa się ono z błędnika kostnego i leżącego w nim błędnika błoniastego. Przestrzeń między błędnikiem kostnym i błoniastym wypełnia ciecz zwana perilimfą, natomiast wewnątrz błędnika błoniastego znajduje sie ciecz zwana endolimfą. Błędnik kostny dzieli się na przedsionek, trzy kanały półkoliste i kanał zwinięty w spiralę zwany ślimakiem. Ślimak kończy się w miejscu zwanym osklepkiem. W uchu wewnętrznym znajdują się również okienka owalne i okrągłe oraz narządy związane z równowagą. 8. Na czym polega mechanizm aktywny ucha wewnętrznego? Ślimak spełnia rolę nie tylko odbiornika i procesora energii, ale również jest miejscem aktywnych procesów wspomagających ruch błony podstawnej. Czułość i selektywność częstotliwościowa wynika z aktywności zewnętrznych komórek słuchowych, które są rezonatorami o bardzo dużej dobroci i selektywnie reagują na drgania wprawiając w ruch błonę pokrywkową. Błona oddziałuje na wewnętrzną komórkę słuchową, która odprowadza sygnały do mózgu. Częstotliwość dzwięku związana z maksymalnym wychyleniem błony podstawnej nazywa się częstotliwością charakterystyczną. Maksymalne wychylenie błony zmniejsza się, jeśli błonę tę stymuluje się równocześnie tonem o częstotliwość zbliżonej do CF. Efektu tego nie obserwuje się dla ślimaka uszkodzonego 9. W jaki sposób dokonuje się analizy widma dzwięku w uchu wewnętrznym? Analiza widmowa dzwięku w uchu wewnętrznym oparta jest na filtracji składowych spektralnych dzwięku złożonego. Każdemu punktowi błony podstawnej można przyporządkować filtr pasmowoprzepustowy o określonej częstotliwości środkowej, bezwzględnej szerokości pasma i nachyleniu zboczy. Nachylenie zboczy charakterystyki filtru opisać można liczbą decybeli jej spadku na oktawę częstotliwości, a bezwzględną różnicę pasma określa się jako różnicę pomiędzy dwiema częstotliwościami, dla których różnica poziomów ciśnienia względem poziomu maksymalnego wynosi 3dB. 10. Na czym polega synchronizacja impulsów neuronowych z przebiegiem czasowym sygnału akustycznego? Badania pokazały, że wyładowania neuronów jako odpowiedz na powtarzany sygnał pobudzający pojawiają się najczęściej dla tej samej fazy sygnału, czyli są zsynchronizowane z przebiegiem czasowym sygnału pobudzającego. Efekt ten występuje tylko dla częstotliwości 4-5 kHz. FILTR SAUCHOWY I MASKOWANIE 11. Czym objawia się pasmowość słuchu w odniesieniu do zjawiska maskowania? W czasie jednego z eksperymentów badano położenie progu słyszalności w funkcji szerokości pasma szumu maskującego. Gęstość spektralna mocy maskera była stała, podczas gdy rosła moc całkowita wraz ze wzrostem szerokości pasma częstotliwości. Badania te pokazały, że poszerzenie pasma szumu maskującego wpływało na podwyższanie progu słyszalności sygnału tylko do pewnej szerokości tego pasma. Aby wyjaśnić to zjawisko przyjęto, że peryferyjny system słuchowy zachowuje się jak zespół liniowych filtrów pasmowych o zachodzących na siebie pasmach przepuszczania i charakterystykach przenoszenia w kształcie prostokąta. Bazą tych filtrów jest błona podstawna, której poszczególne miejsca reagują na określone częstotliwości, każdemu więc punktowi tej błony odpowiada określona częstotliwość środkowa filtru i określone pasmo przepuszczania. 12. Jak zmienia się głośność szumu pasmowego (zachowując jego stałą moc) przy rozszerzaniu jego pasma w zakresie do szerokości filtru słuchowego, a następnie poza tę szerokość? Podczas zwiększania szerokości pasma szumu do szerokości filtru słuchowego poziom natężenia dzwięku ustala się na pewnym poziomie. Gdy szerokość pasma szumu przekracza szerokość pasma filtru słuchowego, głośność zwiększa się. 13. Jak zmienia się szerokość pasma filtru słuchowego w funkcji częstotliwości środkowej: a) według pomiarów niemieckich tj. szerokość tzw. pasma krytycznego (critical bandwidth) b) według pomiarów angielskich tj. tzw. równoważna szerokość prostokątna filtru ERB? Najważniejszym parametrem charakteryzującym filtr słuchowy jest szerokość jego pasma. Według pomiarów niemieckich rolę filtrów słuchowych pełniły pasma krytyczne, których szerokość była zarazem szerokością pasm filtrów słuchowych. Szerokość filtrów słuchowych można wyrażać za pomocą szerokości połówkowej określonej na wysokości 3dB poniżej maksymalnej wartości charakterystyki przenoszenia. Analityczna postać wyrażenia określająca wartość szerokości prostokątnej filtru słuchowego w funkcji częstotliwości środkowej f [kHz] ma postać: a) Dla częstotliwości poniżej 700-800Hz szerokość jest stała i wynosi ok. 100Hz. Powyżej rośnie i stanowi stałą procentową szerokość pasma (w przybliżeniu filtr tercjowy) 2 ERBZ = 25 + 75(1+1,4 f )0,69 (wzór przybliżony), b) Szerokość filtrów zmienia się jednostajnie (podobnie jak filtry tercjowe) osiągając szerokość do ok. 20-30 Hz dla częstotliwości równej 100Hz ERBGM = 24,7(4,37 f +1) . Ekwiwalentne szerokości filtrów słuchowych odbiegają od szerokości pasm krytycznych otrzymanych przez Zwickera dla częstotliwości poniżej 500 Hz. 14. Czy filtry słuchowe mają charakterystykę niezależną od poziomu sygnału? Nie. Wyniki badań pokazały, że kształt filtrów słuchowych w liniowej skali częstotliwości jest dość symetryczny dla średnich poziomów ciśnienia akustycznego. Natomiast dla dużych poziomów, kształt ten staje się niesymetryczny po stronie niskich częstotliwości obwiednia filtru jest mniej stroma, niż po stronie wyższych. 15. Co to są filtry Roex, Gammatone i Gammachirp? W.w. filtry to filtry modelujące filtry słuchowe. " Filtr Roex jest to taki filtr, który ma jeden bezwymiarowy parametr r, opisujący szerokość pasma krytycznego. Filtr jest opisany przez specjalną funkcję eksponencjalną: 2 r H ( f ) = (1+ r g)e- g , gdzie g jest znormalizowanym odchyleniem częstotliwości od częstotliwości środkowej filtru. Jego ekwiwalentna szerokość wynosi: fc ERB = 4 . r " Charakterystyka filtrów Gammatone i Gammachirp oparta jest na tzw. funkcji gamma. Funkcja ta ma tę zaletę, że charakteryzuje ona filtr na podstawie jego odpowiedzi impulsowej. 16. Na czym polega zjawisko maskowania? Maskowaniem nazywa się proces, w którym próg słyszalności dzwięku maskowanego (sygnału) podnosi się na skutek obecności dzwięku maskującego (maskera). Wartość podwyższenia tego progu wyraża się najczęściej w dB. 17. Jakie występują rodzaje maskowania i czym się różnią? - całkowite sygnał przestaje być słyszany na tle maskera, - częściowe obniża się głośność sygnału na tle maskera, - równoczesne sygnał i masker występują równocześnie w czasie, - nierównoczesne oba bodzce są przesunięte względem siebie w czasie: " resztkowe (pobodzcowe) sygnał występuje po maskerze, " wsteczne (przedbodzcowe) masker występuje po sygnale, - monoauralne (jednouszne) sygnał i masker są prezentowane słuchaczowi jednousznie, - centralne do jednego ucha podajemy sygnał, do drugiego masker. 18. Na czym polega asymetria maskowania w funkcji częstotliwości? Dla poziomów ciśnienia maskera większych niż 60dB SPL krzywe maskowania przestają być symetryczne. Ich stromość po stronie wyższych częstotliwości jest znacznie mniejsza, niż stromość po stronie niższych. Jeśli w takiej sytuacji częstotliwość środkowa jednego dzwięku jest większa, niż częstotliwość drugiego dzwięku to dzwięk drugi bardziej zagłusza pierwszy, niż pierwszy zagłusza drugi. GAOŚNOŚĆ DyWIKU 19. Jaki cechy ma przebieg absolutnego progu słyszenia i co na to wpływa? Próg absolutny określany jest przez najmniejszą wartość poziomu ciśnienia akustycznego, która wywołuje zaledwie spostrzegalne wrażenie słuchowe. Próg ten pokazuje, że czułość słuchu jest największa (poziom ciśnienia akustycznego ma wartość najmniejszą) w zakresie częstotliwości średnich (1000-4000Hz) i wyraznie maleje w pasmie częstotliwości niskich i wysokich. Spadek czułości poniżej 1000Hz wynosi ok. 6dB na oktawę, natomiast powyżej 4000Hz ok. 24dB/okt. Wysoka czułość słuchu w zakresie średnich częstotliwości wynika z rezonansowego charakteru działania przewodu słuchowego oraz szczególnie efektywnego działania ucha środkowego w tym zakresie częstotliwości. 20. Jak konstruowany jest audiogram? Badania słuchu rozpoczyna się od pomiaru przewodnictwa powietrznego, zaczynając od ucha lepszego. Najpierw wyznacza się wartość progu słyszalności podając ton o częstotliwości 1000Hz. Następnie zmienia się częstotliwość kolejno na 2, 4, 8, 10 i ponownie na 1 kHz (badanie kontrolne). Dalsze badania wyznaczania kolejnych wartości progu wykonuje się dla częstotliwości 125, 250 i 500Hz. Podobne pomiary przeprowadza się dla ucha gorzej odbierającego dzwięki. W przypadku dużej asymetrii można do ucha przeciwległego podawać szum maskujący. Wyznaczoną zależność poziomu ciśnienia od częstotliwości przenosi się na wykres ubytku słuchu (różnicy między wartością zmierzoną, a wartością średniego progu uzyskanego dla osób normalnie słyszących) od częstotliwości. 21. Co to jest zjawisko wyrównania głośności? Zjawisko wyrównania głośności jest to niewspółmiernie silny wzrost głośności dla słuchu uszkodzonego wraz ze wzrostem poziomu ciśnienia akustycznego, w porównaniu ze wzrostem głośności dla słuchu normalnego. Można wyróżnić zjawisko wyrównania głośności całkowite, częściowe i odwrotne. 22. Co to jest czasowe przesunięcie progu i kiedy występuje? Czasowe przesunięcie progu występuje na skutek zmęczenia słuchowego, powstającym pod wpływem działania silnych bodzców dzwiękowych. Zjawisko zmęczenia ustępuje dopiero po dłuższym czasie (nawet do kilku dni) od chwili zaprzestania stymulacji. 23. Podać psychofizyczne prawo Webera-Fechnera i jego związek ze skalą decybeli? Odbierana wartość wrażenia jest logarytmiczną funkcją natężenia bodzca fizycznego: Wr = a ln I + b , gdzie Wr wrażenie, I natężenie bodzca, zaś a i b to stałe. Z prawem tym wiąże się w ogólności dyskryminacja wrażenia sensorycznego. W efekcie prawa Webera- Fechnera stosowane są logarytmiczne skale do charakterystyki zjawisk fizycznych, które pierwotnie opierały się na subiektywnym wrażeniu ich wartości (np. poziom natężenia dzwięku w dB). 24. Co to są izofony i jak się je tworzy? Izofony są to krzywe jednakowego poziomu głośności. Każda z krzywych przyporządkowana jest określonemu poziomowi głośności w fonach, przy którym tony o różnych częstotliwościach mają taką głośność, jak ton wzorcowy o częstotliwości 1000Hz. Krzywe tworzy się dokonując pomiaru poziomu ciśnienia akustycznego tonów o różnych częstotliwościach zrównanych pod względem głośności z tonem wzorcowym. Aby otrzymać rodzinę izofonów, należy przeprowadzić badanie dla różnych poziomów głośności. 25. Na czym polega wyrażenie głośności w sonach, czym skala sonów różni się od skali fonów? Son jest to jednostka głośności tonu o częstotliwości 1000Hz i poziomie ciśnienia 40dB SPL. Wyrażanie głośności w sonach polega na ilościowej zależności głośności od jego natężenia. Dzwięki o danej liczbie fonów wywołują to samo wrażenie głośności, podczas gdy skala sonów wiąże liczbowo głośność z poziomem natężenia dzwięku. 26. Co to są częstotliwościowe krzywe korekcyjne A i C i dlaczego stosuje się w pomiarach akustycznych? Krzywa korekcyjna A stanowi przybliżenie odwróconej krzywej izofonicznej 30 fonów, dzięki czemu ograniczony jest wpływ składowych o niskich częstotliwościach na wynik pomiaru. Krzywa B stosowana jest przy pomiarach średnich poziomów ciśnienia akustycznego, ma jednak niewielkie zastosowanie. Krzywa C jest prawie płaska w całym zakresie częstotliwości i jest wykorzystywana przy pomiarach dużych poziomów ciśnienia. Krzywe te stosuje się w urządzeniach elektroakustycznych, gdyż przy małych poziomach ciśnienia (np. przy cichym odtwarzaniu dzwięków) narząd słuchu jest znacznie mniej czuły na tony o niskich częstotliwościach, niż przy większych. 27. Na czym polega i jak odbywa się sumowanie głośności w czasie? Głośność dzwięku zależy od czasu jego trwania. Dla bardzo krótkich czasów (do 200ms), głośność rośnie wraz ze wzrostem tego czasu. Efekt ten nazywa się sumowaniem głośności. Sumowanie głośności można opisać formułą eksponencjalną wyznaczoną doświadczalnie: I" I(t) = , t 1- e gdzie I(t) natężenie dzwięku wymagane dla uzyskania stałej głośności, I" natężenie dla długich czasów trwania, t czas trwania bodzca, stała czasowa równa 80ms. Z punktu widzenia anatomii nie wydaje się możliwe, aby system słuchowy sumował energię sygnału sumowanie to odnosi się głównie do aktywności neuronów i ich wyładowań w czasie. Niekiedy sądzi się też, że obserwowanie obniżenia progu detekcji dzwięku tłumaczy się lepszą możliwością jego spostrzeżenia dzięki powtarzanemu w czasie przetwarzaniu. 28. Co to jest i ile wynosi próg różnicy głośności (różnicy natężenia). Czy jest on stały w funkcji poziomu ciśnienia akustycznego? Weber sformułował prawo, które głosi, że najmniejsza spostrzegalna (progowa) zmiana natężenia dzwięku "L jest proporcjonalna do jego wypadkowego natężenia. Badania wykazały, że dla szumów i sygnałów szerokopasmowych dla poziomów ponadprogowych prawo to jest dość dobrze spełnione. W zakresie od 20 do 100dB próg różnicy głośności wynosi 0,5 1dB. Przy progu słyszenia wielkość ta jest większa. Dla tonów obserwuje się efekt zwany odstępstwem od prawa Webera. "L maleje, a prosta ma współczynnik kierunkowy ok. 0,9. Próg wynosi 1,5dB dla 20 dB SL, 0,7dB dla 40dB SL, itd. PERCEPCJA ZMIAN CZASOWYCH 29. Jakie są graniczne (najmniejsze) progi postrzegania zmian parametrów czasowych sygnałów, w sytuacji gdy: a) przy zmianach czasowym pojawiają się różnice w widmie mocy sygnałów? Jeśli przy zmianie parametrów czasowych zachodzą zmiany w widmie sygnału, to rozdzielczość czasowa sięga kilkudziesięciu mikrosekund. Aatwiej jest spostrzegać asynchroniczność w procesie narastania (próg detekcji wynosi ok. 1ms), niż w procesie zanikania składowych dzwięku (próg był 3-10 razy mniejszy). b) przy zmianach czasowych nie ma zmian widma mocy sygnałów? Przy założeniu równości poziomów odczucia dwóch impulsów szumowych próg detekcji przerwy czasowej między nimi wynosi ok. 3ms. Wartość tego progu jest większa dla poziomów odczucia poniżej 30dB SL. W badaniach kolejności czasowej kolejność pary impulsów o tym samym widmie mocy była praktycznie niemożliwa do ustalenia gdy całkowity czas trwania bodzców osiągał wartość mniejszą niż 2ms. 30. Co to jest funkcja przeniesienia modulacji (TMTF) i jak przebiega? Funkcja przeniesienia modulacji charakteryzuje zdolność systemu słuchowego do percepcji zmian amplitudowych bodzca, dla różnych prędkości tych zmian. Funkcja jest w przybliżeniu stała dla częstotliwości modulacji do ok. 40Hz. Jednakże, powyżej tej częstotliwości detekcja modulacji amplitudowej maleje z prędkością ok. 3dB/oktawę, aż do częstotliwości 1 kHz, powyżej której nie jest słyszana. 31. Czy próg postrzegania zmian czasowych zależy od szerokości pasma sygnału? Dane pokazują, że próg detekcji przerwy czasowej zmienia się w przybliżeniu odwrotnie proporcjonalnie do pierwiastka kwadratowego z szerokości pasma częstotliwości bodzców. Natomiast rozróżnienie czasu trwania bodzców nie zależy od szerokości ich pasma częstotliwości. 32. Czym tłumaczy się ograniczoną rozdzielczość czasową układu słuchowego? Ograniczenie rozdzielczości czasowej wiąże się z ograniczonym przetwarzaniem sygnału na poziomie peryferyjnym bądz też centralnym. Na poziomie peryferyjnym wynika między innymi z filtrującego działania błony podstawnej i występuje głównie w zakresie niskich częstotliwości. Ograniczenie rozdzielczości na poziomie centralnym wynika z ograniczeń przetwarzania informacji słuchowej na drodze powyżej nerwu słuchowego, aż do mózgu. NIELINIOWOŚĆ SAUCHU 33. Jakie rodzaje produktów nieliniowości, czyli tzw. tonów kombinacyjnych, występują w układzie słuchowym? Tony typu: - f2 f1 ton różnicowy - (n + 1)f1 nf2, w tym zwłaszcza 2f1 f2 34. Jakie są typowe poziomy tonu różnicowego? Rodzaj i poziomy tonu kombinacyjnego zależą od stosunku częstotliwości tonów pierwotnych do ich poziomu. Dla tonu różnicowego: Poziom t. różnicowego Lr poziom t. pierwotnych L1,2 f1 f2 20 dB 80 dB 1000 Hz 1400 Hz poziom progowy 50 60dB 700 5000 Hz f1 + 100, 200, 400 Hz poziom progowy 30 dB 800 Hz 1500 Hz 30 dB 60 dB 300 900 Hz 1,3 f1 35. Jakie są poziomy tonu kombinacyjnego 2f1-f2? Rodzaj i poziomy tonu kombinacyjnego zależą od stosunku częstotliwości tonów pierwotnych do ich poziomu. Dla tonu 2f1 f2: Poziom t. różnicowego Lr poziom t. pierwotnych L1,2 f1 f2/f1 -15 -20 dB 20 80 dB 250 - 8000 Hz 1,1 poziom progowy 1,4 1,7 36. W jakim przeciętnie zakresie częstotliwości tonów pierwotnych występują zauważalne tony kombinacyjne? Zauważalne tony występują dla częstotliwości 300 8000 Hz, przy stosunku f2/f1 na poziomie 0 3. WYSOKOŚĆ DyWIKU 37. Wysokość tonów (przebiegów sinusoidalnych) na czym polega skala meli? Skala meli charakteryzuje się tym, że dwukrotna liczba meli odpowiada podwojeniu wysokości tonu. W rzeczywistości można spotkać kilka skal melowych różniących się w zależności od procedury ich wyznaczania. Umownie przyjęto, że wysokość 1000 meli ma ton o częstotliwości 1000Hz i poziomie ciśnienia akustycznego 40dB SPL. Między skalą meli i skalą pasm krytycznych istnieje znacznie prostsza zależność: 1 bark odpowiada 100 melom. 38. Od jakich parametrów sygnału sinusoidalnego i w jaki sposób zależy postrzegana wysokość? O wysokości dzwięku w głównej mierze decyduje częstotliwość jego przebiegu falowego. W przypadku tonu częstotliwością tą jest odwrotność jego okresu, natomiast dla wielotonu harmonicznego o wysokości w głównej mierze decyduje częstotliwość podstawowa, choć nie tylko. Na ocenę wysokości dzwięku wpływ mają również natężenie, czas trwania, postać widma i obwiedni, a także obecność innych dzwięków. Wysokość dzwięku jest wielkością subiektywną, jednak rośnie ona z częstotliwością. 39. Jak zmienia się wysokość dzwięku przy obecności drugiego tonu lub szumu dolno- /górno-pasmowego i czym to się tłumaczy? Jeśli szum pasmowy, bądz inny sygnał maskujący ma niższą częstotliwość niż ton maskowany, można zaobserwować podwyższenie wysokości tego tonu o ok. 1-2%. W przeciwnym razie, obserwuje się obniżenie wysokości w tych samych granicach. W przypadku szumu szerokopasmowego wysokość tonu maskowanego ulega przesunięciu w górę. 40. Jakie są przeciętne wartości progów różnicy częstotliwości w różnym zakresie częstotliwości? W tabelce znajdują się wartości przybliżone: Częstotliwość [Hz] Próg "F [Hz] 500 1 2000 3 4000 10 8000 50 41. W jaki sposób tworzona jest wysokość dzwięków złożonych widmowo, w szczególności dzwięków o widmie harmonicznym? Po odfiltrowaniu składowej podstawowej nie zauważa się zmiany wysokości dzwięku. Można więc sądzić, że wysokość dzwięku zależy od wysokości jego harmonicznych. Dzwięk złożony może zawierać nawet kilka różnych wysokości, odpowiadającym najczęściej harmonicznym o niskich częstotliwościach. Możliwa również jest percepcja wysokości wytworzonej w wyniku ich oddziaływania, niezwiązana bezpośrednio z żadną ze składowych. Wysokość tworzona przez grupę harmonicznych nazywa się wysokością rezydualną. SAYSZENIE DWUUSZNE 42. Co oznaczają następujące terminy: lokalizacja, lateralizacja, odsłuch monauralny, binauralny, diotyczny i dychotyczny? - lokalizacja subiektywna ocena położenia zródła dzwięku w przestrzeni, - lateralizacja wrażenie przemieszczania się obrazu dzwiękowego wewnątrz głowy wzdłuż linii łączącej oboje uszu, - ods. monauralny percepcja dzwięku dokonywana jednousznie, - ods. binauralny percepcja dzwięku dokonywana dwuusznie, - ods. dychotyczny odsłuch dwóch różnych sygnałów podawanych na oboje uszu. - ods. diotyczny odsłuch tego samego sygnału podawanego na oboje uszu. 43. Na czym polega eksternalizacja obrazu słuchowego? Jest to efekt polegający na tym, że podczas odsłuchu binauralnego np. z głośnika, obraz dzwiękowy tworzy się na zewnątrz głowy słuchacza. 44. Co to jest międzyuszna różnica czasu i międzyuszna różnica natężenia? Jeśli fala akustyczna dociera do słuchacza z boku tworzy się binauralna różnica odległości, w wyniku której natężenia i czasy dotarcia dzwięków do obojga uszu nie są takie same. Dzięki temu możliwe jest zlokalizowanie zródła dzwięku w płaszczyznie poziomej. Różnica natężenia spełnia rolę dominującą dla częstotliwości wysokich. "D ITD: " t = . Zmienia się w zakresie od 0 do 690s. c 45. Jakiego rzędu międzyuszna różnica czasu powoduje przesunięcie obrazu słuchowego całkowicie w jedną stronę (tak, że dzwięk odbierany jest z boku)? ok. 690 mikrosekund 46. Jakiego rzędu międzyuszna różnica natężenia powoduje przesunięcie obrazu słuchowego całkowicie na jedną stronę (tak, że dzwięk odbierany jest z boku)? ok. 7 8 dB dla częstotliwości 1kHz 47. W jakich zakresach częstotliwości o lokalizacji decyduje międzyuszna różnica czasu lub międzyuszna różnica natężenia. Co powoduje taki przebieg tych zależności i czy takie samo zróżnicowanie występuje przy odsłuchu słuchawkowym? ITD (międzyuszna różnica czasu) ma większy wpływ przy niskich częstotliwościach, IID (międzyuszna różnica natężeń) dominuje przy wysokich częstotliwościach. Dla niskich częstotliwości (do ok. 200Hz) fale uginają się wokół głowy obserwatora, w wyniku czego międzyuszna różnica poziomu ciśnienia nie zależy praktycznie od azymutu zródła. Natomiast dla wysokich częstotliwości, tzn. gdy długość fali akustycznej jest porównywalna lub mniejsza od wymiarów głowy, powstaje po jednej stronie tzw. cień akustyczny. Wówczas wartości międzyusznej różnicy poziomu ciśnienia wyraznie zależą od azymutu zródła. Dla częstotliwości pośrednich tzn. ok. 1500Hz lokalizacja dzwięku jest dość trudna i obarczona największym błędem. W przypadku odsłuchu słuchawkowego w całym przedziale częstotliwości o lokalizacji zródła decyduje jedynie różnica natężeń. Dzieje się tak dlatego, iż w tym systemie odsłuchu głowa nie stanowi przeszkody dla fal, nie ulegają one dyfrakcji. 48. Co to jest tzw. stożek niepewności? Dla ustalonej wartości międzyusznej różnicy czasu istnieje powierzchnia w kształcie stożka, dla której wszystkie zródła dzwięku znajdujące się na niej powinny wywoływać takie same międzyuszne różnice czasu. 49. Które z wielkości międzyuszna różnica fazy sygnału (opóznienie w przebiegu czasowym) czy międzyuszne opóznienie obwiedni sygnału mają znaczenie przy lokalizacji? Międzyuszna różnica fazy jest bezpośrednio związana z różnicą czasu, zatem obie mają znaczenie przy wyznaczaniu lokalizacji zródła. 50. Na czym polega dwuuszne sumowanie głośności? Dwuuszne sumowanie głośności polega na tym, że sygnał słyszany dwuusznie wydaje się głośniejszy 51. Ile (ogólnie) wynoszą kątowe progi różnicowe przesunięcia zródła dzwięku w płaszczyznie poziomej? Najmniejszą wartość kątową progu różnicowego przesunięcia otrzymuje się dla zródła dzwięku zlokalizowanego na wprost obserwatora, szczególnie w zakresie częstotliwości do 1000Hz. Wówczas próg detekcji międzyusznej różnicy czasu wynosi 10s, co odpowiada przesunięciu o 1o. Wzrost azymutu powoduje pogorszenie się rozdzielczości, zwłaszcza dla częstotliwości ok. 2000Hz. Dla przykładu dla azymutu równego 60o może on wynieść nawet 30o. 52. Co to jest zjawisko dominacji (pierwszeństwa)? Zgodnie z tym efektem, dla lokalizacji zródła w przestrzeni najważniejsza jest fala, która jako pierwsza dochodzi do obserwatora. Zjawisko to występuje dla dzwięków impulsowych i tłumaczy się tym, że pierwsza fala (bezpośrednia) wnosi najwięcej informacji o kierunku zródła dzwięku. Aby efekt wystąpił maksymalne czasy opóznienia poszczególnych odbić, liczone względem dzwięku bezpośredniego nie powinny przekraczać kilkudziesięciu milisekund. Poziom ciśnienia akustycznego dzwięku odbitego względem dzwięku bezpośredniego nie powinien przekraczać wartości 10dB. 53. W jakim zakresie opóznień sygnału występuje zjawisko dominacji? W przypadku, gdy różnica czasu pomiędzy dzwiękami docierającymi do uszu jest mniejsza niż 1ms efekt nie występuje lub jest bardzo słaby. Aby efekt wystąpił maksymalne czasy opóznienia poszczególnych odbić, liczone względem dzwięku bezpośredniego również nie powinny przekraczać kilkudziesięciu milisekund. 54. Na czym polega odmaskowanie dwuuszne (BMLD)? Jest to odmaskowanie wynikające z dochodzenia do obojga uszu różnych sygnałów. Efekt ten powstaje wtedy, gdy międzyuszne różnice parametrów fizycznych dla sygnału lub maskera są różne. Efekt ten powoduje w pewnych przypadkach obniżenie progu detekcji sygnału maskowanego. 55. Podać typowe wartości odmaskowania dwuusznego. T(x/y) odmaskowanie sygnału x maskowanego przez y przy różnej prezentacji dwuusznej: T(x/y) wartość odmaskowania T(M/M) 0 dB T(M/0) 6 dB T(0/0) 0 dB T(Ą/0) 12 dB T(Ą/Ą) 0 dB M- monauralnie 0 binauralnie w fazie Ą binauralnie w przeciwfazie KOMPRESJA DyWIKU 56. W jaki sposób wyznacza się profil maskowania w modelu psychoakustycznym przy stratnej kompresji dzwięku? Profil maskowania wyznacza się przez zsumowanie krzywej progu słyszenia oraz krzywych maskowania przez wyróżniające się tony i pasma szumowe. Zapisaniu podlega wyłącznie to co leży powyżej otrzymanej sumy. POMIARY SAUCHU 57. Na czym polegają metody: granic, dostrajania i stałego bodzca? " Metoda stałych bodzców wykorzystywana jest do wyznaczania progu absolutnego lub progu różnicy pewnej wielkości fizycznej. W pierwszym przypadku polega ona na wielokrotnym prezentowaniu bodzców różniących się między sobą w zakresie pewnego przedziału. Bodzce prezentuje się słuchaczowi wielokrotnie w porządku losowym, przy czym każdy bodziec taką samą liczbę razy (np. 100). Zadaniem słuchacza jest odpowiedzieć na pytanie, czy słyszał bodziec w systemie tak/nie. " Metoda granic jest mniej dokładna w porównaniu z metodą stałych bodzców, ale ma tę zaletę, że jest mniej czasochłonna. Przy pomiarze progu absolutnego eksperymentator prezentuje słuchaczowi ciąg bodzców w tzw. serii malejącej (rozpoczynając od natężeń zdecydowanie powyżej progu) i rosnącej (rozpoczynając od bodzców niesłyszalnych). Po przeprowadzeniu kilku serii na przemian uzyskuje się wypadkowy próg absolutny jako średnią wartość progów otrzymanych dla wszystkich serii. " Charakterystyczną cechą metody dostrajania jest to, że słuchacz sam dobiera natężenie bodzca w czasie eksperymentu. Ponadto natężenie zmienia się w sposób ciągły. W każdej kolejnej serii pomiarowej eksperymentator powinien zmienić początkową wartość natężenia bodzca. Zarówno tę, jak i poprzednią metodę można stosować do wyznaczania progu dyskryminacji natężenia. W tym wypadku dopasowując natężenie, aż do uzyskania wrażenia zrównania ich głośności. 58. Czego dotyczy statystyczna teoria detekcji? Co reprezentuje krzywa ROC? Teoria detekcji zakłada, że decyzje dotyczące detekcji sygnału zależą od wartości pewnej zmiennej losowej x, której natura nie jest ściśle sprecyzowana. Zakłada się, że wartość średnia tej zmiennej rośnie monotonicznie wraz ze wzrostem natężenia bodzca. Teoria detekcji pozwala odróżnić reakcje słuchacza wynikające z czynników czysto sensorycznych od pozostałych. Krzywa ROC (charakterystyka funkcjonowania odbiornika) reprezentuje zależność między względną liczbą trafień (poprawnego wykrycia sygnału) danego słuchacza, a względną liczbą fałszywych alarmów (wykrycia niesłyszalnego sygnału). 59. Co to jest wskaznik detekcji d ? d jest miarą wrażliwości systemu słuchowego na sygnał (miarą wykrywalności sygnału) i wskazuje na zdolność słuchacza do odróżnienia sygnału od szumu w tym sensie, że im zdolność jest lepsza, tym wartość d jest większa. Miara ma charakter obiektywny i jest definiowana jako: S - N d'= ,
N gdzie S wartość średnia sygnału, N wartość średnia szumu, N odchylenie standardowe szumu. 60. Jakie typowe paradygmaty układu bodzców są stosowane w pomiarach psychoakustycznych prowadzonych z udziałem słuchaczy? Procedura TAK / NIE Procedura 2AFC - Two Alternative Forced Choice Procedura n-AFC - n Alternative Forced Choice Procedura "same-different" 61. Na czym polegają procedury adaptacyjne stosowane w pomiarach słuchu? Procedury adaptacyjne charakteryzują się tym, że przebieg eksperymentu zależy od odpowiedzi słuchacza. Procedury te charakteryzują się dużą efektywnością, gdyż większość pomiarów koncentruje się w obszarze progowym. Warunkiem ich stosowania jest spełnienie założenia, że prawdopodobieństwo poprawnej odpowiedzi wzrasta monotonicznie wraz ze wzrostem natężenia bodzca. Eksperyment oparty na procedurze adaptacyjnej polega na szybkim zawężeniu przedziału zmienności ocenianej wielkości do wartości okołoprogowych. Rozpoczyna się go od takiej wartości, dla której uzyskuje się odpowiedz poprawną. Przez stopniowe zmniejszanie wartości tego natężenia dochodzi się do odpowiedzi niepoprawnej. Wówczas ponownie zwiększa się wartość natężenia, aż do usłyszenia poprawnej odpowiedzi.