This version is available at https://doi.org/10.14279/depositonce-8677
Copyright applies. A non-exclusive, non-transferable and limited
right to use is granted. This document is intended solely for
personal, non-commercial use.
Terms of Use
Kokabi, O.; Brinkmann, F.; Weinzierl, Stefan (2018): Automatische Segmentierung binauraler
Raumimpulsantworten für die Modellierung von Sprachverständlichkeit. In: Fortschritte der Akustik -
DAGA 2018 : 44. Jahrestagung für Akustik, 19.-22. März 2018 in München. Berlin: Deutsche Gesellschaft
für Akustik e.V., 2018. pp. 509–512.
Omid Kokabi, Fabian Brinkmann, Stefan Weinzierl
Automatische Segmentierung binauraler
Raumimpulsantworten für die
Modellierun
g
von Sprachverständlichkeit
Published versionConference paper |
Automatische Segmentierung binauraler Raumimpulsantworten
f¨
ur die Modellierung von Sprachverst¨
andlichkeit
Omid Kokabi, Fabian Brinkmann, Stefan Weinzierl
kokabi@campus.tu-berlin.de, {fabian.brinkmann, stefan.weinzierl}@tu-berlin.de
Audio Communication Group, Technische Universit¨
at Berlin, Einsteinufer 17c, 10587, Berlin
Einleitung
Die beiden zentralen Wahrnehmungsaspekte binauraler
Sprachwahrnehmung sind better-ear listening und binau-
ral unmasking. Better-ear listening beschreibt den Um-
stand, dass bei der Wahrnehmung von Sprache maßgeb-
lich das Ohrsignal ausgewertet wird, das den h¨
oheren In-
formationsgehalt aufweist. In Anwesenheit zus¨
atzlicher,
konkurrierender St¨
orquellen – worunter auch einzel-
ne starke Raumreflektionen des eigentlichen Sprachsi-
gnals fallen k¨
onnen – beschreibt binaural unmasking die
sich ergebende Verbesserung der Verst¨
andlichkeit. Diese
nimmt zu, je st¨
arker sich die beim Zuh¨
orer beobachteten
interauralen Zeit- und Pegelunterschiede (ITD/ ILD) von
Sprachquelle und St¨
orquelle unterscheiden.
Beim H¨
oren in geschlossenen R¨
aumen beeinflusst das
im Raum vorherrschende reflektierte Schallfeld zus¨
atzlich
die Verst¨
andlichkeit. Fr¨
uhe Raumreflektionen, die kurz
nach dem Direktschall eintreffen, f¨
uhren hierbei zu einer
Verbesserung der Verst¨
andlichkeit [1]. Sp¨
ate Raumreflek-
tionen bzw. diffuser Nachhall verursachen eine durch Ver-
schmierung der zeitlichen Struktur des Sprachsignals be-
dingte Verschlechterung der Verst¨
andlichkeit.
Erfolgreiche Modelle zur Vorhersage binauraler Sprach-
verst¨
andlichkeit bilden better-ear listening und binaural
unmasking mit hoher Genauigkeit nach [2, 3]. Better-
ear listening ist hierbei mittels Auswertung des Signal-
Rausch Verh¨
altnisses (SNR) beider Ohrsignale imple-
mentiert. Binaural unmasking wird nach dem Vor-
bild der Equalization-Cancellation (EC) Theorie model-
liert [4]. Als Eingangssignal f¨
ur die Vorhersagemodel-
le dient die den ¨
Ubertragungspfad von Sprachquelle zu
Empf¨
anger beschreibende binaurale Raumimpulsantwort
(BRIR) bzw. das beim Empf¨
anger eintreffende binaurale
Sprachsignal.
Abbildung 1: 3d Raummodell
Um den Einfluss von diffusem Nachhall in den genann-
ten Pr¨
adiktionsmodellen zu ber¨
ucksichtigen, wurde vor-
geschlagen, die BRIR in einen fr¨
uhen, n¨
utzlichen (engl.
useful) und einen sp¨
aten, nachteiligen (engl. detrimen-
tal) Anteil auzuteilen, bevor sie in das Pr¨
adiktionsmodell
eingeht [5]. Mit diesem Useful/Detrimental (U/D) An-
satz konnte der Pr¨
adiktionsfehler bei der Vorhersage von
Sprachverst¨
andlichkeit in geschlossenen R¨
aumen verrin-
gert [5], bzw. der st¨
orende Einfluss einer einzelnen Raum-
reflektion auf das Sprachsignal ¨
uberhaupt erst qualita-
tiv nachgebildet werden [6]. In einer weiteren Arbeit
wurde festgestellt, dass sich die U/D-Zeitgrenze auf den
Pr¨
adiktionsfehler auswirkt, wobei die geringsten Fehler
mit einer raumabh¨
angigen U/D-Zeitgrenze ereicht wur-
den [7]. In der vorliegenden Arbeit wurde der Zusammen-
hang von Raum, U/D-Zeitgrenze und Pr¨
adiktionsfehler
anhand eines Vergleichs gemessener und vorhergesag-
ter Sprachrezeptionsschwellen (SRTs) f¨
ur vier virtuelle,
nachhallbehaftete R¨
aume untersucht. Hierbei wurde der
mittlere Pr¨
adiktionsfehlerkonnte anhand einer Vorhersa-
ge der raumab¨
angigen U/D-Zeitgrenze durch raum- und
empf¨
angerabh¨
angige Aspekte verringert. Die vorgeschla-
gene Methodik l¨
asst sich auf beliebige R¨
aume und Quelle-
Empf¨
anger-Kombinationen ¨
ubertragen.
SRT Messung
Die hier betrachteten virtuellen R¨
aume basieren auf ei-
nem realen, mittelgroßen Auditorium, skaliert auf ein
Raumvolumen von V= 1000 m3. Durch Skalierung der
Raumabsorptionseigenschaften wurden vier geometrisch
identische R¨
aume mit systematisch variierter Nachhall-
zeit T20,m = 0,5 s, 1,0 s, 2,0 s und 4,0 s generiert.
Pro Raum wurde eine BRIR in RAVEN simuliert [8].
125 250 500 1000 2000 4000 8000 16000
f [Hz] →
0
1
2
3
4
5
6
Time [s]
T20
T20,m = 0.5s
T20,m = 1.0s
T20,m = 2.0s
T20,m = 4.0s
Abbildung 2: Am Empf¨
angerort ausgewertete Nachhallzeit-
verl¨
aufe f¨
ur die vier R¨
aume
DAGA 2018 München
509
0.5 1 2 4
T20,m [s]
10
12
14
16
18
20
22
24
26
28
30
SRT in Quiet / dBSPL
Measured
Predicted, U/D = 50ms
Predicted, U/D = 100ms
Abbildung 3: Gemessene und vorhergesagte SRTs mit raum-
unabh¨
angiger U/D-Zeitgrenze
Die Schallquelle mit Richtcharakteristik eines S¨
angers
(mittlerer Richtfaktor Qm≈1,5) befand sich hier-
bei im Bereich der B¨
uhne, der binaurale Empf¨
anger
im Zuh¨
orerbereich im Abstand von ca. d= 9 m, was
in etwa dem dreifachen Hallabstand entspricht [9]. Die
Raumgeometrie, sowie die Nachhallzeitverl¨
aufe an der
Empf¨
angerposition zeigen Abbildungen 1 und 2. F¨
ur die
vier R¨
aume wurden zun¨
achst mittels des Oldenburger
Satztests (OLSA) SRTs in Ruhe gemessen [10, 11, 12].
Das ist der Schalldruckpegel in dBSP L, der notwendig
ist, damit eine Person 50% eines gesprochenen Satzes ver-
steht, wobei eine Verschlechterung der Verst¨
andlichkeit
durch einem Anstieg des SRTs abgebildet wird. Die hier-
bei zum Einsatz kommenden Tests¨
atze bestehen aus je-
weils f¨
unf W¨
ortern mit fester, grammatikalisch korrekter
Syntax aber unvorhersagbarer Semantik. Der OLSA sieht
vor, dass der Versuchsperson pro Bedingung 30 Tests¨
atze
aus einem Korpus von 600 Tests¨
atzen vorgespielt wer-
den. Je nach Anzahl korrekt verstandener Worte wird
der Wiedergabepegel f¨
ur den nachfolgenden Satz nach ei-
ner vorgegebenen Adaptionsregel angepasst und konver-
giert bei einem Verst¨
andlichkeitsniveau von 50 %. Der
zugeh¨
orige Wiedergabeschalldruckpegel entspricht dem
SRT in Ruhe. Die Testbedingungen wurden durch Fal-
tung der OLSA-Tests¨
atze mit den simulierten BRIRs der
vier virtuellen R¨
aume generiert. Zus¨
atzlich wurden Au-
diogramme aller Versuchspersonen erhoben, um die ge-
messenen SRTs um interindividuelle Empfindlichkeitsun-
terschiede zu korrigieren. Am Versuch nahmen 18 nor-
malh¨
orende Personen teil (5 weiblich, Altersdurchschnitt
30,4 Jahre). Als Testumgebung diente der reflektionsar-
me Halbraum am Institut f¨
ur Technische Akustik der TU
Berlin.
SRT Pr¨
adiktion
Zur Vorhersage der gemessenen SRTs diente das
zug¨
angliche Pr¨
adiktionsmodell nach Jelfs [2, 13] und ei-
ner vom Autor implementierten Erweiterung nach dem
0.5 1 2 4
T20,m [s]
10
12
14
16
18
20
22
24
26
28
30
SRT in Quiet / dBSPL
Measured
Predicted, Optimum U/D
Predicted, U/D(IACCm)
Abbildung 4: Gemessene und vorhergesagte SRTs mit opti-
maler und vorhergesagter raumabh¨
angiger U/D-Zeitgrenze
U/D-Ansatz. Die Ausgabe des Pr¨
adiktionsmodells ist ein
Einzahlwert in dB, welcher als Gewinn an Signal-Rausch
Abstand zwischen binauralem H¨
oren mit Kopf gegen¨
uber
monauralem, omnidirektionalem H¨
oren ohne Kopf inter-
pretiert werden kann. Durch Invertierung und Mittel-
wertskalierung ¨
uber alle betrachteten Testbedingungen
k¨
onnen die vorhergesagten Modellausgabewerte mit ge-
messenen SRTs verglichen werden. Dieses Vorgehen wur-
de u.a. auch in [2] angewandt. Bedingt durch die Mit-
telwertskalierung lassen sich allerdings nur relative SRT-
Unterschiede zwischen verschiedenen Bedingungen kor-
rekt vorhersagen.
Der U/D-Ansatz wurde durch Multiplikation der gene-
rierten BRIRs mit einem fr¨
uhen und einem sp¨
aten Zeit-
fenster implementiert. Das fr¨
uhe Zeitfenster gewichtet al-
le Anteile der BRIR bis zur gew¨
unschten (um die Schal-
laufzeit bereinigte) U/D-Zeitgrenze mit 1. Ab der U/D-
Zeitgrenze wird die Gewichtung des fr¨
uhen Anteils ¨
uber
einer L¨
ange von 1 ms linear auf 0 reduziert. Das sp¨
ate
Zeitfenster beginnt bei der gew¨
unschten U/D-Zeitgrenze
mit einer Gewichtung von 0 und steigt dann linear ¨
uber
die Dauer von 1 ms auf 1 an und verbleibt dort bis zum
Ende der BRIR. Beide Zeitfenster summieren sich damit
zu 1. Fr¨
uher und sp¨
ater Anteil der BRIR werden sepa-
rat in das Modell eingegeben, wobei der fr¨
uhe Anteil als
Sprachsignal, der sp¨
ate Anteil als St¨
orquelle interpretiert
wird.
Raumunabh¨
angige U/D-Zeitgrenze
In Abbildung 3 sind die gemessenen SRTs sowie die mit
dem verwendeten Modell vorhergesagten SRTs f¨
ur alle
vier betrachteten R¨
aume dargestellt, wobei f¨
ur die Vor-
hersage zwei unterschiedliche, raumunabh¨
angige U/D-
Zeitgrenzen von 50 und 100 ms verwendet wurden. Es
zeigt sich, dass der gemessene und pr¨
adizierte SRT
in Ruhe mit zunehmender Nachhallzeit steigt. Aller-
dings ¨
ubersch¨
atzt die Pr¨
adiktion den tats¨
achlichen SRT-
DAGA 2018 München
510
Tabelle 1: Optimale U/D-Zeitgrenzen, raumakustische Parameter und vorhergesagte, raumabh¨
angige U/D-Zeitgrenzen
Condition Optimum
U/D-limits [ms]
Room acoustic parameters U/D-limit [ms] predicted by
D/R [dB] C80m[dB] IACCmD/R [dB] C80m[dB] IACCm
T20,m = 0.5 s 59 -1.6 6.4 0.43 62 61 57
T20,m = 1.0 s 90 -7.4 -0.7 0.22 97 97 99
T20,m = 2.0 s 142 -10.9 -4.9 0.08 118 118 127
T20,m = 4.0 s 122 -14.0 -8.7 0.06 136 137 131
Anstieg zwischen R¨
aumen mit Nachhallzeiten unterhalb
von T20,m = 2 s und untersch¨
atzt den SRT-Anstieg zwi-
schen den R¨
aumen mit T20,m = 2 s und T20,m = 4 s
Nachhallzeit. Der beobachtete Pr¨
adiktionsfehler ist da-
mit raumabh¨
angig, wobei die gr¨
oßten Abweichungen zwi-
schen Messung und Pr¨
adiktion bei geringen und mittle-
ren Nachhallzeiten im Bereich zwischen 1-2 s zu beob-
achten sind. Nachhall ist in diesen Bedingungen offen-
sichtlich weniger nachteilig als vom Model mit raumun-
abh¨
angiger U/D-Zeitgrenze interpretiert.
Zwei im Zusammenhang mit Nachhall relevante, raum-
abh¨
angige Wahrnehmungsaspekte die hierf¨
ur urs¨
achlich
sein k¨
onnten sind binaurale Nachhallunterdr¨
uckung und
Raumadaption. Beide Effekte beschreiben Beobachtun-
gen zu teilweiser Unterdr¨
uckung von Nachhall in der au-
ditorischen Verarbeitung durch binaurales H¨
oren (= bin-
aurale Nachhallunterdr¨
uckung) bzw. durch zeitliche Ad-
aption an den Nachhallkontext (= Raumadaption). In
beiden F¨
allen wurde deutliche Raumabh¨
angigkeiten be-
obachtet, wobei sich die st¨
arksten Unterdr¨
uckungseffekte
bei 1-2 s Nachhall gezeigt haben [14, 15, 16, 17]. In
R¨
aumen mit mehr bzw. weniger Nachhall verringerten
sich diese Unterdr¨
uckungseffekte. Beide Effekte k¨
onnen
vom verwendeten Pr¨
adiktionsmodell nicht abgebildet
werden. Bei Nachhallzeiten im Bereich 1-2 s wurden im
Experiment die gr¨
oßten Abweichungen hinsichtlich SRT-
Anstieg zwischen Messung und Pr¨
adiktion beobachtet.
Es wird geschlossen, dass diese beiden raumabh¨
angigen
Wahrnehmungsaspekte (teilweise) f¨
ur die beobachte-
ten Abweichungen zwischen Messung und Pr¨
adiktion
urs¨
achlich sind.
Raumabh¨
angige U/D-Zeitgrenzen
Um die genannten Wahrnehmungsaspekte zumindest
quantitativ im Modell zu ber¨
ucksichtigen wurde nun un-
tersucht, inwieweit sich raumabh¨
angige U/D-Zeitgrenzen
aus am Zuh¨
orerort beobachteten raumakustischen Para-
metern vorhersagen lassen. Lassen sich hierbei Zusam-
menh¨
ange finden, l¨
asst sich der U/D-Ansatz mit raum-
abh¨
angigen U/D-Zeitgrenzen auf beliebige R¨
aume bzw.
Quelle-Empf¨
anger Kombinationen anwenden.
Hierzu wurden zun¨
achst optimale U/D-Zeitgrenzen f¨
ur
jeden der vier betrachteten R¨
aume ermittelt, die zu einer
optimalen Nachbildung (mittlerer Betragsfehler MAE
<1 dB) der gemessenen SRTs mit dem verwendeten
Pr¨
adiktionsmodell f¨
uhren. Diese sind f¨
ur alle vier be-
trachteten R¨
aume in Tabelle 1, Spalte 2 abgebildet.
Im zweiten Schritt wurde eine Regressionsanalyse
durchgef¨
uhrt, wobei die ermittelten, optimalen U/D-
Zeitgrenzen als abh¨
angige Variable eingingen. Als un-
abh¨
angige Variable dienten an der Empf¨
angerposition
zus¨
atzlich ausgewertete raumakustische Parameter (Di-
rekt/Diffusschallverh¨
altnis D/R, mittleres Klarheitsmaß
C80mund mittlerer interauraler Kreuzkorrelationskoeffi-
zient IACCm). Letztere sind in Tabelle 1, Spalte 3-5 f¨
ur
alle vier betrachteten R¨
aume gelistet.
F¨
ur alle raumakustischen Parameter wurden signifikan-
te Regressionsgleichungen gefunden (F(1,70) >120,
p<.001), wobei die h¨
ochste Varianzaufkl¨
arung durch
IACCmerzielt wurde (IACCm:r2
adj. = 0.72; D/R:
r2
adj. = 0.62; C80m:r2
adj. = 0.62). Die zugeh¨
origen Re-
gressionsgleichungen lauten: U/D = 143 – 201 (IACCm)
ms, U/D = 52.1 – 6.0 (D/R) ms, und U/D =
93.4 – 5.0 (C80m) ms. Die Standardfehler liegen bei
19 ms (IACCm), bzw. 21 ms (D/R und C80m). Die
mit diesen Regressionsgleichungen aus den raumakusti-
schen Parametern vorhergesagten raumabh¨
angigen U/D-
Zeitgrenzen sind in Tabelle 1, Spalte 6-8 gelistet. In Ab-
bildung 4 sind die gemessenen, sowie die mit dem ver-
wendeten Modell vorhergesagten SRTs f¨
ur alle vier be-
trachteten R¨
aume dargestellt. F¨
ur die Vorhersage wur-
den die mittels IACCmvorhergesagten raumabh¨
angigen
U/D-Zeitgrenzen verwendet. Zudem sind die pr¨
adizierten
SRTs mit optimalen U/D-Zeitgrenzen, die in Regressi-
onsanalyse als abh¨
angige Variable eingingen, dargestellt.
Wie aus Abbildung 4 hervorgeht, verringert sich der
Pr¨
adiktionsfehler bei Verwendung der raumabh¨
angigen
U/D-Zeitgrenzen im Vergleich zur Vorhersage mit
raumunabh¨
angigen U/D-Zeitgrenzen. Der mittlere Be-
tragsfehler (MAE) in dB ¨
uber alle vier betrachte-
ten R¨
aume mit raumunabh¨
angiger und mittels raum-
akustischer Parameter vorhergesagter raumabh¨
angiger
U/D-Zeitgrenzen ist in Tabelle 2 dargestellt. Zus¨
atzlich
wurde die gleiche Methodik auf zwei Testbedingungen
(S0/S90) ´a 4 Quelle-Empf¨
anger Kombinationen eines ex-
ternen Datensatzes [5], nachfolgend RS11 genannt, ange-
wandt. F¨
ur die Vorhersage der raumabh¨
angigen U/D-
Zeitgrenzen wurden in diesem Fall ebenfalls die im
Experiment ermittelten Regressionsgleichungen verwen-
det. Wie aus Tabelle 2 hervorgeht, l¨
asst sich der mitt-
lere Pr¨
adiktionsfehler mit den vorhergesagten, raum-
abh¨
angigen U/D-Zeitgrenzen sowohl f¨
ur die vier be-
trachteten R¨
aume im Experiment, als auch f¨
ur die acht
verschiedene Quelle-Empf¨
anger Kombinationen in einem
virtuellen Raum mit ca. 2 s Nachhall (RS11) reduzieren.
DAGA 2018 München
511
Tabelle 2: Mittlerer Betragsfehler (MAE) in dB mit raumunabh¨
angigen und raumabh¨
angigen U/D-Zeitgrenzen
MAE [dB] with
fixed U/D-limits [ms]
MAE [dB] with room/ receiver dependent U/D-limits
predicted by
50 100 D/R (r2
adj. = 0.62) C80m(r2
adj. = 0.62) IACCm(r2
adj. = 0.72)
Experiment 1.9 2.9 1.3 1.3 1.2
RS11 data (S0/S90) 2.6/2.5 2.0/ 2.2 1.2/ 1.1 1.5/ 2.0 0.4/ 1.5
Ø 2.3 2.4 1.2 1.6 1.0
Zusammenfassung
Zwei, im Zusammenhang mit Nachhall relevante
raum- bzw. empf¨
angerabh¨
angige Wahrnehmungsaspek-
te (binaurale Nachhallunterdr¨
uckung und Raumadap-
tion) hatten mutmaßlich Einfluss auf die gemessenen
SRTs. Beide Wahrnehmungsaspekte werden im aktuel-
len Pr¨
adiktionsmodell nicht ber¨
ucksichtigt. Die Raum-
abh¨
angigkeit beider Aspekte f¨
uhrt zu einem beobachte-
ten raumabh¨
angigen Pr¨
adiktionsfehler. Mittels raum-/
empf¨
angerabh¨
angiger U/D-Zeitgrenze, vorhergesagt aus
am Empf¨
anger beobachteten raumakustischen Parame-
tern l¨
asst sich dieser Pr¨
adiktionsfehler teilweise kompen-
sieren. Der mittlere Pr¨
adiktionsfehler verringert sich da-
durch um 1,3 – 1,4 dB.
Literatur
[1] Bradley, J. S.; Hiroshi Sato und M. Picard (2003): ”On
the importance of early reflections for speech in rooms.”
In: The Journal of the Acoustical Society of America,
113(6) S. 3233–3244.
[2] Jelfs, Sam; John F. Culling und Mathieu Lavandier
(2011): ”Revision and validation of a binaural model
for speech intelligibility in noise.” In: Hearing research,
275(1) S. 96–104.
[3] Beutelmann, Rainer; Thomas Brand und Birger Kollmei-
er (2010): ”Revision, extension, and evaluation of a bi-
naural speech intelligibility model.” In: The Journal of
the Acoustical Society of America, 127(4) S. 2479–2497.
[4] Durlach, Nathaniel I. (1963): ”Equalization and Cancel-
lation Theory of Binaural Masking-Level Differences.”
In: The Journal of the Acoustical Society of America,
35(8) S. 1206–1218.
[5] Rennies, Jan; Thomas Brand und Birger Kollmeier
(2011): ”Prediction of the influence of reverberation on
binaural speech intelligibility in noise and in quiet.” In:
The Journal of the Acoustical Society of America, 130(5)
S. 2999–3012.
[6] Rennies, Jan (2014): ”Modeling the effects of a single re-
flection on binaural speech intelligibility.” In: The Jour-
nal of the Acoustical Society of America, 135(3) S. 1556–
1567. doi:10.1121/1.4863197.
[7] Lecl`ere, Thibaud; Mathieu Lavandier und John F. Cul-
ling (2015): ”Speech intelligibility prediction in reverbe-
ration: Towards an integrated model of speech transmis-
sion, spatial unmasking, and binaural de-reverberation.”
In: The Journal of the Acoustical Society of America,
137(6) S. 3335–3345.
[8] Schr¨
oder, Dirk und Michael Vorl¨
ander (2011): ”RAVEN:
A real-time framework for the auralization of interactive
virtual environments.” In: Forum Acusticum.
[9] Brinkmann, Fabian et al. (2017): ”A High Resolution and
Full-Spherical Head-Related Transfer Function Database
for Different Head-Above-Torso Orientations.” In: Jour-
nal of the Audio Engineering Society, 65(10) S. 841–848.
[10] Kuehnel, Volker; Birger Kollmeier und Kirsten Wagener
(1999): ”Entwicklung und Evaluation eines Satztests f¨
ur
die deutsche Sprache I: Design des Oldenburger Satz-
tests.” In: Zeitschrift f¨
ur Audiologie, 38 S. 4–15.
[11] Wagener, Kirsten; Thomas Brand und Birger Kollmei-
er (1999): ”Entwicklung und Evaluation eines Satztests
f¨
ur die deutsche Sprache II: Optimierung des Oldenbur-
ger Satztests.” In: Zeitschrift f¨
ur Audiologie/Audiological
Acoustics, 38 S. 44–56.
[12] Wagener, K.; T. Brand und B. Kollmeier (1999): ”Ent-
wicklung und Evaluation eines Satztests f¨
ur die deut-
sche Sprache III: Evaluation des Oldenburger Satztests.”
In: Zeitschrift fr Audiologie/Audiological Acoustics, 38 S.
8695.
[13] Søndergaard, P. und P. Majdak (2013): ”The Auditory
Modeling Toolbox.” In: The Technology of Binaural Li-
stening. Berlin, Heidelberg: Springer, S. 33–56.
[14] Gelfand, S. A. und I. Hochberg (1976): ”Binaural and
monaural speech discrimination under reverberation.”
In: Audiology, 15(1) S. 72–84.
[15] Moncur, John P. und Donald Dirks (1967): ”Binaural
and monaural speech intelligibility in reverberation.” In:
Journal of speech and hearing research, 10(2) S. 186–195.
[16] N´abˇelek, Anna K. und Pauline K. Robinson (1982): ”Mo-
naural and binaural speech perception in reverberation
for listeners of various ages.” In: The Journal of the
Acoustical Society of America, 71(5) S. 1242–1248.
[17] Zahorik, Pavel und Eugene J. Brandewie (2016): ”Speech
intelligibility in rooms: Effect of prior listening exposure
interacts with room acoustics.” In: The Journal of the
Acoustical Society of America, 140(1) S. 74–86.
DAGA 2018 München
512