Document [original]

This version is available at https://doi.org/10.14279/depositonce-8677

right to use is granted. This document is intended solely for

personal, non-commercial use.

Kokabi, O.; Brinkmann, F.; Weinzierl, Stefan (2018): Automatische Segmentierung binauraler

Raumimpulsantworten für die Modellierung von Sprachverständlichkeit. In: Fortschritte der Akustik -

DAGA 2018 : 44. Jahrestagung für Akustik, 19.-22. März 2018 in München. Berlin: Deutsche Gesellschaft

für Akustik e.V., 2018. pp. 509–512.

Omid Kokabi, Fabian Brinkmann, Stefan Weinzierl

Automatische Segmentierung binauraler

Raumimpulsantworten für die

Modellierun

von Sprachverständlichkeit

Published versionConference paper |

Automatische Segmentierung binauraler Raumimpulsantworten

f¨

ur die Modellierung von Sprachverst¨

andlichkeit

Omid Kokabi, Fabian Brinkmann, Stefan Weinzierl

kokabi@campus.tu-berlin.de, {fabian.brinkmann, stefan.weinzierl}@tu-berlin.de

Audio Communication Group, Technische Universit¨

at Berlin, Einsteinufer 17c, 10587, Berlin

Einleitung

Die beiden zentralen Wahrnehmungsaspekte binauraler

Sprachwahrnehmung sind better-ear listening und binau-

ral unmasking. Better-ear listening beschreibt den Um-

stand, dass bei der Wahrnehmung von Sprache maßgeb-

lich das Ohrsignal ausgewertet wird, das den h¨

oheren In-

formationsgehalt aufweist. In Anwesenheit zus¨

atzlicher,

konkurrierender St¨

orquellen – worunter auch einzel-

ne starke Raumreflektionen des eigentlichen Sprachsi-

gnals fallen k¨

onnen – beschreibt binaural unmasking die

sich ergebende Verbesserung der Verst¨

andlichkeit. Diese

nimmt zu, je st¨

arker sich die beim Zuh¨

orer beobachteten

interauralen Zeit- und Pegelunterschiede (ITD/ ILD) von

Sprachquelle und St¨

orquelle unterscheiden.

Beim H¨

oren in geschlossenen R¨

aumen beeinflusst das

im Raum vorherrschende reflektierte Schallfeld zus¨

atzlich

die Verst¨

andlichkeit. Fr¨

uhe Raumreflektionen, die kurz

nach dem Direktschall eintreffen, f¨

uhren hierbei zu einer

Verbesserung der Verst¨

andlichkeit [1]. Sp¨

ate Raumreflek-

tionen bzw. diffuser Nachhall verursachen eine durch Ver-

schmierung der zeitlichen Struktur des Sprachsignals be-

dingte Verschlechterung der Verst¨

andlichkeit.

Erfolgreiche Modelle zur Vorhersage binauraler Sprach-

verst¨

andlichkeit bilden better-ear listening und binaural

unmasking mit hoher Genauigkeit nach [2, 3]. Better-

ear listening ist hierbei mittels Auswertung des Signal-

Rausch Verh¨

altnisses (SNR) beider Ohrsignale imple-

mentiert. Binaural unmasking wird nach dem Vor-

bild der Equalization-Cancellation (EC) Theorie model-

liert [4]. Als Eingangssignal f¨

ur die Vorhersagemodel-

le dient die den ¨

Ubertragungspfad von Sprachquelle zu

Empf¨

anger beschreibende binaurale Raumimpulsantwort

(BRIR) bzw. das beim Empf¨

anger eintreffende binaurale

Sprachsignal.

Abbildung 1: 3d Raummodell

Um den Einfluss von diffusem Nachhall in den genann-

ten Pr¨

adiktionsmodellen zu ber¨

ucksichtigen, wurde vor-

geschlagen, die BRIR in einen fr¨

uhen, n¨

utzlichen (engl.

useful) und einen sp¨

aten, nachteiligen (engl. detrimen-

tal) Anteil auzuteilen, bevor sie in das Pr¨

adiktionsmodell

eingeht [5]. Mit diesem Useful/Detrimental (U/D) An-

satz konnte der Pr¨

adiktionsfehler bei der Vorhersage von

Sprachverst¨

andlichkeit in geschlossenen R¨

aumen verrin-

gert [5], bzw. der st¨

orende Einfluss einer einzelnen Raum-

reflektion auf das Sprachsignal ¨

uberhaupt erst qualita-

tiv nachgebildet werden [6]. In einer weiteren Arbeit

wurde festgestellt, dass sich die U/D-Zeitgrenze auf den

Pr¨

adiktionsfehler auswirkt, wobei die geringsten Fehler

mit einer raumabh¨

angigen U/D-Zeitgrenze ereicht wur-

den [7]. In der vorliegenden Arbeit wurde der Zusammen-

hang von Raum, U/D-Zeitgrenze und Pr¨

adiktionsfehler

anhand eines Vergleichs gemessener und vorhergesag-

ter Sprachrezeptionsschwellen (SRTs) f¨

ur vier virtuelle,

nachhallbehaftete R¨

aume untersucht. Hierbei wurde der

mittlere Pr¨

adiktionsfehlerkonnte anhand einer Vorhersa-

ge der raumab¨

angigen U/D-Zeitgrenze durch raum- und

empf¨

angerabh¨

angige Aspekte verringert. Die vorgeschla-

gene Methodik l¨

asst sich auf beliebige R¨

aume und Quelle-

Empf¨

anger-Kombinationen ¨

ubertragen.

SRT Messung

Die hier betrachteten virtuellen R¨

aume basieren auf ei-

nem realen, mittelgroßen Auditorium, skaliert auf ein

Raumvolumen von V= 1000 m3. Durch Skalierung der

Raumabsorptionseigenschaften wurden vier geometrisch

identische R¨

aume mit systematisch variierter Nachhall-

zeit T20,m = 0,5 s, 1,0 s, 2,0 s und 4,0 s generiert.

Pro Raum wurde eine BRIR in RAVEN simuliert [8].

125 250 500 1000 2000 4000 8000 16000

f [Hz] →

Time [s]

T20

T20,m = 0.5s

T20,m = 1.0s

T20,m = 2.0s

T20,m = 4.0s

Abbildung 2: Am Empf¨

angerort ausgewertete Nachhallzeit-

verl¨

aufe f¨

ur die vier R¨

aume

DAGA 2018 München

509

0.5 1 2 4

T20,m [s]

SRT in Quiet / dBSPL

Measured

Predicted, U/D = 50ms

Predicted, U/D = 100ms

Abbildung 3: Gemessene und vorhergesagte SRTs mit raum-

unabh¨

angiger U/D-Zeitgrenze

Die Schallquelle mit Richtcharakteristik eines S¨

angers

(mittlerer Richtfaktor Qm≈1,5) befand sich hier-

bei im Bereich der B¨

uhne, der binaurale Empf¨

anger

im Zuh¨

orerbereich im Abstand von ca. d= 9 m, was

in etwa dem dreifachen Hallabstand entspricht [9]. Die

Raumgeometrie, sowie die Nachhallzeitverl¨

aufe an der

Empf¨

angerposition zeigen Abbildungen 1 und 2. F¨

ur die

vier R¨

aume wurden zun¨

achst mittels des Oldenburger

Satztests (OLSA) SRTs in Ruhe gemessen [10, 11, 12].

Das ist der Schalldruckpegel in dBSP L, der notwendig

ist, damit eine Person 50% eines gesprochenen Satzes ver-

steht, wobei eine Verschlechterung der Verst¨

andlichkeit

durch einem Anstieg des SRTs abgebildet wird. Die hier-

bei zum Einsatz kommenden Tests¨

atze bestehen aus je-

weils f¨

unf W¨

ortern mit fester, grammatikalisch korrekter

Syntax aber unvorhersagbarer Semantik. Der OLSA sieht

vor, dass der Versuchsperson pro Bedingung 30 Tests¨

atze

aus einem Korpus von 600 Tests¨

atzen vorgespielt wer-

den. Je nach Anzahl korrekt verstandener Worte wird

der Wiedergabepegel f¨

ur den nachfolgenden Satz nach ei-

ner vorgegebenen Adaptionsregel angepasst und konver-

giert bei einem Verst¨

andlichkeitsniveau von 50 %. Der

zugeh¨

orige Wiedergabeschalldruckpegel entspricht dem

SRT in Ruhe. Die Testbedingungen wurden durch Fal-

tung der OLSA-Tests¨

atze mit den simulierten BRIRs der

vier virtuellen R¨

aume generiert. Zus¨

atzlich wurden Au-

diogramme aller Versuchspersonen erhoben, um die ge-

messenen SRTs um interindividuelle Empfindlichkeitsun-

terschiede zu korrigieren. Am Versuch nahmen 18 nor-

malh¨

orende Personen teil (5 weiblich, Altersdurchschnitt

30,4 Jahre). Als Testumgebung diente der reflektionsar-

me Halbraum am Institut f¨

ur Technische Akustik der TU

Berlin.

SRT Pr¨

adiktion

Zur Vorhersage der gemessenen SRTs diente das

zug¨

angliche Pr¨

adiktionsmodell nach Jelfs [2, 13] und ei-

ner vom Autor implementierten Erweiterung nach dem

0.5 1 2 4

T20,m [s]

SRT in Quiet / dBSPL

Measured

Predicted, Optimum U/D

Predicted, U/D(IACCm)

Abbildung 4: Gemessene und vorhergesagte SRTs mit opti-

maler und vorhergesagter raumabh¨

angiger U/D-Zeitgrenze

U/D-Ansatz. Die Ausgabe des Pr¨

adiktionsmodells ist ein

Einzahlwert in dB, welcher als Gewinn an Signal-Rausch

Abstand zwischen binauralem H¨

oren mit Kopf gegen¨

uber

monauralem, omnidirektionalem H¨

oren ohne Kopf inter-

pretiert werden kann. Durch Invertierung und Mittel-

wertskalierung ¨

uber alle betrachteten Testbedingungen

k¨

onnen die vorhergesagten Modellausgabewerte mit ge-

messenen SRTs verglichen werden. Dieses Vorgehen wur-

de u.a. auch in [2] angewandt. Bedingt durch die Mit-

telwertskalierung lassen sich allerdings nur relative SRT-

Unterschiede zwischen verschiedenen Bedingungen kor-

rekt vorhersagen.

Der U/D-Ansatz wurde durch Multiplikation der gene-

rierten BRIRs mit einem fr¨

uhen und einem sp¨

aten Zeit-

fenster implementiert. Das fr¨

uhe Zeitfenster gewichtet al-

le Anteile der BRIR bis zur gew¨

unschten (um die Schal-

laufzeit bereinigte) U/D-Zeitgrenze mit 1. Ab der U/D-

Zeitgrenze wird die Gewichtung des fr¨

uhen Anteils ¨

uber

einer L¨

ange von 1 ms linear auf 0 reduziert. Das sp¨

ate

Zeitfenster beginnt bei der gew¨

unschten U/D-Zeitgrenze

mit einer Gewichtung von 0 und steigt dann linear ¨

uber

die Dauer von 1 ms auf 1 an und verbleibt dort bis zum

Ende der BRIR. Beide Zeitfenster summieren sich damit

zu 1. Fr¨

uher und sp¨

ater Anteil der BRIR werden sepa-

rat in das Modell eingegeben, wobei der fr¨

uhe Anteil als

Sprachsignal, der sp¨

ate Anteil als St¨

orquelle interpretiert

wird.

Raumunabh¨

angige U/D-Zeitgrenze

In Abbildung 3 sind die gemessenen SRTs sowie die mit

dem verwendeten Modell vorhergesagten SRTs f¨

ur alle

vier betrachteten R¨

aume dargestellt, wobei f¨

ur die Vor-

hersage zwei unterschiedliche, raumunabh¨

angige U/D-

Zeitgrenzen von 50 und 100 ms verwendet wurden. Es

zeigt sich, dass der gemessene und pr¨

adizierte SRT

in Ruhe mit zunehmender Nachhallzeit steigt. Aller-

dings ¨

ubersch¨

atzt die Pr¨

adiktion den tats¨

achlichen SRT-

DAGA 2018 München

510

Tabelle 1: Optimale U/D-Zeitgrenzen, raumakustische Parameter und vorhergesagte, raumabh¨

angige U/D-Zeitgrenzen

Condition Optimum

U/D-limits [ms]

Room acoustic parameters U/D-limit [ms] predicted by

D/R [dB] C80m[dB] IACCmD/R [dB] C80m[dB] IACCm

T20,m = 0.5 s 59 -1.6 6.4 0.43 62 61 57

T20,m = 1.0 s 90 -7.4 -0.7 0.22 97 97 99

T20,m = 2.0 s 142 -10.9 -4.9 0.08 118 118 127

T20,m = 4.0 s 122 -14.0 -8.7 0.06 136 137 131

Anstieg zwischen R¨

aumen mit Nachhallzeiten unterhalb

von T20,m = 2 s und untersch¨

atzt den SRT-Anstieg zwi-

schen den R¨

aumen mit T20,m = 2 s und T20,m = 4 s

Nachhallzeit. Der beobachtete Pr¨

adiktionsfehler ist da-

mit raumabh¨

angig, wobei die gr¨

oßten Abweichungen zwi-

schen Messung und Pr¨

adiktion bei geringen und mittle-

ren Nachhallzeiten im Bereich zwischen 1-2 s zu beob-

achten sind. Nachhall ist in diesen Bedingungen offen-

sichtlich weniger nachteilig als vom Model mit raumun-

abh¨

angiger U/D-Zeitgrenze interpretiert.

Zwei im Zusammenhang mit Nachhall relevante, raum-

abh¨

angige Wahrnehmungsaspekte die hierf¨

ur urs¨

achlich

sein k¨

onnten sind binaurale Nachhallunterdr¨

uckung und

Raumadaption. Beide Effekte beschreiben Beobachtun-

gen zu teilweiser Unterdr¨

uckung von Nachhall in der au-

ditorischen Verarbeitung durch binaurales H¨

oren (= bin-

aurale Nachhallunterdr¨

uckung) bzw. durch zeitliche Ad-

aption an den Nachhallkontext (= Raumadaption). In

beiden F¨

allen wurde deutliche Raumabh¨

angigkeiten be-

obachtet, wobei sich die st¨

arksten Unterdr¨

uckungseffekte

bei 1-2 s Nachhall gezeigt haben [14, 15, 16, 17]. In

R¨

aumen mit mehr bzw. weniger Nachhall verringerten

sich diese Unterdr¨

uckungseffekte. Beide Effekte k¨

onnen

vom verwendeten Pr¨

adiktionsmodell nicht abgebildet

werden. Bei Nachhallzeiten im Bereich 1-2 s wurden im

Experiment die gr¨

oßten Abweichungen hinsichtlich SRT-

Anstieg zwischen Messung und Pr¨

adiktion beobachtet.

Es wird geschlossen, dass diese beiden raumabh¨

angigen

Wahrnehmungsaspekte (teilweise) f¨

ur die beobachte-

ten Abweichungen zwischen Messung und Pr¨

adiktion

urs¨

achlich sind.

Raumabh¨

angige U/D-Zeitgrenzen

Um die genannten Wahrnehmungsaspekte zumindest

quantitativ im Modell zu ber¨

ucksichtigen wurde nun un-

tersucht, inwieweit sich raumabh¨

angige U/D-Zeitgrenzen

aus am Zuh¨

orerort beobachteten raumakustischen Para-

metern vorhersagen lassen. Lassen sich hierbei Zusam-

menh¨

ange finden, l¨

asst sich der U/D-Ansatz mit raum-

abh¨

angigen U/D-Zeitgrenzen auf beliebige R¨

aume bzw.

Quelle-Empf¨

anger Kombinationen anwenden.

Hierzu wurden zun¨

achst optimale U/D-Zeitgrenzen f¨

jeden der vier betrachteten R¨

aume ermittelt, die zu einer

optimalen Nachbildung (mittlerer Betragsfehler MAE

<1 dB) der gemessenen SRTs mit dem verwendeten

Pr¨

adiktionsmodell f¨

uhren. Diese sind f¨

ur alle vier be-

trachteten R¨

aume in Tabelle 1, Spalte 2 abgebildet.

Im zweiten Schritt wurde eine Regressionsanalyse

durchgef¨

uhrt, wobei die ermittelten, optimalen U/D-

Zeitgrenzen als abh¨

angige Variable eingingen. Als un-

abh¨

angige Variable dienten an der Empf¨

angerposition

zus¨

atzlich ausgewertete raumakustische Parameter (Di-

rekt/Diffusschallverh¨

altnis D/R, mittleres Klarheitsmaß

C80mund mittlerer interauraler Kreuzkorrelationskoeffi-

zient IACCm). Letztere sind in Tabelle 1, Spalte 3-5 f¨

alle vier betrachteten R¨

aume gelistet.

F¨

ur alle raumakustischen Parameter wurden signifikan-

te Regressionsgleichungen gefunden (F(1,70) >120,

p<.001), wobei die h¨

ochste Varianzaufkl¨

arung durch

IACCmerzielt wurde (IACCm:r2

adj. = 0.72; D/R:

adj. = 0.62; C80m:r2

adj. = 0.62). Die zugeh¨

origen Re-

gressionsgleichungen lauten: U/D = 143 – 201 (IACCm)

ms, U/D = 52.1 – 6.0 (D/R) ms, und U/D =

93.4 – 5.0 (C80m) ms. Die Standardfehler liegen bei

19 ms (IACCm), bzw. 21 ms (D/R und C80m). Die

mit diesen Regressionsgleichungen aus den raumakusti-

schen Parametern vorhergesagten raumabh¨

angigen U/D-

Zeitgrenzen sind in Tabelle 1, Spalte 6-8 gelistet. In Ab-

bildung 4 sind die gemessenen, sowie die mit dem ver-

wendeten Modell vorhergesagten SRTs f¨

ur alle vier be-

trachteten R¨

aume dargestellt. F¨

ur die Vorhersage wur-

den die mittels IACCmvorhergesagten raumabh¨

angigen

U/D-Zeitgrenzen verwendet. Zudem sind die pr¨

adizierten

SRTs mit optimalen U/D-Zeitgrenzen, die in Regressi-

onsanalyse als abh¨

angige Variable eingingen, dargestellt.

Wie aus Abbildung 4 hervorgeht, verringert sich der

Pr¨

adiktionsfehler bei Verwendung der raumabh¨

angigen

U/D-Zeitgrenzen im Vergleich zur Vorhersage mit

raumunabh¨

angigen U/D-Zeitgrenzen. Der mittlere Be-

tragsfehler (MAE) in dB ¨

uber alle vier betrachte-

ten R¨

aume mit raumunabh¨

angiger und mittels raum-

akustischer Parameter vorhergesagter raumabh¨

angiger

U/D-Zeitgrenzen ist in Tabelle 2 dargestellt. Zus¨

atzlich

wurde die gleiche Methodik auf zwei Testbedingungen

(S0/S90) ´a 4 Quelle-Empf¨

anger Kombinationen eines ex-

ternen Datensatzes [5], nachfolgend RS11 genannt, ange-

wandt. F¨

ur die Vorhersage der raumabh¨

angigen U/D-

Zeitgrenzen wurden in diesem Fall ebenfalls die im

Experiment ermittelten Regressionsgleichungen verwen-

det. Wie aus Tabelle 2 hervorgeht, l¨

asst sich der mitt-

lere Pr¨

adiktionsfehler mit den vorhergesagten, raum-

abh¨

angigen U/D-Zeitgrenzen sowohl f¨

ur die vier be-

trachteten R¨

aume im Experiment, als auch f¨

ur die acht

verschiedene Quelle-Empf¨

anger Kombinationen in einem

virtuellen Raum mit ca. 2 s Nachhall (RS11) reduzieren.

DAGA 2018 München

511

Tabelle 2: Mittlerer Betragsfehler (MAE) in dB mit raumunabh¨

angigen und raumabh¨

angigen U/D-Zeitgrenzen

MAE [dB] with

fixed U/D-limits [ms]

MAE [dB] with room/ receiver dependent U/D-limits

predicted by

50 100 D/R (r2

adj. = 0.62) C80m(r2

adj. = 0.62) IACCm(r2

adj. = 0.72)

Experiment 1.9 2.9 1.3 1.3 1.2

RS11 data (S0/S90) 2.6/2.5 2.0/ 2.2 1.2/ 1.1 1.5/ 2.0 0.4/ 1.5

Ø 2.3 2.4 1.2 1.6 1.0

Zusammenfassung

Zwei, im Zusammenhang mit Nachhall relevante

raum- bzw. empf¨

angerabh¨

angige Wahrnehmungsaspek-

te (binaurale Nachhallunterdr¨

uckung und Raumadap-

tion) hatten mutmaßlich Einfluss auf die gemessenen

SRTs. Beide Wahrnehmungsaspekte werden im aktuel-

len Pr¨

adiktionsmodell nicht ber¨

ucksichtigt. Die Raum-

abh¨

angigkeit beider Aspekte f¨

uhrt zu einem beobachte-

ten raumabh¨

angigen Pr¨

adiktionsfehler. Mittels raum-/

empf¨

angerabh¨

angiger U/D-Zeitgrenze, vorhergesagt aus

am Empf¨

anger beobachteten raumakustischen Parame-

tern l¨

asst sich dieser Pr¨

adiktionsfehler teilweise kompen-

sieren. Der mittlere Pr¨

adiktionsfehler verringert sich da-

durch um 1,3 – 1,4 dB.

Literatur

[1] Bradley, J. S.; Hiroshi Sato und M. Picard (2003): ”On

the importance of early reflections for speech in rooms.”

In: The Journal of the Acoustical Society of America,

113(6) S. 3233–3244.

[2] Jelfs, Sam; John F. Culling und Mathieu Lavandier

(2011): ”Revision and validation of a binaural model

for speech intelligibility in noise.” In: Hearing research,

275(1) S. 96–104.

[3] Beutelmann, Rainer; Thomas Brand und Birger Kollmei-

er (2010): ”Revision, extension, and evaluation of a bi-

naural speech intelligibility model.” In: The Journal of

the Acoustical Society of America, 127(4) S. 2479–2497.

[4] Durlach, Nathaniel I. (1963): ”Equalization and Cancel-

lation Theory of Binaural Masking-Level Differences.”

In: The Journal of the Acoustical Society of America,

35(8) S. 1206–1218.

[5] Rennies, Jan; Thomas Brand und Birger Kollmeier

(2011): ”Prediction of the influence of reverberation on

binaural speech intelligibility in noise and in quiet.” In:

The Journal of the Acoustical Society of America, 130(5)

S. 2999–3012.

[6] Rennies, Jan (2014): ”Modeling the effects of a single re-

flection on binaural speech intelligibility.” In: The Jour-

nal of the Acoustical Society of America, 135(3) S. 1556–

1567. doi:10.1121/1.4863197.

[7] Lecl`ere, Thibaud; Mathieu Lavandier und John F. Cul-

ling (2015): ”Speech intelligibility prediction in reverbe-

ration: Towards an integrated model of speech transmis-

sion, spatial unmasking, and binaural de-reverberation.”

In: The Journal of the Acoustical Society of America,

137(6) S. 3335–3345.

[8] Schr¨

oder, Dirk und Michael Vorl¨

ander (2011): ”RAVEN:

A real-time framework for the auralization of interactive

virtual environments.” In: Forum Acusticum.

[9] Brinkmann, Fabian et al. (2017): ”A High Resolution and

Full-Spherical Head-Related Transfer Function Database

for Different Head-Above-Torso Orientations.” In: Jour-

nal of the Audio Engineering Society, 65(10) S. 841–848.

[10] Kuehnel, Volker; Birger Kollmeier und Kirsten Wagener

(1999): ”Entwicklung und Evaluation eines Satztests f¨

die deutsche Sprache I: Design des Oldenburger Satz-

tests.” In: Zeitschrift f¨

ur Audiologie, 38 S. 4–15.

[11] Wagener, Kirsten; Thomas Brand und Birger Kollmei-

er (1999): ”Entwicklung und Evaluation eines Satztests

f¨

ur die deutsche Sprache II: Optimierung des Oldenbur-

ger Satztests.” In: Zeitschrift f¨

ur Audiologie/Audiological

Acoustics, 38 S. 44–56.

[12] Wagener, K.; T. Brand und B. Kollmeier (1999): ”Ent-

wicklung und Evaluation eines Satztests f¨

ur die deut-

sche Sprache III: Evaluation des Oldenburger Satztests.”

In: Zeitschrift fr Audiologie/Audiological Acoustics, 38 S.

8695.

[13] Søndergaard, P. und P. Majdak (2013): ”The Auditory

Modeling Toolbox.” In: The Technology of Binaural Li-

stening. Berlin, Heidelberg: Springer, S. 33–56.

[14] Gelfand, S. A. und I. Hochberg (1976): ”Binaural and

monaural speech discrimination under reverberation.”

In: Audiology, 15(1) S. 72–84.

[15] Moncur, John P. und Donald Dirks (1967): ”Binaural

and monaural speech intelligibility in reverberation.” In:

Journal of speech and hearing research, 10(2) S. 186–195.

[16] N´abˇelek, Anna K. und Pauline K. Robinson (1982): ”Mo-

naural and binaural speech perception in reverberation

for listeners of various ages.” In: The Journal of the

Acoustical Society of America, 71(5) S. 1242–1248.

[17] Zahorik, Pavel und Eugene J. Brandewie (2016): ”Speech

intelligibility in rooms: Effect of prior listening exposure

interacts with room acoustics.” In: The Journal of the

Acoustical Society of America, 140(1) S. 74–86.

DAGA 2018 München

512