scieee Science in your language
[eu] (orig)

Ahots sintetiko pertsonalizatuak: esperientzia baten deskribapena

Author: Hernáez Rioja, Inmaculada,Navas Cordón, Eva,Saratxaga Couceiro, Ibon,Sánchez de la Fuente, Jon
Publisher: Servicio Editorial de la Universidad del País Vasco/Euskal Herriko Unibertsitatearen Argitalpen Zerbitzua
Year: 2021
DOI: 10.1387/ekaia.22077
Source: https://addi.ehu.eus/bitstream/10810/57518/1/62504e5197f66.pdf
173
ISSN 0214-9001 – eISSN 2444-3255
ekaia
ZIENTZIA e a TEKNOLOGIA
ALDIZKARIA
Ekaia, ale be ezia 2021, 173-194
h ps://doi.o g/10.1387/ekaia.22077
* Ha emane an ja zeko / Co esponding au ho : Inmaculada He náez Rioja, HiTZ: Basque Cen e o Language Technolo-
gies - Aholab, Uni e si y o he Basque Coun y (UPV/EHU), Bilboko Ingenia i za Eskola I E aikina, To es Que edo Ingenia-
ia Plaza, 1 (48013 Bilbo, Espainia UPV/EHU Bilbo. Euskal He ia). – inma.he [email protected] – h ps://o cid.o g/0000-0003-
4447-7575.
Nola aipa u / How o ci e: He náez Rioja, Inmaculada; Na as Co dón, E a; Sa a xaga Coucei o, Ibon; Sánchez de la Fuen e,
Jon (2021). «Aho s sin e iko pe sonaliza uak: espe ien zia ba en desk ibapena»; Ekaia, ale be ezia 2021, 173-194.
(h ps://doi.o g/10.1387/ekaia.22077).
Jaso ze-da a: 2020, u iak 05; Ona ze-da a: 2021, u iak 18
ISSN 0214-9001 - eISSN 2444-3255 / © 2021 UPV/EHU
Lan hau C ea i e Commons Ai o u-EzKome ziala-LanE a o i ikGabe 4.0 Nazioa ekoa
lizen zia ba en mende dago
Aho s sin e iko pe sonaliza uak:
espe ien zia ba en desk ibapena
(Pe sonalised syn he ic speech: desc ip ion o an expe ience)
Inmaculada He náez Rioja*, E a Na as Co dón, Ibon Sa a xaga Coucei o,
Jon Sánchez de la Fuen e
HiTZ: Basque Cen e o Language Technologies - Aholab (UPV/EHU)
LABURPENA: Aho sa ezinbes ekoa da giza komunikazio ako, e a ha en gale ak e agin handia du pe sonak giza ean in eg a zeko
p ozesuan. Tes u-aho s bihu ke ak aho s sin e ikoa eman diezaieke ahozko desgai asuna du en pe sonei. I enbide a un enek aho s
es anda a iza en du e no malean, e a, ho ega ik, e abil zaile ba zuek zail asunak di uz e be en bu ua aho s ho ekin iden i ika zeko.
Ho ega ik, aho s sin e iko pe sonaliza uak so u beha di a, e a ahozko desgai asuna du en pe sonei aho s-ka alogo ba eskaini beha
zaie, be en beha e a a egoki zen den aho s ba auke a u ahal izan deza en. Zu eTTS p oiek ua en helbu ua aho s pe sonaliza u ho iek
ema ea da, bai gaz elaniaz, bai euska az. Aho sa galduko du en pe sonek edo aho sik ez du enei aho sa eman nahi die en pe sona al-
uis ek 100 esaldi g aba zen di uz e, AhoMyTTS web-a a ia en bidez. Esaldi ho iekin, egoki ze-p ozesu ba egi en da, g abake ako
aho sa en an zeko aho s sin e iko ba so zeko. E abil zailea i sin esi-mo o ba ema en zaio aho s pe sonaliza u ho ekin ba e a,
ahozko mezuak so zea eskain zen du en aplikazioe an e abil zeko. Gaine a, aho s-ka alogo ba e e badago, g abake a ik egin ezin
duen pe sona ba ek aho s ho ien a ean gus ukoena auke a u dezan. 1.200 pe sonak baino gehiagok e abili du e sis ema ho i aho s
pe sonaliza u ba lo zeko, e a haie a ik 58 hau a u di ugu ka alogoan sa zeko. E abil zaileei egindako inkes ek e akus en du e gus-
u a daudela aho s sin e ikoa en hainba alde di ekin: gehienen us ez, aho s sin e ikoa ja o izkoa en an zekoa da, a segina e a a gia,
baina obo iko sama a. Lan honek ga apen jasanga i ako 10. helbu ua i lagun zen dio, he ialde bakoi za en ba neko e a he ialdeen
a eko desbe din asunak mu iz uz. E a be ean, ga apen jasanga i ako 4. helbu ua i e e lagun zen dio, guz ion zako kali a ezko hez-
kun za inklusiboa nahiz bidezkoa be ma zea e az en du en esnak eskainiz.
HITZ GAKOAK: aho s-sin esia; pe sonaliza u ako aho s sin e ikoak; gizaki-makina in e azeak; komunikazio al e na iboa e a han-
diga ia.
Abs Ac : The oice is so essen ial o human communica ion ha i s loss d as ically a ec s he in eg a ion o people in socie y.
Tex - o-speech can p o ide a syn he ic oice o people wi h o al disabili ies. The mos common solu ions usually p o ide a s anda d
oice, and use s ha e di icul ies o iden i y hemsel es wi h i . Fo his eason, we need o c ea e pe sonalized syn he ic oices and
o e a ca alogue o oices o people wi h o al disabili ies so ha hey can choose one ha sui s hei needs. The objec i e o he
Zu eTTS p ojec is o p o ide hese pe sonalized oices, bo h in Spanish and in Basque. Th ough he AhoMyTTS web po al, people
who a e going o lose hei oice o al uis ic people who wan o p o ide oices o hose who do no ha e i , eco d 100 ca e ully se-
lec ed sen ences. A syn he ic oice wi h simila cha ac e is ics o he oice o he eco ding is gene a ed by applying an adap a ion
p ocess. The use is p o ided wi h a syn hesis engine along wi h ha pe sonalized oice, so ha hey can use i in applica ions ha
equi e o al message gene a ion. In addi ion, we o e a ca alogue o oices o choose om i one is no longe able o eco d. Mo e
han 1,200 people ha e used he sys em o ob ain a pe sonalized oice and 58 o hem ha e been selec ed o be included in he ca a-
logue. Use su eys show use sa is ac ion wi h a ious aspec s o he syn he ic oice: mos hink ha he syn he ic oice is simila o
he o iginal, pleasan and clea , al hough a bi obo ic. This wo k con ibu es mainly o goal 10 o sus ainable de elopmen by e-
ducing inequali y wi hin and among coun ies. I also con ibu es o goal 4 o sus ainable de elopmen , p o iding ools ha acili a e
access o all o an inclusi e, equi able and quali y educa ion.
KEywORDS: speech syn hesis; pe sonalized syn he ic oices; human compu e in e aces; Al e na i e and Augmen a i e Communi-
ca ion.
174 Ekaia, ale be ezia 2021, 173-194
Inmaculada He náez, E a Na as, Ibon Sa a xaga, Jon Sánchez
SARRERA
Aho sa gu e komunikazio- esna ik p ezia uena da. Tamalez, gu ako
gehienok ez ga a oha zen ha en balioaz, gu e ingu uko no bai ek (edo guk
geuk) galdu a e. O duan baka ik kon u a zen ga a zein ezinbes ekoa den
hu bilekoekin komunika zeko, e xean amilia ekin edo lanean, abe nako
ba an edo e azan. Egunean zeha hi z egi en ema en dugun denbo a kon-
a uko bagenu, ba ez e e aho sa lane ako esna du en pe sonek, ziu asko
ha i u egingo gina eke emai zekin.
Aho sa edo hi z egi eko gai asuna gal zea hainba a azoi enga ik ge a
dai eke: ba -ba ean (no malean, is ipu ba izan e a onazio-apa a ua edo
min zamena so zeaz a du a zen den ne bio-sis ema kal e zen di enean, edo
lepoko minbizia en os eko ki u gia en ondo ioz), edo pixkanaka. Ho en
adibide adie azga iena AEA da (alboko eskle osi amio o ikoa). Bes e
kasu ba zue an —ga uneko pa alisian, adibidez—, komunika zeko zail asu-
nak lesio ez-p og esiboen ondo io di a, e a a azo a ine a ik ahozko ekoiz-
pena en ezin asune a a ekoak izan dai ezke. Ga uneko pa alisia du en
hau ek komunika zeko asmoa izan dezake e, baina hi z egi eko e a ule -
a az eko ezin asunak haien komunikazio- ukea muga zen du, e a ho ek
e agin nega iboa du haien p og esio pe sonalean.
Ga apen jasanga i ako 10. helbu uak he ialdeen ba neko e a he ial-
deen a eko desbe din asunak mu iz en di u, e a ino a zean ez ge a zea
be ma zen du. Gu e lana pe sona kal ebe en kolek ibo ba i zuzendu a
dago, e a gaixo ze-a azoienga iko baz e ke ia saihes eko esna ba es-
kain zen du. Gaine a, esna euska a en za ga a u da, e a ho ek hiz kun za-
a a zoien ga iko desbe din asuna mu iz en lagun zen du.
Ga apen jasanga i ako 4. helbu uak (kali a ezko hezkun za) honako
helmuga hau du: «Guz ion zako kali a ezko hezkun za inklusiboa nahiz
bidezkoa be ma zea e a e engabeko ikaskun za ako auke ak bul za zea».
Hezkun za publikoko ze bi zue a ako sa bidea ez dago be ma u a adin guz-
ie an komunikazio-zail asunak di uz en pe sonen za . 4.5 xedeak esplizi-
uki ha zen di u kon uan «desgai asunen ba du en» pe sonak e a «ahul a-
sun-egoe an dauden hau ak». Hala, 4.a a alean, p oposa zen da «hau en
e a desgai asunen ba du en pe sonen beha ak e a gene o-desbe din asu-
nak kon uan ha zen di uz en e a ikaskun za-ingu une segu uak, inda ke ia
gabeak, inklusiboak e a guz ion zako e aginko ak eskain zen di uz en hez-
kun za-ins alazioak e aiki zea e a egoki zea».
Teknologiak, hein ba ean, ahozko desgai asuna mu iz en lagundu de-
zake. Gau egun, gai ga a gizakiok ozen i aku zeko dugun gai asuna emu-
la zeko, TTS (Tex - o-Speech) es u-aho s bihu ke a izeneko eknologia
e abiliz. Gau eguneko aho s sin e ikoak zailak di a giza aho se a ik be eiz-
en. Komunikazio Al e na ibo e a Handiga iko aplikazioek (Augmen a i e
and Al e na i e Communica ion, AAC) es u-aho s bihu ke a bes e ekno-
h ps://doi.o g/10.1387/ekaia.22077 175
Aho s sin e iko pe sonaliza uak: espe ien zia ba en desk ibapena
logia ba zuekin konbina zen du e ( ekla ua o dez en du en zen zumen-in-
e azeak edo mezuak azka so zeko eknikak), komunikazio- esna e a-
ginko ak ema eko.
Lan hone an, es u-aho s bihu ke a ako sis emei e epa a uko diegu,
AAC eknologien un sezko osagai gisa. Teknologia en egungo egoe a au -
kez eaz gain, aho s sin e ikoak e a, be eziki, aho s sin e iko pe sonaliza-
uak nola lo zen di en desk iba uko dugu. Zu eTTS ekimena e e au kez-
uko dugu, euska azko e a gaz elaniazko aho s sin e iko pe sonaliza uei
sa bidea e az eko ekimena. Zu eTTSn, aho s sin e iko p opioa iza eko au-
ke a lehene si da bes e neu ke a-pa ame o ba zuen au ean, hala nola ka-
li a ea edo na u al asuna. Gu e aho sa gu e no asuna en pa e da. Aho s
sin e ikoa en pe sonalizazioak komunikazio ako gailu elek onikoen e a-
bile ak daka en inpak ua mu iz u nahi du.
Azkenik, ezin dugu ahaz u hizke a- eknologien ga apen-maila desbe -
dina dela munduko hizkun zen a ean. Hizkun za mino i a io edo gu xi ue-
ako hiz unen za e e be ma u beha da AAC eknologie a ako sa bidea.
TESTU-AHoTS BIHURKETA
A al hone an, es u-aho s bihu ke a ako e abil zen di en eknologien
egoe a desk iba uko dugu, aho s pe sonaliza ue a ako bideko lehenengo
u a sa bai a. Lehenik, azken u eo an e abili ako e edu e a me odoak be-
ikusiko di ugu, haien a eko alde nagusiak azal zeko. Ondo en, aho s-pe -
sonalizazioa lo zeko inda ean dauden es a egia ba zuk azalduko di ugu.
Ike ke a askok e akus en du e bes e pe sona ba zuen no asuna i bu uzko
i i zia osa zen dugula haien aho se ik abia u a (bes e ezauga i ba zuekin
ge a zen den bezala, hala nola au pegia ekin edo azala en kolo ea ekin) [1].
Ike ke a ba zuek e akus en du e aho s pe sonaliza uak e abil zeak ga apen
in elek uala e az u diezaiekeela ikusmen-u i asunak di uz en hau ei [2].
Azken ba ean, aho s sin e ikoen ga apenak komunikazio-desgai asuna du en
pe sonak giza e a zen lagun zen badu, aho s ho ien pe sonalizazioa lo -
zeak eknologia ho ien pe zepzioa hobe zen du, bai e abil zailea en alde-
ik, bai ingu uko pe sonen alde ik, e a, ho ela, haien e abile a e az en da.
Azkenik, lan honi dagokion p oiek uan inplemen a u ako sis ema en
desk ibapen ba egingo dugu a ala en amaie an.
Tes u-aho s bihu ke a ako eknologiak
Tes u-aho s bihu ke a en helbu ua (Tex o Speech Con e sion, TTS)
aho s na u alak so zea da, ho s, es ilo jakin ba ean min za zeko e a giza hiz-
unen azen ua, alda ea e a bes e ezauga i ba zuk adie az eko gai di enak. Az-
ken hama kada en hasie a a e, aho sa so zeko e abil zen zi en eknologien
176 Ekaia, ale be ezia 2021, 173-194
Inmaculada He náez, E a Na as, Ibon Sa a xaga, Jon Sánchez
a ean, uni a e-hau ake a en bidezko sin esi ka ea zailea [3] e a Ma ko -en
e edue an oina i u ako sin esi es a is iko-pa ame ikoa [4] e abil zen zi en.
Uni a e-hau ake a en bidezko sis ema ka ea zaileek aldez au e ik g a-
ba u ako aho s na u al ba en za iak ka ea uz so zen du e aho sa. Za iak
hau a zeko, i izpide konplexuak e abil zen di a: alde di akus ikoak, one i-
koak, p osodikoak e a linguis ikoak ha u beha di a kon uan. O oko ean,
uni a e-hau ake an oina i u ako sis emek oso an zeko eknika ba aplika-
zen du e aho sa en in onazioa sin esi-p ozesuan au esa eko [5]. Teknika
ho iekin, oso emai za na u alak lo zen di a e abile a muga u ako gi oe an,
baina e abile a-domeinua zabal zean lo zen di en emai zen kali a ea oso
aldaga ia da [6]. Gaine a, memo ia-, bil egi a ze- e a p ozesa ze-be ebeha-
ak handiak di a, e a aho s be iak so zeko malgu asuna, xikia.
Sis ema es a is iko-pa ame ikoek, be iz, akus ikoki an zekoak di en
aho s-uni a een ba ez bes eko e edue an oina i uz so zen du e aho sa. Vo-
code ba en bidez, hau da, aho sa pa ame o akus iko bihu zeko e a pa a-
me o ho ie a ik seinalea bi so zeko gai den sis ema ba en bidez, aho sa
pa ame o so a ba bihu zen da [7]. No malean, aho sa zenbai pa ame-
o mo a an deskonposa zen da: ingu a zaile espek ala ekin lo u ako pa-
ame o espek alak, maiz asun-banda desbe dinen ene gia i bu uzko in-
o mazioa e ama en du enak; in onazioa ekin lo u a dagoen oina izko
maiz asuna; e a i u ia en sono i a e-maila ekin e laziona u ako pa ame-
oak. Adibidez, banda desbe dinen ape iodiko asunak STRAIGHT [8]
e a WORLD [9] ocode en kasue an, edo gehieneko maiz asun ahos-
una, AhoCode ocode a en kasuan [10]. En enamendu-da u kopu u
ba gaindi zen denean, sis ema es a is iko-pa ame ikoek in o mazio one-
iko-linguis ikoa e a dagokion ocode ak a e a ako pa ame oekin egin-
dako e ealizazio akus ikoa en a eko e lazioa modela zeko, Ma ko -en
e edu ezku uak e abil zen di a (HMMs, Hidden Ma ko Models). Ondo-
en, sin esia en momen uan, e eduek pa ame o akus ikoen sekuen zia p o-
bableena i zul zen du e, sa e an dagoen es ua desk iba zen du en e ike a
one iko-linguis ikoen sekuen zia en a abe a. Sis ema ho ien aban ailen a -
ean, inko asuna, malgu asuna, ule ga i asuna e a bil egi a ze-be ebeha
xikia naba men zen di a. Aho s be iak e az so zeko auke a ema en du e,
egoki ze- edo in e polazio- ekniken bidez [11], e a aho s leuna e a kali a e
egonko ekoa so zen du e, nahiz e a ocode en e abile ak haien na u al-
asuna mu iz en duen. Ha en ule ga i asuna hizke a na u ala en an zekoa
da, e a a e hobea gi o za a a sue an [12].
Me odo bien aban ailak konbina zen di uz en hu bilke a hib idoak e e
p oba u di a. Ba zuek es a is ika-sis ema en au esa e p osodiko edo a es-
pek alak e abil zen di uz e uni a eak hau ake a-p ozesua en kos u objek-
iboa kalkula zeko [13]. Bes e ba zue an, sin esi ka ea zailea e abil zen
da sis ema es a is ikoa en kali a ea hobe zeko [14], edo uni a e na u alak
e edu es a is ikoek au eikusi akoekin konbina zen di a [6].
h ps://doi.o g/10.1387/ekaia.22077 177
Aho s sin e iko pe sonaliza uak: espe ien zia ba en desk ibapena
Azken u eo an, sin esi es a is iko pa ame ikoa en espa uan, Ma -
ko -en e eduen o dez neu ona-sa e sakonak (Deep Neu al Ne wo ks,
DNN) [15] e abil zen a i di a, e a oso emai za onak lo u di a aho s sin e i-
koa en kali a ea i dagokionez. DNNak egokiak di a gaussia e eduek aho-
sa so zeko pa ame o akus ikoen e a hizke a en i udikapen sinbolikoa en
a eko e lazio konplexu ez-linealen i udikapenean di uz en zenbai muga
gaindi zeko. Hainba sa e-a ki ek u a p oba u di a, hala nola au e anzko
elikadu a-sa eak ( eed- o wa d Ne wo ks)[16], sa e e epika iak [17] e a
Wa eNe sa eak[18]. En enamenduan e abili ako i izpideen a ean, so -
ze-aka s xikiena ena naba men zen da be e aplikazioaga ik [19], nahiz e a
duela gu xi me odo be i ba p oposa u den au kako so zaile-sa eak e a-
biliz (GAN, Gene a i e Ad e sa ial Ne wo ks) [20], e a oso emai za onak
lo u di a aho sa en na u al asuna i dagokionez. [21] lanean, aho sa en pa-
ame o akus ikoen so e an sa e sakonak e abil zeko es a egia posibleen
be ikuspen bikaina egin da.
Duela gu xi age u ako sis ema ba zue an, neu ona-sa eek ez du e sei-
nalea en so e a en za ia soilik o dezka zen: DNNen bidez, es ua aho s
bihu zeko ka e osoa egi en da. Deep Voice [22] TTS sis eman, e apa ba-
koi za neu ona-sa een bidez inplemen a u zen lehenengo aldiz. Lo u ako
seinalea en kali a ea ez da Wa eNe bidez lo zen dena bezain ona, e a ho-
ega ik p oposa u zen Deep Voice 2 [23] e a Deep Voice 3 [24] be sioe-
an hobekun zak egi ea. Hala, seinalea Wa eNe -en bidez so zea lo u
zen. Mu u e ik mu u e ako (end- o-end) sis ema ba en an z handia duen
hu bilke a ba Cha 2Wa [25] sis ema da, nahiz e a o aindik pa ame oen
i aga le-modulu ba e a ocode neu onal ba eduki. Azkenik, TTS en-
za e aba mu u e ik mu u e akoak di en a ki ek u ak e e p oposa u di a,
hala nola Taco on [26], Taco on 2 [27] e a Cla iNe [28], zeinek espek-
og amak so zen bai i uz e es u ik abia u a. Ondo en, espek og ama
ho iek aho s bihu zen di a, Wa eNe edo G i in-Limen algo i moa en
bidez [29]. TTS end- o-end e eduek bi osagai di uz e: kodegailu ba (enko-
de ) e a deskodegailu ba (decode ). Sa e ako sekuen zia ik abia u a (hi-
zak, ka ak e eak, onemak e a bai a by eak e e izan dai ezke [30]), kode-
gailua i udikapen seman iko ba ean mapa zen saia zen da, e a ezku uko
egoe en sekuen zia ba so zen du. Deskodegailuak, egoe a-sekuen zia ho i
a e a-mekanismo ba ekin es uingu u-in o mazio gisa e abiliz, deskode-
gailua en ezku uko egoe ak e aiki zen di u, e a i ee a- amak so zen. Sis-
ema ho iek oso emai za onak lo zen a i di a so u ako aho s sin e ikoa en
kali a ea i dagokionez.
Aho s sin e iko pe sonaliza uak lo zeko eknikak
O oko ean, TTS sis ema es anda ek kali a ezko aho sak eskain zen
di uz e, baina es anda ak: ezin da sis ema en aho sa pe sonaliza uz aho s
pa ikula ik ga a u e abil zaileen beha ak e a nahiak be e zeko. Neu o-

178 Ekaia, ale be ezia 2021, 173-194
Inmaculada He náez, E a Na as, Ibon Sa a xaga, Jon Sánchez
na-sa ee an oina i u ako sis ema sendo ba osa zeko beha den da u kopu-
ua i zela da, e a, aho sak egoki zeko e a sis emak da u kopu u mu i za-
goekin e aiki zeko espe imen uak egin di en a en [31], o oko ean ez da
lo u kali a ezko aho sak so zea sis ema es a is iko-pa ame ikoe an aho s
pe sonaliza uak so zeko e abil dai ekeen bezain da u gu xi ekin. Halako
sis eme an, be iz, posible da egoki zapen- eknikak e abil zea kali a ezko
aho s sin e iko be iak so zeko, da u kopu u muga ua ekin [32]. Ho e a-
ako, hasie ako e edu es a is iko ba zuk en ena zen di a, e a, hala, hiz un
ani zen da uekin, ba ez bes eko aho sa de i zona lo zen da. Ba ez bes eko
aho sa en e edue an, hizla ia en mendeko ezauga iak edo bes e ezauga-
i espezi iko ba zuk —gene oa, adibidez— neu aliza u egi en di a, e a al-
dae a one ikoa e a sendoago ba ean modela zen da. Ho e a ako, eknika
espezi ikoak e abil zen di a; adibidez, hizla ia i egoki u ako en enamen-
dua en bidezko pa ame oak be es ima zea (SAT, Speake Adap i e T ai-
ning) [33]. Ondo en, desi a u ako hiz un ba ek g aba u ako 100e ik 500e a
esaldi e abiliz, ba ez bes eko aho sa en e eduak molda zen di a, be eziki
diseina u ako eknikak e abiliz [34], hala nola gehieneko egian zeko e e-
g esio lineala (MLLR, Maximum-Likelihood Linea Reg ession) [35] edo
gehieneko egian zeko e eg esio lineal muga ua (CMLLR, Cons ained
Maximum Likelihood Linea Reg ession) [36]. Lo u ako aho sak desi a-
u ako hiz una en ezauga i be eizga iak di u, baina 100-500 esaldi ho iek
zuzenean e eduak en ena zeko e abiliz lo uko li za ekeen baino kali a e
e a sendo asun handiagoa. Hiz una i molda zen zaizkion sis emak e abilga-
iak di a, lanabes eknologiko gisa, aho sean desgai asun la iak dauzka-
enei lagun zeko; la ingo omia edo gaixo asun neu odegene a iboak di uz-
en pazien eei, adibidez. Diagnos ikoa en momen uan pazien eak egindako
g abake a ba zue a ik abia u a (ha en aho sa en na iadu a o aindik gu xie-
nekoa dela suposa uz), dagokion aho s a i iziala so dai eke, sin e izado e
ba en bidez. Ildo ho e ako zenbai espe imen u naba men egin di a da-
goeneko [37]. Teknologikoki, hiz una i egoki u ako sis emek badu e beha
bes e po en zial desk iba u ako aplikazioa i dagozkion a azak be e zeko,
baina zenbai alo hobe zeko ike ke ak egi en a i di a: aho sa en pa ame i-
zazio-bi so zea [38], egoki zapen zuzena iza eko ma e ial kan i a ea [39],
ingu u za a a sue an g aba u ako egoki zapen-da uen au kako sendo a-
suna [40], hizke a sin e ikoa en ule ga i asuna en hobekun za ingu une
bo i ze an [41], dagoeneko kal e u a dauden aho sen e abile a egoki zape-
nean e abil zeko es a egiak [42], e a aba .
Aho s sin e ikoa en pe sonalizazioan e abili ako eknika
AhoLab labo a egian ga a u ako es u-aho s bihu ke a ako sis emak,
AhoTTS de i zonak [43, 44], TTS sis ema es a is iko-pa ame ikoen egi u a
klasikoa e abil zen du, 1. i udian ikus dai ekeen moduan. Sa e a- es ua p o-
zesado e linguis iko ba en bidez az e zen da, sin esi-mo o a en sa e a den
in o mazio one iko-linguis ikoa a e a zeko. Sin esi-mo o ean, aho sa en
h ps://doi.o g/10.1387/ekaia.22077 179
Aho s sin e iko pe sonaliza uak: espe ien zia ba en desk ibapena
e edu es a is ikoak e abil zen di a sa e ako e ike a one iko-linguis ikoekin
p obabili a e handiena ekin ba da ozen ocode a en pa ame oen balioak
lo zeko. Azkenik, seinale sin e ikoa ocode ba en bidez bi so zen da.
Aho s
e edua
Tes ua Tes u analisia
Pa ame oen
so kun za
Bi so ze
akus ikoa
Sin esi mo o a
1. i udia. AhoTTS es u-aho s bihu ke a ako sis ema en egi u a.
AhoTTSk es u-analisi ako modulu bana dauka euska a ako e a gaz e-
lania ako. Sin esi ako e abil zen di en aho s-e eduak aho s gene iko ba e-
kin ba da oz, edo, AhoMyTTS a a ian lo u bada, aho s pe sonaliza ua-
ekin ba . Aho s pe sonaliza ua en e eduak so zeko, 2. i udian e akus en
den aho s-egoki zapene ako p ozesua aplika zen da:
2. i udia. Aho s egoki uak so zeko p ozesua AhoMyTTSn.
Hiz un ani zeko g abake e an e a ahoska u akoa i dagokion es ue an
oina i u a, e edu es a is iko ba ga a zen da, AhoTTS en modulu linguis-
180 Ekaia, ale be ezia 2021, 173-194
Inmaculada He náez, E a Na as, Ibon Sa a xaga, Jon Sánchez
ikoa en bidez lo u ako in o mazio one iko-linguis ikoa ocode ba ek
g abake e a ik a e a ako pa ame o akus ikoekin e laziona zeko. E edu ho-
ek ba ez bes eko aho sa i udika zen du, hiz un desbe dinei dagozkien al-
dae ak neu aliza zen bai i u. Gau egun, AhoMyTTSn e abil zen den ba ez
bes eko aho sa bi esa a ik —gizonezkoa e a emakumezkoa— ahoska u ako
4.000 esaldi ekin so u da, bai gaz elaniaz, bai euska az.
Moldake a- asean, hiz un be iak kon u handiz auke a u ako 100 esaldi
i aku zen di u, e a, molda ze- eknikak e abiliz, ba ez bes eko aho sa en
e eduak alda u, e a ha en aho sa en ezauga iak e akus en di a. Aho s pe -
sonaliza uak so u nahi di en hizkun zako es u kopu u handie a ik abia u a
hau a zen di a esaldien es uak; zehazki, haien ansk ipzio one ikoa lo u,
e a onema isola uen zein bi onemen konbinazioen age pen kopu ua maxi-
miza zen du en 100 esaldi hau a zen di a. P ozesu ho i UPC unibe si a eak
(Uni e si a Poli ècnica de Ca alunya) so u ako Co pusC [45] lanabesa
e abiliz gauza zen da. Konbinazio one ikoen kopu ua maximiza zeko hel-
bu ua dela e a, hau a u ako esaldiek ezohiko soinuen konbinazioak iza en
di uz e, e a, ho en ondo ioz, oso ohikoak ez di en hi zak di uen hiz egi ba
so zen da.
Zu eTTS PRoIEKTUA
Teknologiak aho s sin e iko pe sonaliza uak eman di zakeela oga u
ondo en, hu engo u a sa e abil zaileengana i is ea da. Aho s sin e iko
pe sonaliza uak lo zeko, hainba auke a kome zial daude, baina, guk
dakiguna en a abe a, guz iak ingelese ako [46, 47, 48, 49]. Oso posible
da, bai a e e, p oduk u e a ekimen be iak age zea, hizkun za- eknolo-
giak inda a handia ha zen a i bai i a me ka uan. Aipa u ako ingelesezko
sis ema guz ie an, «Voice Banking» e minoa e abil zen da: hiz una en
aho sa g aba zen da desgai asuna naba mena izan baino lehen, beha ez-
koa den momen uan ha en aho s sin e iko pe sonaliza ua esku a eduki
ahal iza eko.
Halako sis emak euska az eskain zeko auke a izan zen p oiek u hone-
a ako bul zada nagusia. 2011. u ean hasi zen, pe sonalizazioa en a loan
ike zen hasi ginenean [50]. Gau egungo emai za «AhoMyTTS» web-
a a ia da. Nahiz e a alde di zailena ga apen eknologikoa lo zea zela i u- da. Nahiz e a alde di zailena ga apen eknologikoa lo zea zela i u-
di u, egia esan, askoz zailagoa izan da e abil zailea engana i is eko eza -
pen p ak ikoa e dies ea. Helbu u ho ek un sezko hi u alde di eska zen
zi uen:
1. E abil zailea en aho sa en lagin mul zoa lo zeko sis ema sinple ba .
2. E abil zaileak aho s-sin esia en mo o a lo zeko me odo ba .
3. Emaileen aho sen ka alogo ba .
h ps://doi.o g/10.1387/ekaia.22077 181
Aho s sin e iko pe sonaliza uak: espe ien zia ba en desk ibapena
Lehenengoa ekin, ba ez bes eko aho sa pe sonaliza zen da e abil zaile
emailea en za , e a, biga ena ekin, lo u ako aho sa ekin komunika zeko
auke a ema en da. Hi uga en pun ua ekin, hi z egin ezin du en pe sonei
aho s pe sonaliza uak eskain zea lo u dugu, ho s, aho s pe sonaliza uak
eskain zen dizkiegu hi z egi eko gai asuna galdu du en pe sonei. Ho ek
be eizi egi en gai u au e ik aipa u ako gaine ako ekimene a ik.
Da ozen a ale an, zeha zago azalduko dugu nola heldu diegun e onka
ho iei e a zein izan di en zail asun nagusiak.
Ema e-p ozesua
P ozesu e aza da. E abil zailea i ahoska u beha duen esaldia e a-
kus en zaio; e abil zaileak ahoska zen du; beha bezala g aba u a dagoela
egiaz a zen du, e a ze bi za i a bidal zen du. Esku apena esaldiz esaldi egi-
en da, p ozesua zenbai saio an osa u ahal iza eko. Saio oso ba 30 e a
40 minu u a ekoa iza en da.
G abake an, seinalea en maila egokia dela egiaz a zen du sis emak, ba-
ez e e sa u azioak edo maila baxuegiak saihes eko.
Hauek di a ikusi di ugun a azo ik ga an zi suenak:
— T ansmisioko e o eak konexio xa ba en ondo ioz.
— Ingu une za a a sue an egindako g abake ak (a e-kolpeak, hau en
nega a, i a ia edo elebis a, edo a iko-za a a).
Ildo ho e an, in e esga ia izan li eke hasie an g abake a-ingu unea ba-
liozko uko lukeen me odo en ba sa zea.
Sin esi-mo o a
E abil zaile ba ek g abazioak amai u di uenean, aho sa lo zeko p oze-
sua ak iba dai eke. P ozesu ho i e aba au oma ikoa e a opakua da e abil-
zailea en za . Ha en eskae a aldizka kon sul a zen den i xa o e-ila a ba-
ean sa zen da. Aho s ba egoki zeko p ozesuak 40 minu u ingu u beha
di u p ozesado e es anda ba ean. Ondo en, e abil zaileak mezu ba jasoko
du, es eka ba ekin, aho sa deska ga zeko (a ikulu hau idaz eko momen-
uan, sis emak And oid e a Windowse ako sin esi-mo o a deska ga zeko
auke a ema en du. Espe o dugu iOS sis eme a ako e e las e eskaini ahal
iza ea).
Aho s sin e ikoen bankua
Aho s-ka alogo ba ek ezauga i desbe dineko aho sak e aku si beha ko
lizkioke e abil zailea i, aho s p opio ik ez duen pe sonak be e bu ua hobe-
188 Ekaia, ale be ezia 2021, 173-194
Inmaculada He náez, E a Na as, Ibon Sa a xaga, Jon Sánchez
11. i udia. E abil zaileen i i zia obo iko asuna i bu uz.
12. i udia. E abil zaileen i i zi o oko a.

h ps://doi.o g/10.1387/ekaia.22077 189
Aho s sin e iko pe sonaliza uak: espe ien zia ba en desk ibapena
E an zun i ekiak
Inkes a en a al ba ean, e abil zaileek p oiek ua en webgunea hobe zeko
eman di uz en i adokizunak jaso di a, e a lib ean. I adokizun gehienak
(% 38 ingu u) webgunea en e abilga i asuna hobe zea i bu uzkoak izan
di a: nabigazioa sinpli ika zea e a e az ea; adibideak, ja aibideak edo e a-
bil zailea en zako eedbacka sa zea, e a ho elakoak. I adokizun ba zuek
webgunean dagoeneko inplemen a u a dauden un zionali a eak eska zen
di uz e; be az, nabigazioa ez da beha bezain in ui iboa, e a ez du e lo u
ho ie a a i is ea.
Bes e alde esangu a su ba ek (% 12) hobekun za es e ikoak i adoki
di u o ialdee an, bisualagoa e a diseinua biziagoa izan dadila eska uz. E a-
bil zaile kopu u be a i (% 12) webgunea dagoen bezala ondo dagoela i udi-
zen zaio. Halabe , ikusmen-desgai asuna du en pe sonen za o ialdea en
i isga i asuna hobe zea eska zen da (% 9), o ialdea en publizi a ea han-
diagoa iza ea e a ikusga i asun handiagoa iza ea (% 5), edo gailu mugiko-
e an e abili ahal iza ea (% 3).
Gu xiago an age u di a webgunea ekin, aho s pe sonaliza uekin e a
aho s ho iek lo zeko e a e abil zeko p ozesua ekin lo u ako i adokizunak.
Dena den, ba zuek eska u du e ema ean esaldi sinpleagoak edo ohikoagoak
e abil zea (% 3), bes e hizkun za ba zuk sa zea (% 3), ka alogoko aho sen
ezauga iak (dialek oa, azen ua) e ike a zea (% 2) edo so u ako aho s sin-
e ikoen kali a ea hobe zea (% 2). I uzkinen ba ean, emandako aho sen e a-
bile a i bu uzko xehe asun gehiago eska u di a, e a emaile ba ek i adoki du
emandako aho sa en balizko ha zaileen za mezu pe sonalak u zi ahal iza-
ea. In o mazio ho i guz ia oso kon uan ha uko da sis ema en e o kizuneko
hobekun zak diseina zeko.
oNDoRIoAK ETA EToRKIZUNERAKo LANAK
Lan hone an, aho s-sin esi ako eknologien egoe a desk iba u dugu,
ahozko ezin asunak di uz en pe sonei lagun zeko euska i gisa. Aisial-
dia en e a en e enimendua en munduan eknologia ho iek me ka u a az-
ka i i si badi a e e, desgai asune ako aplikazioen munduan askoz mo ela-
goa da auke a eknologikoen me ka u a hu bil zea. Ga apen jasanga i ako
10. e a 4. helbu uen ildo ik, desk iba u ako lanak hu sune ho i be e nahi du,
aho s sin e iko pe sonaliza ua esku aga iago egon dadin euska a- e a gaz-
elania-hiz unen za .
Lanak a lo asko di u hobe zeko o aindik. Ga an zi suena neu ona-sa e
sakone an oina i u ako sin esi- eknologia e abil zea da. Ho ek naba men
hobe uko luke aho sen azken kali a ea, adie azko asuna e a pe sonaliza-
zioa be a ba ne.
190 Ekaia, ale be ezia 2021, 173-194
Inmaculada He náez, E a Na as, Ibon Sa a xaga, Jon Sánchez
Gu e us ez ga an zi sua den bes e alde di ba aldae a dialek alak sa -
zea da, bai euska a en za , bai gaz elania en za , gau egun aldae a «es an-
da a» bes e ik ez bai a kon uan ha u. Euska a en kasuan, adibidez, Ipa al-
deko hiz unen za egokiagoa den aldae a ba sa li eke. Guz iz eginga ia da,
lan honen egileek es u-aho s bihu ke a ako sis ema ba ga a u bai u e da-
goeneko aldae a ho e a ako [55]. Gaz elania en kasuan, badi a hainba ba-
liabide akus iko hainba eskualde ako azen ua du en ba ez bes eko aho sak
lo u ahal iza eko, a a ian e abil zen den azen u ik oso u un daudenak, esa e
ba e ako, Andaluziako, Kana ie ako edo Hego Ame ikako aldae ak. Alde di
ho ek naba men abe as uko li uzke aho s-bankua en auke ak e e.
In e azea ekin lo u a hobe u beha eko alde di eknikoen a ean, i suen
i isga i asuna hobe zea dago. Hobekun za ekniko ho i e a e abil zaileek
i adoki ako bes e ba zuk, hala nola mugiko ean e abil zeko auke a e a
bes e sis ema e agile ba zue a a heda zea, pixkanaka ga a uko di a.
Azkenik, azpima a u nahi genuke lan hau jende asko en lagun za i es-
ke izan dela posible: alde ba e ik, ikasle e a kolabo a zaile askok be en
so wa e-za ia ga a u du e; bes e ik, be en bu ua en za edo bes e pe sona
ba zuen za be en aho sa eman du en pe sonen lagun za o dainezina da.
ESKER oNA
Lan hau Espainiako Ekonomia e a Lehiako asun Minis e io en di ula-
gun zaz (Spanish Minis y o Economy and Compe i i eness wi h FEDER
suppo , RESTORE p ojec , TEC2015-67163-C2-1-R) e a Eusko Jau la-
i za en di ulagun zaz (Basque Go e nmen , DL4NLP KK-2019/00045,
PIBA_2018_1_0035 e a IT355-19) egin da.
BIBLIoGRAFIA
[1] LAVAN, N., MILEVA, M., MCGETTIGAN, C. 2020. «How does amilia -
i y wi h a oice a ec ai judgemen s?». B i ish Jou nal o Psychology,
112(1), 1-19.
[2] PUCHER, M., ZILLINGER, B., TOMAN, M., SCHABUS, D., VALENTI-
NI-BOTINHAO, C., YAMAGISHI, J., SCHMID, E., WOLTRON, T. 2017.
«In luence o speake amilia i y on blind and isually impai ed child en’s
and young adul s’ pe cep ion o syn he ic oices». Compu e Speech and
Language, 46, 179-195.
[3] HUNT, A. J., BLACK, A. W. 1996. «Uni selec ion in a conca ena i e
speech syn hesis sys em using a la ge speech da abase». ICASSP, IEEE In-
e na ional Con e ence on Acous ics, Speech and Signal P ocessing - P o-
ceedings, 1, 373-376.
h ps://doi.o g/10.1387/ekaia.22077 191
Aho s sin e iko pe sonaliza uak: espe ien zia ba en desk ibapena
[4] ZEN, H., TOKUDA, K., BLACK, A. W. 2009. «S a is ical pa ame ic
speech syn hesis». Speech Communica ion, 51, 1039-1064.
[5] RAUX, A., BLACK, A. W. 2003. «A uni selec ion app oach o F0 mode-
ling and i s applica ion o emphasis». 2003 IEEE wo kshop on Au oma ic
Speech Recogni ion and Unde s anding, ASRU 2003, 700-705.
[6] POLLET, V., BREEN, A. 2008. «Syn hesis by gene a ion and conca ena ion
o mul i o m segmen s». P oceedings o he Annual Con e ence o he In e -
na ional Speech Communica ion Associa ion, INTERSPEECH, 1825-1828.
[7] DUDLEY, H. 1939. «Remaking Speech». Jou nal o he Acous ical Socie y
o Ame ica, 11, 169-177.
[8] KAWAHARA, H., MASUDA-KATSUSE, I., DE CHEVEIGNÉ, A. 1999.
«Res uc u ing speech ep esen a ions using a pi ch-adap i e ime– equency
smoo hing and an ins an aneous- equency-based F0 ex ac ion: Possible ole
o a epe i i e s uc u e in sounds». Speech Communica ion, 27, 187-207.
[9] MORISE, M., YOKOMORI, F., OZAWA, K. 2016. «WORLD: A ocode -
based high-quali y speech syn hesis sys em o eal- ime applica ions».
IEICE T ansac ions on In o ma ion and Sys ems, E99D, 1877-1884.
[10] ERRO, D., SAINZ, I., NAVAS, E., HERNÁEZ, i. 2014. «Ha monics Plus
Noise Model Based Vocode o S a is ical Pa ame ic Speech Syn hesis».
IEEE Jou nal o Selec ed Topics in Signal P ocessing, 8, 184-194.
[11] YAMAGISHI, J., USABAEV, B., KING, S., WATTS, O., DINES, J.,
OURA, K., TOKUDA, K., KARHILA, R., KURIMO, M. 2010. «Thousands
o Voices o HMM-Based Speech Syn hesis–Analysis and Applica ion o
TTS Sys ems Buil on Va ious ASR Co po a». IEEE T ansac ions on Audio,
Speech and Language P ocessing, 18, 984-1004.
[12] SUNI, A., RAITIO, T., VAINIO, M., ALKU, P. 2012. «The Glo HMM En-
y o Blizza d Challenge 2012: Hyb id App oach». P oc. o The Blizza d
Challenge 2012.
[13] SAINZ, I., ERRO, D., NAVAS, E., HERNÁEZ, i. 2011. «A Hyb id TTS
App oach o P osody and Acous ic Modules». P oceedings o he Annual
Con e ence o he In e na ional Speech Communica ion Associa ion, IN-
TERSPEECH, 333-336.
[14] GONZALVO, X., GUTKIN, A., CARRIÉ, J. C., SANZ, I., TAYLOR, P.
2009. «Local minimum gene a ion e o c i e ion o hyb id HMM speech
syn hesis». P oc. In e speech, 416-419.
[15] Ze, H., SENIOR, A., SCHUSTER, M. 2013. «S a is ical pa ame ic speech
syn hesis using deep neu al ne wo ks». ICASSP, IEEE In e na ional Con e -
ence on Acous ics, Speech and Signal P ocessing - P oceedings, 7962-7966.
[16] QIAN, Y., FAN, Y., HU, W., SOONG, F. K. 2014. «On he aining aspec s
o Deep Neu al Ne wo k (DNN) o pa ame ic TTS syn hesis». 2014 IEEE
In e na ional Con e ence on Acous ics, Speech and Signal P ocessing
(ICASSP), 3829-3833.
[17] FAN, Y., QIAN, Y., XIE, F.-L., SOONG, F. 2014. «TTS syn hesis wi h bidi ec-
ional LSTM based Recu en Neu al Ne wo ks». P oceedings o he Annual
192 Ekaia, ale be ezia 2021, 173-194
Inmaculada He náez, E a Na as, Ibon Sa a xaga, Jon Sánchez
Con e ence o he In e na ional Speech Communica ion Associa ion, INTER-
SPEECH, 1964-1968.
[18] OORD, A. VAN DEN, DIELEMAN, S., ZEN, H., SIMONYAN, K.,
V INYALS, O., GRAVES, A., KALCHBRENNER, N., SENIOR, A., KA-
VUKCUOGLU, K. 2016. «Wa eNe : A Gene a i e Model o Raw Audio».
a Xi p ep in a Xi :1609:03499 (ikus e-da a: 2021/10/01).
[19] WU, Z., KING, S. 2016. «Imp o ing T ajec o y Modelling o DNN-Based
Speech Syn hesis by Using S acked Bo leneck Fea u es and Minimum Gen-
e a ion E o T aining». IEEE/ACM T ansac ions on Audio Speech and Lan-
guage P ocessing, 24, 1255-1265.
[20] SAITO, Y., TAKAMICHI, S., SARUWATARI, H. 2018. «S a is ical Pa ame -
ic Speech Syn hesis Inco po a ing Gene a i e Ad e sa ial Ne wo ks». IEEE/
ACM T ansac ions on Audio Speech and Language P ocessing, 26, 84-96.
[21] LING, Z. H., KANG, S. Y., ZEN, H., SENIOR, A., SCHUSTER, M., QIAN,
X. J., MENG, H., DENG, L. 2015. «Deep Lea ning o Acous ic Modeling
in Pa ame ic Speech Gene a ion: A sys ema ic e iew o exis ing echniques
and u u e ends». IEEE Signal P ocessing Magazine, 32, 35-52.
[22] SERCAN O. ARIK, MIKE CHRZANOWSKI, ADAM COATES, GRE-
GORY DIAMOS, ANDREW GIBIANSKY, YONGGUO KANG, XIAN LI,
JOHN MILLER, ANDREW NG, JONATHAN RAIMAN, SHUBHO SEN-
GUPTA, M. S. 2017. «Deep Voice: Real- ime Neu al Tex - o-Speech». In-
e na ional Con e ence on Machine Lea ning, 195-204.
[23] ARIK, S., DIAMOS, G., GIBIANSKY, A., MILLER, J., PENG, K., PING,
W., RAIMAN, J., ZHOU, Y. 2017. «Deep Voice 2: Mul i-Speake Neu al
Tex - o-Speech». P oc. Neu al In o ma ion P ocessing Sys ems (NIPS),
2962-2970.
[24] PING, W., PENG, K., GIBIANSKY, A., ARIK, S., KANNAN, A.,
NARANG, S., RAIMAN, J., MILLER, J. 2017. «Deep Voice 3: 2000-
Speake Neu al Tex - o-Speech». P oc. In e na ional Con e ence on Lea n-
ing Rep esen a ions (ICLR), 1-15.
[25] JOSE SOTELO, SOROUSH MEHRI, KUNDAN KUMAR, JOAO FELIPE
SANTOS, KYLE KASTNER, AARON COURVILLE, Y. B. 2017.
«C ha 2wa : End- o-end speech syn hesis». In e na ional Con e ence on
Lea ning Rep esen a ions, 1-6.
[26] WANG, Y., SKERRY-RYAN, R. J., STANTON, D., WU, Y., WEISS, R.,
JAITLY, N., YANG, Z., XIAO, Y., CHEN, Z., BENGIO, S., LE, Q., AGI-
OMYRGIANNAKIS, Y., CLARK, R., SAUROUS, R. 2017. «Taco on: To-
wa ds End- o-End Speech Syn hesis». P oc. In e speech, 4006-4010.
[27] SHEN, J., PANG, R., WEISS, R. J., SCHUSTER, M., JAITLY, N., YANG,
Z., CHEN, Z., ZHANG, Y., WANG, Y., SKERRV-RYAN, R., SAUROUS,
R. A., AGIOMVRGIANNAKIS, Y., WU, Y. 2018. «Na u al TTS Syn hesis
by Condi ioning Wa ene on MEL Spec og am P edic ions». ICASSP, IEEE
In e na ional Con e ence on Acous ics, Speech and Signal P ocessing - P o-
ceedings, 4779-4783.
h ps://doi.o g/10.1387/ekaia.22077 193
Aho s sin e iko pe sonaliza uak: espe ien zia ba en desk ibapena
[28] PING, W., PENG, K., CHEN, J. 2018. «Cla iNe : Pa allel Wa e Gene a ion
in End- o-End Tex - o-Speech». a Xi p ep in a Xi :1807.07281 (ikus e-
da a: 2021/10/01).
[29] GRIFFIN, D. W., LIM, J. S. 1984. «Signal Es ima ion om Modi ied Sho -
Time Fou ie T ans o m». IEEE T ansac ions on Acous ics, Speech, and
Signal P ocessing, 32, 236-243.
[30] LI, B., ZHANG, Y., SAINATH, T., WU, Y., CHAN, W. 2018. «By es a e
All You Need: End- o-End Mul ilingual Speech Recogni ion and Syn hesis
wi h By es». ICASSP, IEEE In e na ional Con e ence on Acous ics, Speech
and Signal P ocessing - P oceedings, 5621-5625.
[31] TOMAN, M., MELTZNER, G. S., PATEL, R. 2018. «Da a equi emen s,
selec ion and augmen a ion o DNN-based speech syn hesis om
c owdsou ced da a». In e speech:Annual Con e ence o he In e na ional
Speech Communica ion Associa ion, 2878-2882.
[32] YAMAGISHI, J., NOSE, T., ZEN, H., LING, Z.-H., TODA, T., TOKUDA,
K., KING, S., RENALS, S. 2009. «Robus Speake -Adap i e HMM-Based
Tex - o-Speech Syn hesis». IEEE T ansac ions on Audio, Speech, and Lan-
guage P ocessing, 17, 1208-1230.
[33] ANASTASAKOS, T., MCDONOUGH, J., MAKHOUL, J. 1997. «Speake
adap i e aining: A maximum likelihood app oach o speake no maliza-
ion». ICASSP, IEEE In e na ional Con e ence on Acous ics, Speech and
Signal P ocessing - P oceedings, 1043-1046.
[34] YAMAGISHI, J., KOBAYASHI, T., NAKANO, Y., OGATA, K., ISO-
GAI, J. 2009. «Analysis o Speake Adap a ion Algo i hms o HMM-
Based Speech Syn hesis and a Cons ained SMAPLR Adap a ion Algo-
i hm». IEEE T ansac ions on Audio, Speech, and Language P ocessing,
17, 66-83.
[35] TAMURA, M., MASUKO, T., TOKUDA, K., KOBAYASHI, T. 2001.
« Adap a ion o pi ch and spec um o HMM-based speech syn hesis using
MLLR». ICASSP, IEEE In e na ional Con e ence on Acous ics, Speech and
Signal P ocessing - P oceedings, 805-808.
[36] DIGALAKIS, V. V., RTISCHEV, D., NEUMEYER, L. G. 1995. «Speake
Adap a ion Using Cons ained Es ima ion o Gaussian Mix u es». IEEE
T ansac ions on Speech and Audio P ocessing, 3, 357-366.
[37] CREER, S. Pe sonalising Syn he ic Voices o Indi iduals wi h Se e e
Speech Impai men , Ph.D. Dise a ion, Uni e si y o She ield, 2009.
[38] ERRO, D., SAINZ, I., NAVAS, E., HERNÁEZ, i. 2011. «Imp o ed HNM-
Based Vocode o S a is ical Syn hesize s». In e speech, 1809-1812.
[39] ERRO, D., ALONSO, A., SERRANO, L., NAVAS, E., HERNAEZ, i. 2013.
«New Me hod o Rapid Vocal T ac Leng h Adap a ion in HMM-based
Speech Syn hesis». Eigh h ISCA wo kshop on Speech Syn hesis, 125-128.
[40] YANAGISAWA, K., LATORRE, J., WAN, V., GALES, M. J. F., KING, S.
2013. «Noise Robus ness in HMM-TTS Speake Adap a ion». P oc.
8 h ISCA Speech Syn hesis wo kshop, 119-124.

194 Ekaia, ale be ezia 2021, 173-194
Inmaculada He náez, E a Na as, Ibon Sa a xaga, Jon Sánchez
[41] ERRO, D., ZORILǎ, T. C., STYLIANOU, Y., NAVAS, E., HERNÁEZ, i.
2013. «S a is ical syn hesize wi h embedded p osodic and spec al modi i-
ca ions o gene a e highly in elligible speech in noise». P oc. In e speech,
3557-3561.
[42] YAMAGISHI, J., VEAUX, C., KING, S., RENALS, S. 2012. «Speech syn-
hesis echnologies o indi iduals wi h ocal disabili ies: Voice banking and
econs uc ion». Acous ical Science and Technology, 33, 1-5.
[43] SAINZ, I., ERRO, D., NAVAS, E., HERNÁEZ, I., SÁNCHEZ, J.,
SARATXAGA, I., ODRIOZOLA, I., LUENGO, i. 2010. «Aholab Speech
Syn hesize s o Albayzin2010». VI Jo nadas de Tecnologías del Habla and
II Ibe ian SL Tech wo kshop FALA 2010, 343-348.
[44] HERNAEZ, I., NAVAS, E., MURUGARREN, J. L., ETXEBARRIA, B.
2001. «Desc ip ion o he AhoTTS Con e sion Sys em o he Basque Lan-
guage». SSw4-2001, 202.
[45] SESMA, A., MORENO, A. 2000. Co pusC 1.0: Diseño de Co pus O ales
Equilib ados. Technical Repo , UPC.
[46] Model Talke , h ps://www.model alke .o g/ (ikus e-da a: 2021/10/01).
[47] The Voice Keepe , h ps:// he oicekeepe .com/ (ikus e-da a: 2021/10/01).
[48] VocalID, h ps:// ocalid.ai/ (ikus e-da a: 2021/10/01).
[49] SpeakUnique h ps://www.speakunique.co.uk (ikus e-da a: 2021/10/01)./
[50] ERRO, D., HERNÁEZ, I., ALONSO, A., GARCÍA-LORENZO, D., NA-
VAS, E., YE, J., ARZELUS, H., JAUK, I., HY, N., MAGARIÑOS, C.,
SULÍR, M., TIAN, X., WANG, X., PEREZ RAMON, R. 2015. «Pe sonal-
ized Syn he ic Voices o Speaking Impai ed: Websi e and App». P oc. In-
e speech, 2015, 1251-1254.
[51] ARRUTI, J. Aho s Sin e ikoak Auke a zeko Ka alogoa en Diseinua, mas e
amaie ako lana, Euskal He iko Unibe si a ea, 2017.
[52] LO, E.-W. (VICTOR), GREEN, P. 2013. «De elopmen and E alua ion o
Au omo i e Speech In e aces: Use ul In o ma ion om he Human Fac o s
and he Rela ed Li e a u e». In e na ional Jou nal o Vehicula Technology,
2013.
[53] HINTERLEITNER, F., NEITZEL, G., MöLLER, S., NORRENBROCK, C.
R. 2011. «An e alua ion p o ocol o he subjec i e assessmen o ex - o-
speech in audiobook eading asks». Blizza d Challenge wo kshop.
[54] FIANNACA, A. J., PARADISO, A., CAMPBELL, J., MORRIS, M. R.
2018. «Voicese ing: Voice au ho ing uis o imp o ed exp essi i y in aug-
men a i e communica ion». Con e ence on Human Fac o s in Compu ing
Sys ems - P oceedings, 1-12.
[55] NAVAS, E., HERNAEZ, I., ERRO, D., SALABERRÍA, J., OYHARçA-
BAL, B., PADILLA, M. 2015. «Na a -Lapu a euskalkia en zako euskal
TTS ba ga a zea». Euskalingua, 26, 22-27.