Redimensionamien o Din´amico de Aplicaciones
Maleables median e RMA
Ike Ma ´ın-´
Al a ez1, Jos´e I. Aliaga1, Ma ibel Cas illo1
Resumen— La edimensi´on din´amica de aplicaciones
maleables en compu aci´on de al as p es aciones nece-
si a mecanismos e icien es de edis ibuci´on de da os
que le pe mi a adap a se a los cambios en el n´ume o
de p ocesos, minimizando al mismo iempo la sob e-
ca ga de ejecuci´on y el iempo de edimensi´on. Es e
abajo explo a nue os m´e odos de comunicaci´on uni-
la e al basados en ope aciones de Acceso Remo o a
Memo ia (RMA) en MPI, pe mi iendo a los p ocesos
ecupe a da os sin la pa icipaci´on expl´ıci a de los
p ocesos o igen. Adem´as, se in oduce la es a egia
Wai Ta ge s, que pe mi e econ igu aciones e icien es
en segundo plano con RMA, buscando minimiza su
impac o en la ejecuci´on de la aplicaci´on. Es os m´e o-
dos se han in eg ado en MaM, una biblio eca pa a e-
dimensiona aplicaciones en iempo de ejecuci´on, pa a
compa a los con la edis ibuci´on adicional basada
en ope aciones colec i as. La e aluaci´on expe imen al
mues a que, a pesa de su educido impac o en las
i e aciones en cu so, los m´e odos unila e ales ob ienen
p es aciones simila es a las ope aciones colec i as pe-
o nunca les supe an, debido a sus ele ados cos es de
inicializaci´on. Si es e sob ecos e uese educido, los
en oques unila e ales pod ´ıan con e i se en una al-
e na i a compe i i a, pe mi iendo econ igu aciones
e icien es en segundo plano sin impac a compu acio-
nalmen e a la aplicaci´on.
Palab as cla e— HPC, Maleabilidad, MPI, Recu sos
Din´amicos, RMA
I. In oducci´
on
EN la ac ualidad, se ha alcanzado la e a exascale
en la compu aci´on de al as p es aciones (High-
Pe o mance Compu ing, HPC), donde las capacida-
des de c´alculo de los g andes sis emas con in´uan c e-
ciendo cada a˜no, como e leja la lis a TOP 500 [1].
Es e a ance se debe p incipalmen e a dos ac o es:
po un lado, las mejo as en el ha dwa e, que a ec an
a la memo ia, almacenamien o, edes de comunica-
ci´on, y el ni el de pa alelismo en los p ocesado es;
y po o o, el desa ollo de nue os modelos de p o-
g amaci´on, un imes y biblio ecas que sean capaces
de explo a es as ecnolog´ıas. Sin emba go, m´ul i-
ples es udios e elan que a´un exis en desa ´ıos pa a
maximiza la u ilizaci´on de los ecu sos en sis emas
HPC, des acando aspec os como el uso e icien e de
las CPUs, las GPUs y la memo ia [2]. As´ı, es com´un
encon a abajos que solici en m´as nodos de los ne-
cesa ios, pa a implemen a ´ecnicas de ole ancia a
allos [3], o que no log en ap o echa odos los ecu -
sos asignados du an e sus dis in as ases de ejecuci´on.
Es a ine iciencia se ag a a en si uaciones donde cie -
os nodos pe manecen inac i os mien as o os a-
bajos espe an ecu sos, e idenciando as´ı la necesidad
de mejo a la ges i´on de es os sis emas.
La ges i´on din´amica de ecu sos pe mi e que los
1Dp o. de Ingenie ´ıa y Ciencia de los Compu ado es,
Uni e si a Jaume I de Cas ell´o, e-mails: [email p o ec ed],
[email p o ec ed],[email p o ec ed]
abajos modi iquen, en iempo de ejecuci´on, el
n´ume o de ecu sos que ienen asignados siemp e y
cuando el ges o de ecu sos (Resou ce Manage Sys-
em, RMS) y las aplicaciones puedan adap a se a es-
os cambios. Es a capacidad ha demos ado se una
es a egia e icaz pa a mejo a el uso de in aes uc-
u as HPC de acue do a di e en es obje i os espec´ı i-
cos de op imizaci´on. En e los p incipales obje i os
se encuen an la maximizaci´on de la u ilizaci´on de
ecu sos [4], el aumen o de la e iciencia compu acio-
nal [5] o ene g´e ica [6], [7], y el inc emen o del en-
dimien o en ope aciones de I/O [8].
Desde la pe spec i a de la aplicaci´on, es a capaci-
dad de adap aci´on se conoce como maleabilidad [9].
En es e abajo, es e concep o se de ine como la ca-
pacidad de una aplicaci´on pa alela dis ibuida pa a
edimensiona se din´amicamen e, modi icando, an-
as eces como sea necesa io, el n´ume o de p ocesos
MPI [10] asignados du an e su ejecuci´on. Es a lexi-
bilidad pe mi e mejo a el endimien o de la aplica-
ci´on al amplia los ecu sos asignados, cuando es os
son abundan es, o libe a ecu sos en si uaciones de
al a demanda, educiendo as´ı el iempo de espe a de
o os abajos del sis ema. Adem´as, acili a la asig-
naci´on del n´ume o ´op imo de ecu sos a la aplicaci´on
siemp e que las condiciones lo pe mi an.
La maleabilidad se ac i a en pun os de con ol es-
pec´ı icos de la aplicaci´on. Es os pueden localiza se al
inicio o al inal de una i e aci´on en una aplicaci´on
i e a i a, o al inicio de una ase en una aplicaci´on
m´as gene al. Su ac i aci´on desencadena la ejecuci´on
de una se ie de e apas:
1. Reasignaci´on de ecu sos: El RMS decide si de-
be edimensiona el abajo seg´un una pol´ı ica
de asignaci´on de ecu sos din´amica [11], [12]. Si
no es el caso, el es o de e apas no se ealizan.
2. Ges i´on de p ocesos. La decisi´on del RMS de-
e mina si se c ean o inalizan p ocesos MPI. Los
p ocesos p e ios a la edimensi´on se conside an
sou ces, mien as que los que con in´uan as la
misma son a ge s.
3. Redis ibuci´on de da os: En la que se ealiza la
ans e encia de da os en e p ocesos.
4. Reanuda la ejecuci´on. Al inal, la aplicaci´on
con inua su ejecuci´on con los p ocesos a ge .
El o den p esen ado co esponde con una econ igu-
aci´on en la que la ges i´on de p ocesos c ea a ge
p ocesos y elimina sou ce p ocesos. Pe o la u iliza-
ci´on de ´ecnicas m´as e icien es puede solapa las e a-
pas 2 y 3, cambiando el o den de alguna de sus a eas.
Las e apas 2 y 3 ienen un al o cos e compu acio-
nal, po lo que esul a undamen al op imiza su im-
plemen aci´on. Di e sos abajos p e ios [13], [14] han
abo dado es e desa ´ıo, p oponiendo di e en es en o-
ques pa a op imiza dichas e apas.
En es e a ´ıculo se p esen a un nue o m´e odo pa-
a la edis ibuci´on de da os en aplicaciones pa alelas
dis ibuidas, basado en el modelo de acceso emo o
a memo ia (Remo e Memo y Access, RMA), u ili-
zando comunicaciones unila e ales [15]. Una de las
p incipales en ajas de es as comunicaciones es que
educe signi ica i amen e el impac o sob e los p o-
cesos sou ce, ya que es os no pa icipan ac i amen-
e en la edis ibuci´on. La p opues a incluye adem´as
una nue a es a egia de sinc onizaci´on que iene en
cuen a el es ado de los p ocesos a ge . Es a es a e-
gia es ´a dise˜nada espec´ı icamen e pa a op imiza las
econ igu aciones en segundo plano, ya que pe mi e
que la aplicaci´on con in´ue ejecu ´andose mien as se
ealiza la edis ibuci´on de da os.
Es e abajo p esen a en de alle el dise˜no, la im-
plemen aci´on y la e aluaci´on de los m´e odos y es-
a egia mencionados, des acando sus en ajas y sus
limi aciones en ´e minos de endimien o y e iciencia,
en compa aci´on con los m´e odos adicionales de e-
dis ibuci´on de da os. Siguiendo es os comen a ios,
sus p incipales con ibuciones son las siguien es:
Dise˜no de dos m´e odos de edis ibuci´on de da-
os basados en comunicaciones unila e ales.
Dise˜no de la es a egia de sinc onizaci´on Wai
Ta ge s, en la que los p ocesos sou ce con in´uan
su ejecuci´on has a con i ma que los a ge s han
inalizado la ecepci´on de los da os.
E aluaci´on de las ´ecnicas p esen adas en el
a ´ıculo, compa ando sus p es aciones con o as
´ecnicas ya p esen adas en es udios p e ios.
El es o del a ´ıculo se o ganiza como sigue. La
Secci´on II desc ibe P o eo, el amewo k u ilizado
pa a lle a a cabo la maleabilidad y ealiza la expe-
imen aci´on. La Secci´on III de alla las ´ecnicas im-
plemen adas pa a comple a la e apa 3 de maleabi-
lidad, mien as que en la Secci´on IV se mues an los
esul ados ob enidos al e alua es as ´ecnicas sob e
un cl´us e con 8 nodos. Finalmen e, la Secci´on V p e-
sen a las conclusiones del es udio.
II. P o eo
A. Desc ipci´on gene al
P o eo es un amewo k ampliamen e con igu able
dise˜nado pa a acili a el desa ollo de benchma ks
u ilizados en el an´alisis de los e ec os de la in eg a-
ci´on de la maleabilidad en aplicaciones eales [16]. Su
lexibilidad pe mi e e alua el impac o de la malea-
bilidad en el endimien o de aplicaciones en g andes
sis emas, compa ando di e en es al e na i as.
La Figu a 1 mues a la a qui ec u a in e na de
P o eo, que se compone de dos m´odulos p incipales:
el M´odulo de Aplicaci´on Sin ´e ica (SAM) y el M´odu-
lo de Maleabilidad (MaM). El m´odulo SAM es ´a di-
se˜nado pa a emula el compo amien o compu acio-
nal de cualquie aplicaci´on pa alela basada en MPI,
u ilizando los pa ´ame os almacenados en un a chi o
Fig. 1: A qui ec u a de P o eo
de con igu aci´on. Es a uncionalidad pe mi e ep o-
duci ca gas de abajo sin ´e icas simila es al com-
po amien o de aplicaciones eales, acili ando as´ı
su e aluaci´on en dis in os escena ios. Po su pa -
e, el m´odulo MaM se enca ga de la econ igu aci´on
din´amica de las aplicaciones, ajus ando el n´ume o
de p ocesos en ejecuci´on e implemen ando odas las
e apas de la maleabilidad, especialmen e la 2 y la 3.
La combinaci´on de ambos m´odulos pe mi e que
SAM emule el compo amien o de un aplicaci´on con
di e en es con igu aciones, mien as que MaM ealiza
la ansici´on en e con igu aciones. De es e modo se
acili a la e aluaci´on de ´ecnicas de maleabilidad en
una aplicaci´on eal sin necesidad de implemen a las
di ec amen e sob e la o iginal, lo que esul a espe-
cialmen e alioso pa a busca la mejo al e na i a,
dado que es a a ea suele se muy compleja. MaM
ambi´en cuen a con una in e az especializada [17]
que simpli ica la inco po aci´on de es as ´ecnicas en
aplicaciones pa alelas eales, p opo cionando as´ı una
soluci´on e s´a il pa a e alua y aplica la maleabili-
dad en di e sos en o nos compu acionales.
Adem´as de los m´odulos p incipales, P o eo cuen-
a con subm´odulos de moni o izaci´on que egis an
m´e icas de endimien o de las aplicaciones emuladas
o e aluadas. Es a in o maci´on es muy aliosa pa a
analiza el impac o de la maleabilidad sob e la u ili-
zaci´on de ecu sos y la e iciencia de la ejecuci´on. La
in o maci´on ecopilada se almacena en a chi os de
salida pa a su pos e io an´alisis, lo que con ie e a
P o eo en una he amien a esencial pa a in es iga-
do es y desa ollado es que abajan en aplicaciones
pa alelas din´amicas.
B. MaM
El m´odulo MaM implemen a las dis in as e apas
que con o man el p oceso de maleabilidad en aplica-
ciones pa alelas, abo dando an o la ges i´on de p o-
cesos como la edis ibuci´on de da os. Pa a cada una
de es as e apas, MaM p opo ciona una se ie de m´e o-
dos y es a egias que pe mi en adap a el p oceso de
econ igu aci´on seg´un las necesidades del en o no de
ejecuci´on. En cada e apa es obliga o io selecciona
un ´unico m´e odo, el cual de ine c´omo se lle a ´a a
cabo la ope aci´on co espondien e. Po su pa e, las
es a egias son opcionales y pueden combina se lib e-
men e pa a op imiza el endimien o y la e iciencia
del sis ema. A con inuaci´on, se desc iben las ´ecnicas
implemen adas en MaM que han sido empleadas en
es e es udio.
En la ges i´on de p ocesos, el m´odulo MaM pa e de
un g upo inicial compues o po NS p ocesos sou ce
y un nue o g upo o mado po NT p ocesos a ge ,
pe mi iendo que un mismo p oceso pueda pe enece
a ambos g upos du an e la econ igu aci´on. De odos
los m´e odos y es a egias que implemen a MaM pa a
comple a la edimensi´on [13], en es e es udio se em-
plea exclusi amen e el m´e odo Me ge. Po lo an o, si
(NT > NS), se gene an (NT −NS) p ocesos nue os,
mien as que si (NS > NT ), se eliminan (NS −NT)
p ocesos. Es e m´e odo, o iginalmen e p opues o en
Flex-MPI [18], ha sido modi icado en MaM pa a eli-
mina la limi aci´on que imped´ıa educi el n´ume o
de p ocesos po debajo del alo inicial con el que se
lanza la aplicaci´on.
Du an e la e apa de edis ibuci´on de da os, el
m´odulo MaM pe mi e ans e i in o maci´on de o -
ma e icien e y semiau om´a ica en e los p ocesos
sou ce y a ge , an o con da os escala es como con
es uc u as unidimensionales, y admi iendo ipos p i-
mi i os o de i ados de MPI. Pa a ello, los da os se
clasi ican en dos ca ego ´ıas: cons an es o a iables.
Los cons an es no se modi ican du an e la ejecuci´on
de la aplicaci´on, po lo que pueden ans e i se u i-
lizando ope aciones bloquean es o no bloquean es,
seg´un con enga, pa a maximiza las p es aciones de
la aplicaci´on. Po su pa e, los a iables se modi ican
a la la go de la ejecuci´on, po lo que la ans e encia
debe ealiza se con ope aciones bloquean es.
MaM cuen a con di e sos m´e odos implemen ados
pa a lle a a cabo la edis ibuci´on de da os [14].
En es e es udio, se emplea uno de esos m´e odos que
se basa en el uso de ope aciones de comunicaci´on
colec i as (Collec i e), espec´ı icamen e la ope aci´on
MPI All oall . Adem´as, MaM inco po a a ias es a-
egias pa a op imiza es e p oceso: i) Th eading, que
acili a la edis ibuci´on en segundo plano pe mi ien-
do que la ope aci´on colec i a sea ealizada po hilos
auxilia es; ii) Non-blocking, que implemen a las e-
dis ibuciones de da os en segundo plano u ilizando
p imi i as de MPI no bloquean es; iii) Wai Ta ge s,
una a ian e de la an e io en la que se inco po a una
condici´on adicional pa a asegu a que la ecepci´on de
los da os se ha comple ado.
En es e abajo se a˜naden dos nue os m´e odos ba-
sados en RMA a MaM que comple an la edis ibu-
cion de da os, y que se ´an desc i os en la secci´on III-
B. Es os m´e odos pueden se combinados con las es-
a egias Th eading yWai Ta ge s, que pe mi en
que la edis ibuci´on de da os se pueda ejecu a en
segundo plano mien as se ejecu a la aplicaci´on.
III. Redis ibuci´
on de da os
En es a Secci´on se indica como u iliza las p imi-
i as RMA de MPI pa a ealiza la edis ibuci´on de
da os eque ida en una econ igu aci´on. Adem´as, se
in oduce una nue a es a egia que pe mi e ealiza
es a edis ibuci´on de o ma no bloquean e.
A. Desc ipci´on gene al RMA
La comunicaci´on median e RMA es un modelo de
p og amaci´on en MPI, inclu´ıdo en MPI-2 con el con-
cep o de comunicaciones unila e ales [15]. Es e mo-
delo pe mi e que un p oceso acceda di ec amen e a la
memo ia de o os p ocesos pa a in e cambia da os, a
di e encia del modelo adicional de comunicaci´on en
MPI en el que es necesa io una sinc onizaci´on en e
los p ocesos. Es e mecanismo educe la sob eca ga de
la ges i´on de mensajes, y pe mi e op imiza el acceso
a da os en sis emas con un g an n´ume o de p ocesos,
lo que es especialmen e adecuado pa a pa ones de
comunicaci´on i egula es o din´amicos.
Se dis inguen dos ipos de p ocesos en la comuni-
caci´on con RMA: el p oceso o igen y el p oceso des-
ino. El p oceso des ino es el que expone una egi´on
de su memo ia pa a que o o p oceso pueda accede
a ella, mien as que el p oceso o igen es el que eali-
za la comunicaci´on, ya sea leyendo o esc ibiendo en
la memo ia expues a po el p oceso des ino.
Es e modelo se es uc u a en es componen es
undamen ales: en anas de memo ia,ope aciones
emo as ymecanismos de sinc onizaci´on. Las en-
anas de memo ia son las egiones de memo ia que
el p oceso des ino expone pa a que los p ocesos o i-
gen accedan a ellas. Exis en dos ipos p incipales de
ope aciones emo as sob e los da os en una en a-
na: las de ipo Pu (esc i u a) y Ge (lec u a). Pa a
ga an iza la cohe encia de los da os, RMA p opo -
ciona mecanismos de sinc onizaci´on que con olan
el acceso segu o a las en anas, asegu ando que las
ope aciones se comple en de o ma o denada y con-
sis en e. En es e con ex o, se in oduce el concep o
de ´epoca, que de ine el in e alo de iempo du an e
el cual se pe mi e que un p oceso o igen ealice ope-
aciones en las en anas de memo ia de los p ocesos
des ino. Pues bien, los mecanismos de sinc onizaci´on
son los que ges ionan las ´epocas, delimi ando cla-
amen e cu´ando se inicia y inaliza el acceso a las
en anas de memo ia, lo que p opo ciona un en o no
con olado pa a las comunicaciones y ga an iza la co-
he encia en el in e cambio de in o maci´on.
En la pa e supe io de la Figu a 2 se mues a
una ope aci´on de comunicaci´on u ilizando ope acio-
nes adicionales de MPI, como Send yRec , mien-
as que en la pa e in e io de la misma igu a apa-
ece una comunicaci´on basada en RMA. En es e ´ul i-
mo caso, se obse a que no es necesa io ealiza una
sinc onizaci´on expl´ıci a en e los p ocesos que pa i-
cipan en la comunicaci´on, po lo que el p oceso o i-
gen (1) puede con inua su ejecuci´on sin depende
de que el des ino (0) es ´e lis o o no. Sin emba go,
es e hecho no signi ica que las comunicaciones RMA
sean comple amen e as´ınc onas, ya que la de inici´on
Fig. 2: Di e encias de sinc onizaci´on en e una llamada con-
encional (a iba) y una unila e al (abajo).
de las en anas equie e una sinc onizaci´on, y el uso
de ope aciones emo as debe segui modelos que ga-
an icen la cohe encia de los da os.
Exis en es modelos p incipales que ges ionan el
acceso y la cohe encia de los da os en memo ia emo-
a. (i) El modelo ac i o equie e que odos los p oce-
sos que han abie o en anas pa icipen ac i amen e
en el p oceso de sinc onizaci´on. Po lo an o, odos
los p ocesos deben coo dina se pa a inicia y inaliza
el in e cambio de da os, ga an izando as´ı que odas
las modi icaciones se e lejen co ec amen e. (ii) El
modelo ac i o gene alizado o ece mayo lexibilidad
al pe mi i que solo un g upo espec´ı ico de p oce-
sos pa icipe en la sinc onizaci´on. De es e modo, no
es necesa io que odos los p ocesos se coo dinen si-
mul ´aneamen e, lo que mejo a la e iciencia en pa o-
nes de comunicaci´on i egula es o din´amicos. (iii) El
modelo pasi o pe mi e que el p oceso o igen acceda
di ec amen e a la memo ia del p oceso des ino sin
que es e ´ul imo in e enga ac i amen e. Es e en o-
que es ideal cuando los p ocesos o igen solo necesi-
an lee la memo ia de o os p ocesos, como ocu e
en una econ igu aci´on maleable.
El Lis ado 1 mues a las p incipales unciones pa-
a ealiza ans e encias usando el modelo pasi o
den o del con ex o de una econ igu aci´on malea-
ble. As´ı, las unciones Win c ea e yWin ee c ean
y libe an una en ana, siendo ope aciones colec i as
y bloquean es pa a odos los p ocesos en el comuni-
cado asociado. Po su pa e, la unci´on Ge pe mi e
lee da os de una en ana. Mien as que las uncio-
nes Lock yUnlock ab en y cie an una ´epoca en un
p oceso des ino conc e o.
La llamada Lock debe inclui el ipo de acceso pe -
mi ido, que puede se SHARED oEXCLUSIVE. El
p ime o pe mi e que m´ul iples p ocesos accedan de
modo simul ´aneo a los da os de la en ana, mien as
que el segundo es inge el acceso a un ´unico p oceso.
En el caso de las econ igu aciones, se u iliza el ac-
ceso compa ido, ya que ´unicamen e se ealizan ope-
aciones de lec u a. Adem´as, la llamada Lock debe
inclui la bande a MPI MODE NOCHECK, ya que
el en o no de MPI no necesi a comp oba si exis en
accesos con lic i os. Po su pa e, la llamada Unlock
bloquea al p oceso o igen has a que odas las ope a-
ciones den o de una ´epoca hayan sido comple adas.
Adem´as, ambas unciones ienen una a ian e con el
su ijo all, que pe mi e de ini una ´epoca como el acce-
so simul ´aneo de un p oceso o igen a m´ul iples des-
inos sin necesidad de especi ica lo indi idualmen e.
Lis ado 1: Funciones de MPI pa a comunicaciones unila e ales
pasi as.
1in MPI_Win_c ea e(...);
2in MPI_Win_ ee(...);
3in MPI_Ge (...) ;
4in MPI_Win_lock ( in lock ype , in ank ,
5in asse , MPI_Win win);
6in MPI_Win_unlock(...);
7in MPI_Win_lock_all ( in asse , MPI_Win win );
8in MPI_Win_unl ock_a ll (...) ;
B. Implemen aci´on en MaM
En es e abajo se ha ampliado la uncionalidad
de MaM, inco po ando el uso del modelo pasi o de
las ope aciones unila e ales pa a ealiza la edis i-
buci´on de da os. En es e en oque, los p ocesos sou -
ce solo equie en que sus da os es ´en disponibles en
en anas de memo ia, pe mi iendo que los p ocesos
a ge accedan di ec amen e a sus da os sin que los
sou ce pa icipen ac i amen e en la comunicaci´on.
Se ´a necesa io sinc oniza adecuadamen e la ape -
u a y el cie e de las en anas pa a ga an iza la
cohe encia de la in o maci´on.
La Figu a 3 mues a un ejemplo de edis ibuci´on
de da os median e RMA, en el que dos p ocesos a -
ge ,YeY+1, deben ob ene in o maci´on desde dis-
in os p ocesos sou ce,X,X+1 y X+2. En es e esce-
na io, cada p oceso sou ce (ac uando como p oceso
des ino) de ine una en ana de memo ia que con ie-
ne odos los da os a edis ibui , pe mi iendo que
los p ocesos a ge (ac uando como p ocesos o igen)
accedan di ec amen e a es as en anas pa a lee la
in o maci´on. Po su pa e, un p oceso a ge puede
eque i accede a una o m´as en anas de memo ia
pa a ob ene oda la in o maci´on que necesi a, po lo
que es necesa io conoce de an emano la in o maci´on
que se debe lee de cada en ana de memo ia an es
de inicia la edis ibuci´on de da os.
El Algo i mo 1 mues a los c´alculos eque idos po
los p ocesos a ge , pa a conoce cu´an os elemen os
debe lee de cada en ana de memo ia. En es e calcu-
lo se u ilizan dos unciones: Ge sou ce g oup que in-
dica el n´ume o de p ocesos sou ce desde los cuales se
ob end ´a la in o maci´on, y Block id que de e mina
los alo es ini yend, que de inen el ango de ele-
men os que cada p oceso almacena en unci´on de su
iden i icado y del n´ume o de p ocesos en su g upo.
B´asicamen e, cada p oceso a ge debe conoce qu´e
elemen os lee en cada sou ce calculando la in e sec-
ci´on en e su in e alo de da os y el de los p ocesos
sou ce. Si no exis e in e secci´on, no se ealiza ningu-
na lec u a, pe o si la hay, se calcula el n´ume o de
elemen os co espondien es y su alo se almacena
en el ec o coun s. Adem´as, la posici´on de memo ia
del a ge en la que se deben esc ibi los elemen os
le´ıdos se egis a en el ec o displs. Los escala es
i s sou ce ylas sou ce almacenan, espec i amen-
e, la p ime a y la ´ul ima en ana a la que se debe
Fig. 3: Redis ibuci´on de da os con RMA.
Algo i mo 1 Pa ´ame os de comunicaci´on en a ge .
s size =Ge sou ce g oup()
ini, end =Block id(myId)
coun s =calloc(s size)
displs =calloc(s size + 1)
i s sou ce =−1
o (i= 0; i < s size;i++ )do
s ini, s end =Block id(i)
i (ini ≥s end||end ≤s ini) hen
i ( i s sou ce == −1) hen
i s sou ce =i
i s index =ini −s ini
end i
big ini =ini > s ini?ini :s ini
small end =end < s end?end :s end
coun s[i] = small end −big ini
displs[i+ 1] = displs[i] + coun s[i]
else
i ( i s sou ce! = −1) hen
las sou ce =i
b eak
end i
end i
end o
accede , mien as que i s index indica la posici´on
desde la cual se debe inicia la lec u a de da os en la
en ana de memo ia de i s sou ce. S´olo es necesa-
io calcula es e ´ul imo alo en la p ime a en ana,
debido a la na u aleza de la dis ibuci´on po bloques.
Es e abajo p esen a dos m´e odos pa a la edis-
ibuci´on de da os median e comunicaciones unila e-
ales, desc i os en los Algo i mos 2 y 3. En ambos
casos, la comunicaci´on se inicia con la c eaci´on de
una en ana po pa e de odos los p ocesos pa i-
cipan es, que es ac´ıa pa a los p ocesos a ge e in-
cluye los da os a edis ibui en los p ocesos sou ce,
y concluye con la des ucci´on de dicha en ana. La
p incipal di e encia de ambos m´e odos es el n´ume o
de ´epocas u ilizadas du an e la ope aci´on.
Algo i mo 2 M´e odo RMA1: Lock+Unlock.
i (p oceso es a ge ) hen
i (p oceso es solo a ge ) hen
da a =NULL
end i
window =MPI Win c ea e(da a)
i s sou ce =ge i s sou ce()
las sou ce =ge las sou ce()
i s index =ge i s index()
lock =MP I LOCK SHARED
asse =MP I MODE NOCHECK
o (i= i s sou ce;i < las sou ce;i++ )do
MPI Win lock(i, lock, asse )
MPI Ge (i→myId, displs[i], i s index, coun s[i])
i s index = 0
end o
o (i= i s sou ce;i < las sou ce;i++ )do
MPI Win unlock(i)
end o
MPI Win ee(window)
else
window =MPI Win c ea e(da a)
...
MPI Win ee(window)
end i
Algo i mo 3 M´e odo RMA2: Lockall+Unlockall.
i (p oceso es a ge ) hen
i (p oceso es solo a ge ) hen
da a =NULL
end i
window =MPI Win c ea e(da a)
i s sou ce =ge i s sou ce()
las sou ce =ge las sou ce()
i s index =ge i s index()
asse =MP I MODE NOCHECK
MPI Win lock all(asse )
o (i= i s sou ce;i < las sou ce;i++ )do
MPI Ge (i→myId, displs[i], i s index, coun s[i])
i s index = 0
end o
MPI Win unlock all
MPI Win ee(window)
else
window =MPI Win c ea e(da a)
...
MPI Win ee(window)
end i
C. Modi icaciones pa a una implemen aci´on en se-
gundo plano
Los m´e odos desc i os en la secci´on an e io pe mi-
en ealiza la edis ibuci´on de da os u ilizando co-
municaciones unila e ales de o ma bloquean e. Es-
o impide que la aplicaci´on pueda con inua su eje-
cuci´on mien as se comple a es a comunicaci´on, au-
men ando el cos e de inalizaci´on de la aplicaci´on. En
es a secci´on se p esen an dos al e na i as pa a elimi-
na es e impedimen o: el uso de Th eading, o de la
es a egia Wai Ta ge s de MaM.
En la p ime a de las al e na i as, se p opone c ea
un hilo auxilia en cada p oceso sou ce, que sea el
enca gado de comple a la edis ibuci´on en segundo
plano, u ilizando el Algo i mo 2 o el Algo i mo 3. De
es a o ma, se libe a de ca ga a los hilos p incipales,
que pueden segui ejecu ando la aplicaci´on, y consul-
ando a los hilos auxilia es si la edis ibuci´on se ha
comple ado, cuando lo conside en.
La inco po aci´on de la es a eg´ıa Wai Ta ge s en
los Algo i mos 2 y 3 se inicia analizando las sinc o-
nizaciones que es os algo i mos incluyen. As´ı, la un-
ci´on MPI Unlock bloquea al p oceso que la u iliza
has a que odas sus ope aciones MPI Ge se hayan
comple ado, mien as que la unci´on MPI Win ee
equie e que odos los p ocesos del comunicado la
in oquen pa a comple a se, ac uando como una ope-
aci´on de sinc onizaci´on colec i a que bloquea an o
a los p ocesos que no ealizan ninguna lec u a como a
los que ya la han comple ado. Si es e bloqueo se eali-
za sob e p ocesos sou ce, se impide que la aplicaci´on
pueda con inua su ejecuci´on mien as la comunica-
ci´on se comple a, aumen ando el iempo de ejecuci´on
de la aplicaci´on. Pa a mejo a es e compo amien-
o, se p opone di idi el c´odigo de los algo i mos en
dos unciones: Ini RMA que inicia la edis ibuci´on
y llama a MPI Win c ea e;Comple e RMA que u i-
liza MPI Unlock pa a inaliza las comunicaciones y
MPI Win ee pa a libe a las en anas de memo ia.
Pa a e i a el bloqueo que se p oduce en un p oce-
so cuando se u iliza MPI Unlock, se p opone u iliza
la unci´on MPI Rge , que ealiza la misma a ea que
MPI Ge , pe o de ol iendo un obje o MPI Reques .
El uso de es e ipo de obje os pe mi e con ola el
es ado de la ope aci´on de o ma no bloquean e, u i-
lizando la unci´on MPI Tes . As´ı, los p ocesos sou ce
pueden consul a pe i´odicamen e el es ado de la co-
municaci´on, y con inua la ejecuci´on de la aplicaci´on
en el caso que la llamada a MPI Tes le indique que
la comunicaci´on no ha inalizado.
Po su pa e, e i a el bloqueo de la unci´on
MPI Win ee equie e conoce cuando han comple-
ado la comunicaci´on odos los p ocesos, pe mi ien-
do que los p ocesos sou ce sigan ejecu ando la apli-
caci´on mien as no se cumpla es a condici´on. Pa-
a esol e es e p oblema, se p opone u iliza la es-
a egia Wai Ta ge s de MaM, que u iliza la un-
ci´on MPI Iba ie pa a sinc oniza odos los p o-
cesos in oluc ados. Es a unci´on de uel e un obje o
MPI Reques , sob e el cual se puede u iliza la un-
ci´on MPI Tes , pa a hace un con ol no bloquean e
del es ado de la comunicaci´on, o la unci´on MPI Wai ,
que bloquea la ejecuci´on del p oceso has a la inali-
zaci´on de la comunicaci´on. As´ı, odos los p ocesos
hacen una llamada a MPI Iba ie , pe o solo los
p ocesos sou ce u ilizan MPI Tes , pa a pode con i-
nua la ejecuci´on de la aplicaci´on si la comunicaci´on
no ha inalizado, mien as que el es o de p ocesos
u ilizan MPI Wai , pa a espe a la inalizaci´on de la
comunicaci´on.
La Figu a 4 mues a el diag ama de lujo que des-
c ibe c´omo unciona Comple e RMA cuando se inco -
po a la es a egia Wai Ta ge s pa a ealiza en se-
gundo plano una edis ibuci´on u ilizando comunica-
ciones unila e ales. Apa ecen es lujos di e en es en
el diag ama, dependiendo del ipo de p oceso: aque-
llos que s´olo son a ge , los que s´olo son sou ce, y los
que son sou ce y a ge a la ez.
Los p ocesos que s´olo son a ge no ejecu an la
aplicaci´on, az´on po la que pueden u iliza las un-
ciones MPI Ge ,MPI Lock yMPI Unlock, aunque ello
suponga un bloqueo du an e la edis ibuci´on. Una
Fig. 4: Diag ama de lujo de Comple e RMA que comple a una
edis ibuci´on en segundo plano con RMA.
ez comple adas odas sus lec u as, deben llama a la
MPI Iba ie pa a indica al es o de p ocesos que
han inalizado, y luego u iliza MPI Wai (Iba ie ),
bloque´andose de nue o, pa a espe a a que el es o
de p ocesos ambi´en inalicen sus lec u as, an es de
elimina sus en anas de memo ia.
Po su pa e, los p ocesos que solo son sou ce no
ealizan ninguna lec u a de da os, po lo que su p i-
me a a ea es no i ica lo u ilizando MPI Iba ie . A
con inuaci´on, en an en un bucle en el que se eje-
cu a la aplicaci´on (Compu e) y se ealiza una e-
i icaci´on no bloquean e del es ado de las ope a-
ciones de lec u as del es o de p ocesos, u ilizando
MPI Tes (Iba ie ). Una ez comple ada oda la
edis ibuci´on, se eliminan sus en anas de memo ia.
Finalmen e, los p ocesos que son an o sou ces co-
mo a ge s ealizan la lec u a de da os de modo no
bloquean e, u ilizando MPI Rge s yMPI Locks. A
con inuaci´on, en an en un bucle en el que se eje-
cu a la aplicaci´on y se comp ueba si han inalizado
sus lec u as, u ilizando MPI Tes all(Rge s). Cuan-
do ´es as se comple an, se no i ica al es o de p ocesos
llamando a MPI Iba ie . En onces, uel en a en-
a en un bucle en el que se ejecu a la aplicaci´on, pe-
o aho a la condici´on e i ica de modo no bloquean-
e si odos los p ocesos han comple ado las lec u as
u ilizando MPI Tes (Iba ie ). Cuando se comple-
a la edis ibuci´on, se ealizan los co espondien es
Unlocks y se eliminan sus en anas de memo ia.
IV. Resul ados expe imen ales
En es a secci´on se p esen an los expe imen os y el
an´alisis ealizado pa a compa a los m´e odos desc i-
os en la Secci´on III.
A. Ha dwa e y So wa e u ilizados
Los expe imen os se han ealizado en un cl´us e
compues o po ocho nodos, cada uno equipado con
dos p ocesado es In el Xeon 4210 de 10 n´ucleos, su-
mando un o al de 160 n´ucleos. Los nodos es ´an in-
e conec ados median e una ed In iniBand EDR de
100 Gbps, u ilizando MPICH 4.2.0 [19], compilado
con CH4:OFI ne mod (In iniBand). La e si´on de
P o eo u ilizada se encuen a disponible p´ublicamen-
e en un eposi o io1, y los esul ados de los expe i-
men os es ´an disponibles de o ma p´ublica [20].
La e aluaci´on expe imen al u iliza SAM pa a emu-
la el algo i mo del G adien e Conjugado [21], una
aplicaci´on i e a i a que u iliza dos llamadas colec-
i as All educe y una Allga he . El ama˜no del p o-
blema u ilizado equie e ap oximadamen e 64 GB de
memo ia. Pa a pe mi i un co ec o es udio es ad´ıs i-
co, los expe imen os se han epe ido 20 eces y se ha
calculado la mediana de los esul ados.
Cada expe imen o incluye una ´unica econ igu a-
ci´on, que pa e de NS p ocesos sou ce aNT p ocesos
a ge . Dado que an o NS como NT oman alo es
en el conjun o 20,40,40,160, apa ecen un o al de 12
combinaciones di e en es. Po su pa e, el n´ume o de
nodos u ilizados en cada ejecuci´on se de e mina con
la ´o mula ⌈N/20⌉, donde Nes el mayo alo en e
NS yNT, pa a op imiza as´ı el consumo de ecu sos
usados en el sis ema.
La econ igu aci´on que apa ece en cada expe imen-
o hacen uso de MaM, con igu ado como sigue. Pa a
la ges i´on de p ocesos, se u iliz´o el m´e odo Me ge en
odos los expe imen os, siemp e en modo s´ınc ono
y bloquean e. En cambio, pa a la edis ibucion de
da os, se e alua on di e en es m´e odos y es a egias.
Los m´e odos conside ados ue on: COL (Collec i e
de MaM), RMA1 (Algo i mo 2), y RMA2 (Algo i -
mo 3). Adem´as, cuando los m´e odos se ejecu a on
de modo as´ınc ono, se conside a on las es a egias
Th eading (T), Non-Blocking (NB), y Wai Ta ge s
(WT) pa a el p ime m´e odo, y las es a egias Th ea-
ding yWai Ta ge s pa a los ´ul imos dos m´e odos.
B. Tiempos de edis ibuci´on bloquean es
La Figu a 5 mues a el iempo necesa io (en segun-
dos) pa a ealiza la edis ibuci´on, conside ando las
dis in as e siones bloquean es y a iando el n´ume o
de p ocesos sou ce y a ge in oluc ados.
De su an´alisis, se obse a que los m´e odos RMA1
y RMA2 p esen an un compo amien o muy simi-
la , siendo sus p es aciones lige amen e in e io es a
las de COL, ob eniendo una deg adaci´on m´ınima de
1,013×al expandi de 20 a 80 y una m´axima de
1,377×al educi de 80 a 20 p ocesos. Es e compo -
amien o se jus i ica, p incipalmen e, po el cos e de
c eaci´on de las en anas de memo ia, una ope aci´on
colec i a y bloquean e en e odos los p ocesos.
Po an o, la elecci´on en e los m´e odos RMA iene
poco impac o sob e el endimien o cuando se u iliza
en modo bloquean e.
1h ps://lo ca.ac .uji.es/gi lab/ma ini/
malleabili y_benchma k/-/ ee/Sa eco25
Fig. 5: Tiempos de econ igu aci´on en e siones bloquean es.
C. Tiempos de edis ibuci´on en segundo plano
En es a secci´on se ealiza un es udio m´as de alla-
do del compo amien o de las e siones as´ınc onas,
conside ando los di e en es m´e odos (COL, RMA1 y
RMA2) con las es a egias asociadas (T, NB, WT).
El p ime es udio analiza el impac o de ejecu a la
aplicaci´on simul ´aneamen e con la edis ibuci´on en
segundo plano. Pa a e alua es e e ec o, se calcula la
elaci´on en e el iempo de ejecuci´on de una i e a-
ci´on sin edis ibuci´on y el iempo de ejecuci´on de la
misma i e aci´on cuando se ealiza una edis ibuci´on
en segundo plano. A es a elaci´on se le denomina ω.
La Figu a 6 mues a como a ´ıa ωen unci´on del
m´e odo y es a egia u ilizados, y conside ando di e-
en es combinaciones del n´ume o de p ocesos sou ce
y a ge . As´ı, las e siones que emplean hilos auxilia-
es (T) son las m´as a ec adas, con inc emen os de ω
supe io es a 100 en las a ian es de RMA y alo es
comp endidos en e 43 y 123 pa a COL. Es os inc e-
men os se jus i ican po la apa ici´on de o e subsc ip-
ion en los nodos donde esiden los p ocesos sou ce,
que alen iza la ejecuci´on de los hilos p incipales.
Pa a un an´alisis m´as de allado de las e siones NB
y WT, en la Figu a 7 se mues a como a ´ıan es as
es a egias, sin conside a las a ian es T. La p i-
me a conclusi´on es que las e siones de RMA son
las que mejo es esul ados p esen an, con alo es de
ωce canos a 1 en la mayo ´ıa de los casos, siendo
2,8 el peo caso. La az´on que lo jus i ica es que el
n´ume o de p ocesos in oluc ados en la comunicaci´on
en es os m´e odos es siemp e igual a NT mien as
que en las a ian es de COL es e n´ume o es igual
a m´ax(NS, NT). Adem´as, los p ocesos in oluc ados
en RMA no necesi an ninguna sinc onizaci´on, sal o
as comple a se MPI Iba ie . Una segunda conclu-
si´on es que RMA2-WT siemp e ob iene alo es igua-
les o in e io es a RMA1-WT, debido a la educci´on
del n´ume o de ´epocas gene adas al u iliza Lock all.
Adem´as, las econ igu aciones que p esen an mayo-
es alo es de ωen es as a ian es son las educciones
a 20 o 40 p ocesos a ge , que puede jus i ica se po
la al a conges i´on gene ada en las comunicaciones.
La Figu a 8 mues a el n´ume o o al de i e acio-
nes ealizadas mien as la edis ibuci´on en segundo
plano es ´a en cu so, en unci´on de la e si´on u ilizada
y del n´ume o de p ocesos sou ce y a ge . El impac o
Fig. 6: Inc emen o del cos e de i e aciones (ω) en e siones en
segundo plano.
Fig. 7: Inc emen o del cos e de i e aciones (ω) en e siones
NB y WT.
eal sob e el iempo de inalizaci´on de la aplicaci´on
de es e es udio debe conside a de modo combinado
el n´ume o de i e aciones jun o con el alo de ωy de
los p ocesos implicados, es deci NS yNT .
La p incipal conclusi´on del an´alisis de es a igu a
es que las e siones COL-NB y COL-WT son las que
ealizan m´as i e aciones. Adem´as, los alo es m´as al-
os se jus i ican con al os ni eles de conges i´on en
la comunicaci´on, como en el caso (20,160) que al-
canza un n´ume o de i e aciones igual a 24, lo cual
iene sen ido. En cambio, el es o de e siones iene
un n´ume o de i e aciones en e 1 y 3, independien e-
men e del n´ume o o al de p ocesos in oluc ados, lo
cual se conside a un compo amien o inespe ado.
Un an´alisis de allado de la ejecuci´on de la a ian e
COL-T mues a que la az´on que jus i ica el n´ume o
an bajo de i e aciones es que la aplicaci´on se blo-
quea al ejecu a la ope aci´on Allga he . Dado que
la edis ibuci´on la ealiza el hilo auxilia y que el
en o no MPI se ha iniciado con el sopo e pa a hi-
los (MPI THREAD MULTIPLE), no hay ninguna
az´on que jus i ique que la heb a p incipal se blo-
quee. Po an o, se concluye que la e si´on de MPICH
u ilizada puede inclui alguna limi aci´on.
Respec o al an´alisis de las a ian es RMA, la ma-
yo pa e de su cos e se in ie e en la c eaci´on de las
en anas de memo ia, que es una ope aci´on colec i-
a en la que pa icipan an o p ocesos sou ce como
a ge . Du an e odo el iempo que se ealiza es a
ope aci´on, se comple a la mayo ´ıa de las lec u as de
da os, po lo que el n´ume o de i e aciones pod ´ıa se
Fig. 8: To al de i e aciones du an e una edis ibuci´on en se-
gundo plano.
igual a uno, pe o el n´ume o inal ob enido depende de
la a ian e u ilizada. En el caso de las a ian es WT,
una ez los p ocesos a ge han e minado sus lec u-
as, deben ealiza un MPI Iba ie y pos e io men-
e hace un MPI Tes (Iba ie ), ope aciones que el
en o no MPI di ´ıcilmen e puede sinc oniza adecua-
damen e en la misma i e aci´on, az´on po la que el
n´ume o de i e aciones es igual a dos en la mayo ´ıa de
las combinaciones. Po lo que espec a a las a ian es
T, el p oblema se ag a a a´un m´as con el sob ecos-
e asociado al o e subsc ip ion, lo que p o oca que
el n´ume o de i e aciones en odas las combinaciones
sea igual a es.
D. Compa a i a de la edis ibuci´on bloquean e y de
la edis ibuci´on en segundo plano
El ´ul imo an´alisis p e ende de e mina el impac o
que las dos a ian es de edis ibuci´on, bloquean e
y en segundo plano, iene sob e el uncionamien o
de la aplicaci´on. Compa a ´unicamen e el iempo o-
al de cada a ian e puede no se su icien e, ya que
dicho en oque igno a el e ec o que la edis ibuci´on
iene sob e el p og eso no mal de la aplicaci´on. Una
mejo al e na i a se ´ıa calcula cu´ando la aplicaci´on
alcanza la misma i e aci´on usando ambos ipos de e-
dis ibuci´on, es deci , cuando la aplicaci´on u ilizando
la a ian e bloquean e alcanza la i e aci´on ob enida
al inaliza la a ian e en segundo plano.
Las ecuaciones 1 y 2 calculan, espec i amen e,
el iempo o al pa a la edis ibuci´on bloquean e
(TBl
o al) y pa a la edis ibuci´on en segundo plano
(TSP
o al), conside ando en ambos casos que la econ i-
gu aci´on se inicia en la misma i e aci´on.
TBl
o al =TBl
edis +TN T
i ∗m´ın
a ian es(NN S→NT
i ) (1)
TSP
o al =TSP
edis (2)
El p ime e mino en ambas ecuaciones, TBl
edis y
TSP
edis, ep esen a el iempo anscu ido desde que
se inicia la edis ibuci´on has a que inaliza. Po su
pa e, los ´e minos adicionales en la ecuaci´on 1 son:
TNT
i es el iempo po i e aci´on pa a NT p ocesos
a ge , y NN S→NT
i es el n´ume o de i e aciones que
ocupa la edis ibuci´on en segundo plano cuando la
econ igu aci´on a desde NS aNT p ocesos. De es-
e segundo ´e mino, ´unicamen e se conside a el alo
m´ınimo en e las medianas de odas las a ian es en
segundo plano.
La Figu a 9 mues a el iempo ob enido al aplica
las ecuaciones 1 y 2. En es a e aluaci´on se han ex-
cluido las a ian es RMA1-T y RMA2-T, po el al o
alo de ωque mues an en la Figu a 6, que lle a a
alo es en e 25 y 45 segundos al aplica las ecuacio-
nes.
La p ime a conclusi´on se ´ıa que el m´e odo COL
es el que ob iene mejo es p es aciones en casi odos
los casos, seguido po la a ian e COL-T que iene
un endimien o muy simila , debido a su compo a-
mien o semibloquean e causado po la limi aci´on de
la e si´on de MPICH u ilizada. De hecho, COL-T
´unicamen e mejo a a COL en el caso 80 a 20 p o-
cesos, con una di e encia de 0,09s. Po su pa e, el
compo amien o de la e si´on COL-NB es m´as i e-
gula , ya que supe a a COL en los casos 20 a 160 y
40 a 160 p ocesos, con una lige a di e encia de 0,07s,
mien as que ob iene el alo m´as al o en las econ-
igu aciones de 40 a 20 p ocesos y de 80 a 20, esul-
ado de la a iabilidad del cos e de sus i e aciones
y su impac o en ω. Finalmen e, el compo amien o
de COL-WT es casi id´en ico al de COL-NB, con una
di e encia m´axima de 0,4sen la econ igu aci´on de
20 a 160 p ocesos.
Po lo que espec a a las a ian es basadas en co-
municaciones unila e ales, se obse a que sus esul-
ados son muy pa ecidos, con una di e encia m´axima
de 0,4s. La az´on es el g an peso que iene la sin-
c onizaci´on asociada a la c eaci´on de las en anas
de memo ia, an o en e si´on bloquean e como en la
que se ealiza en segundo plano. Dada la simili ud
exis en e en e los esul ados de RMA1 y RMA2, se
ecomienda el uso de RMA2 po su simplicidad.
La conclusi´on inal de es e an´alisis se ´ıa que las e -
siones basadas en comunicaciones unila e ales nunca
supe an el endimien o de las e siones colec i as.
V. Conclusiones
Es e abajo in oduce nue os m´e odos y es a e-
gias pa a ealiza la edis ibuci´on de da os du an-
e la econ igu aci´on de aplicaciones cien ´ı icas MPI.
M´as en conc e o, se p oponen dos nue os m´e odos
basados en comunicaciones unila e ales con RMA, lo
que pe mi e que los p ocesos a ge puedan accede
a los da os de los p ocesos sou ce sin la pa icipaci´on
de es os ´ul imos. Adem´as, se in oduce la es a egia
Wai Ta ge s, que pe mi e la ejecuci´on de es os nue-
os m´e odos en segundo plano, posibili ando que las
aplicaciones con in´uen su ejecuci´on du an e las ases
de edis ibuci´on.
Como esul ado de es e abajo se ha ampliado la
capacidad y la lexibilidad de MaM con 6 nue as a-
ian es de edis ibuci´on de da os: dos e siones blo-
quean es (RMA1 y RMA2) y 4 e siones en segundo
plano. Dos de ellas implemen an la es a egia Th-
eading, u ilizando hilos auxilia es pa a ealiza las
comunicaci´on, mien as que las o as dos in eg an la
es a egia Wai Ta ge s y el uso de ope aciones no
bloquean es.
La p incipal conclusi´on de es e es udio es que la
combinaci´on de los nue os m´e odos basados en co-
municaci´on unila e al y de la es a eg´ıa Wai Ta -
ge s pe mi en una ejecuci´on en segundo plano de la
edis ibuci´on con un bajo impac o sob e el cos e de
las i e aciones, con alo es de ωce canos a 1. Pe o el
endimien o global de es os nue os m´e odos no su-
pe a el de la e si´on colec i a, debido al al o cos e
de la c eaci´on de las en anas, cues i´on que eque i ´a
ajus es en el m´e odo que se abo da ´a como abajo
u u o.
Tambi´en se ha analizado el impac o de la es a e-
gia Wai Ta ge s cuando se aplica jun o al m´e odo
basado en ope aciones colec i as no bloquean es. Es-
a combinaci´on asegu a la inalizaci´on de la edis i-
buci´on de da os an es de comple a la ejecuci´on de
los p ocesos sou ce, pe o a cambio de inc emen a el
cos e de la ope aci´on.
El abajo u u o, adem´as de analiza como educi
el cos e de c eaci´on de las en anas de memo ia en
comunicaciones unila e ales, ambi´en abo da ´a me-
jo as de la es a egia Wai Ta ge s que e i en que
la de ecci´on de la inalizaci´on de MPI Iba ie in-
c emen e el n´ume o de i e aciones implicadas en una
edis ibuci´on en segundo plano. De modo adicional,
se in es iga ´a c´omo educi el olumen de la comuni-
caci´on en la edis ibuci´on de da os cuando la ges i´on
de p ocesos u ilice el m´e odo Me ge, pe mi iendo que
los p ocesos que son sou ce y a ge conse en el ma-
yo n´ume o de da os.
Ag adecimien os
El p esen e abajo ha sido sub encionado po
el p oyec o PID2023-146569NB-C22, inanciado po
MCIN/AEI/10.13039/501100011033 y ERDF/UE.
El in es igado I. Ma ´ın-´
Al a ez ue sub encionado
po la ayuda p edoc o al ACIF/2021/260, inancia-
da po el Gobie no Au on´omico Valenciano y po la
Eu opean Social Funds.
Re e encias
[1] Jack Donga a and Pio Luszczek, TOP500, pp. 2055–
2057, Sp inge US, Bos on, MA, 2011.
[2] Jie Li, Geo ge Michelogiannakis, B andon Cook, Dulanya
Coo ay, and Yong Chen, “Analyzing Resou ce U iliza ion
in an HPC Sys em: A Case S udy o NERSC’s Pe lmu -
e ,” in High Pe o mance Compu ing, Cham, 2023, pp.
297–316, Sp inge Na u e Swi ze land.
[3] A sushi Ho i, Kazumi Yoshinaga, Thomas He aul ,
Au ´elien Bou eille , Geo ge Bosilca, and Yu aka Ishika-
wa, “O e head o Using Spa e Nodes,” The In e na ional
Jou nal o High Pe o mance Compu ing Applica ions,
ol. 34, no. 2, pp. 208–226, 2020.
[4] Mohak Chadha, Jophin John, and Michael Ge nd , “Ex-
ending SLURM o dynamic esou ce-awa e adap i e
ba ch scheduling,” CoRR, ol. abs/2009.08289, 2020.
[5] Se gio Ise e, High- h oughpu Compu a ion h ough E -
icien Resou ce Managemen , Ph.D. hesis, Uni e si a
Jaume I, Cas ell´o de la Plana, No . 2018.
[6] Se gio Ise e and K zysz o Rojek, “A S udy o he E ec
o P ocess Malleabili y in he Ene gy E iciency on GPU-
based Clus e s,” The Jou nal o Supe compu ing, pp.
1–20, Oc . 2019.
[7] Albe o Cascajo, Al a o A be, Ja ie Ga cia-Blas, Jesus
Ca e e o, and Da id E. Singh, “Malleable Techniques
and Resou ce Scheduling o Imp o e Ene gy E iciency in
Pa allel Applica ions,” in High Pe o mance Compu ing,
Cham, 2023, pp. 16–27, Sp inge Na u e Swi ze land.