Redimensionamiento Dinámico de Aplicaciones Maleables mediante RMA

Author: Martín Álvarez, Iker; Aliaga Estellés, José Ignacio; Maribel, Castillo Catalán

Publisher: Zenodo

DOI: 10.5281/zenodo.17064355

Source: https://zenodo.org/records/17064355/files/JS2025_paper_86.pdf

Redimensionamien o Din´amico de Aplicaciones
Maleables median e RMA
Ike Ma ´ın-´
Al a ez1, Jos´e I. Aliaga1, Ma ibel Cas illo1
Resumen— La edimensi´on din´amica de aplicaciones
maleables en compu aci´on de al as p es aciones nece-
si a mecanismos e icien es de edis ibuci´on de da os
que le pe mi a adap a se a los cambios en el n´ume o
de p ocesos, minimizando al mismo iempo la sob e-
ca ga de ejecuci´on y el iempo de edimensi´on. Es e
abajo explo a nue os m´e odos de comunicaci´on uni-
la e al basados en ope aciones de Acceso Remo o a
Memo ia (RMA) en MPI, pe mi iendo a los p ocesos
ecupe a da os sin la pa icipaci´on expl´ıci a de los
p ocesos o igen. Adem´as, se in oduce la es a egia
Wai Ta ge s, que pe mi e econ igu aciones e icien es
en segundo plano con RMA, buscando minimiza su
impac o en la ejecuci´on de la aplicaci´on. Es os m´e o-
dos se han in eg ado en MaM, una biblio eca pa a e-
dimensiona aplicaciones en iempo de ejecuci´on, pa a
compa a los con la edis ibuci´on adicional basada
en ope aciones colec i as. La e aluaci´on expe imen al
mues a que, a pesa de su educido impac o en las
i e aciones en cu so, los m´e odos unila e ales ob ienen
p es aciones simila es a las ope aciones colec i as pe-
o nunca les supe an, debido a sus ele ados cos es de
inicializaci´on. Si es e sob ecos e uese educido, los
en oques unila e ales pod ´ıan con e i se en una al-
e na i a compe i i a, pe mi iendo econ igu aciones
e icien es en segundo plano sin impac a compu acio-
nalmen e a la aplicaci´on.
Palab as cla e— HPC, Maleabilidad, MPI, Recu sos
Din´amicos, RMA
I. In oducci´
on
EN la ac ualidad, se ha alcanzado la e a exascale
en la compu aci´on de al as p es aciones (High-
Pe o mance Compu ing, HPC), donde las capacida-
des de c´alculo de los g andes sis emas con in´uan c e-
ciendo cada a˜no, como e leja la lis a TOP 500 [1].
Es e a ance se debe p incipalmen e a dos ac o es:
po un lado, las mejo as en el ha dwa e, que a ec an
a la memo ia, almacenamien o, edes de comunica-
ci´on, y el ni el de pa alelismo en los p ocesado es;
y po o o, el desa ollo de nue os modelos de p o-
g amaci´on, un imes y biblio ecas que sean capaces
de explo a es as ecnolog´ıas. Sin emba go, m´ul i-
ples es udios e elan que a´un exis en desa ´ıos pa a
maximiza la u ilizaci´on de los ecu sos en sis emas
HPC, des acando aspec os como el uso e icien e de
las CPUs, las GPUs y la memo ia [2]. As´ı, es com´un
encon a abajos que solici en m´as nodos de los ne-
cesa ios, pa a implemen a ´ecnicas de ole ancia a
allos [3], o que no log en ap o echa odos los ecu -
sos asignados du an e sus dis in as ases de ejecuci´on.
Es a ine iciencia se ag a a en si uaciones donde cie -
os nodos pe manecen inac i os mien as o os a-
bajos espe an ecu sos, e idenciando as´ı la necesidad
de mejo a la ges i´on de es os sis emas.
La ges i´on din´amica de ecu sos pe mi e que los
1Dp o. de Ingenie ´ıa y Ciencia de los Compu ado es,
Uni e si a Jaume I de Cas ell´o, e-mails: [email p o ec ed],
[email p o ec ed],[email p o ec ed]
abajos modi iquen, en iempo de ejecuci´on, el
n´ume o de ecu sos que ienen asignados siemp e y
cuando el ges o de ecu sos (Resou ce Manage Sys-
em, RMS) y las aplicaciones puedan adap a se a es-
os cambios. Es a capacidad ha demos ado se una
es a egia e icaz pa a mejo a el uso de in aes uc-
u as HPC de acue do a di e en es obje i os espec´ı i-
cos de op imizaci´on. En e los p incipales obje i os
se encuen an la maximizaci´on de la u ilizaci´on de
ecu sos [4], el aumen o de la e iciencia compu acio-
nal [5] o ene g´e ica [6], [7], y el inc emen o del en-
dimien o en ope aciones de I/O [8].
Desde la pe spec i a de la aplicaci´on, es a capaci-
dad de adap aci´on se conoce como maleabilidad [9].
En es e abajo, es e concep o se de ine como la ca-
pacidad de una aplicaci´on pa alela dis ibuida pa a
edimensiona se din´amicamen e, modi icando, an-
as eces como sea necesa io, el n´ume o de p ocesos
MPI [10] asignados du an e su ejecuci´on. Es a lexi-
bilidad pe mi e mejo a el endimien o de la aplica-
ci´on al amplia los ecu sos asignados, cuando es os
son abundan es, o libe a ecu sos en si uaciones de
al a demanda, educiendo as´ı el iempo de espe a de
o os abajos del sis ema. Adem´as, acili a la asig-
naci´on del n´ume o ´op imo de ecu sos a la aplicaci´on
siemp e que las condiciones lo pe mi an.
La maleabilidad se ac i a en pun os de con ol es-
pec´ı icos de la aplicaci´on. Es os pueden localiza se al
inicio o al inal de una i e aci´on en una aplicaci´on
i e a i a, o al inicio de una ase en una aplicaci´on
m´as gene al. Su ac i aci´on desencadena la ejecuci´on
de una se ie de e apas:
1. Reasignaci´on de ecu sos: El RMS decide si de-
be edimensiona el abajo seg´un una pol´ı ica
de asignaci´on de ecu sos din´amica [11], [12]. Si
no es el caso, el es o de e apas no se ealizan.
2. Ges i´on de p ocesos. La decisi´on del RMS de-
e mina si se c ean o inalizan p ocesos MPI. Los
p ocesos p e ios a la edimensi´on se conside an
sou ces, mien as que los que con in´uan as la
misma son a ge s.
3. Redis ibuci´on de da os: En la que se ealiza la
ans e encia de da os en e p ocesos.
4. Reanuda la ejecuci´on. Al inal, la aplicaci´on
con inua su ejecuci´on con los p ocesos a ge .
El o den p esen ado co esponde con una econ igu-
aci´on en la que la ges i´on de p ocesos c ea a ge
p ocesos y elimina sou ce p ocesos. Pe o la u iliza-
ci´on de ´ecnicas m´as e icien es puede solapa las e a-
pas 2 y 3, cambiando el o den de alguna de sus a eas.
Las e apas 2 y 3 ienen un al o cos e compu acio-
nal, po lo que esul a undamen al op imiza su im-
plemen aci´on. Di e sos abajos p e ios [13], [14] han
abo dado es e desa ´ıo, p oponiendo di e en es en o-
ques pa a op imiza dichas e apas.
En es e a ´ıculo se p esen a un nue o m´e odo pa-
a la edis ibuci´on de da os en aplicaciones pa alelas
dis ibuidas, basado en el modelo de acceso emo o
a memo ia (Remo e Memo y Access, RMA), u ili-
zando comunicaciones unila e ales [15]. Una de las
p incipales en ajas de es as comunicaciones es que
educe signi ica i amen e el impac o sob e los p o-
cesos sou ce, ya que es os no pa icipan ac i amen-
e en la edis ibuci´on. La p opues a incluye adem´as
una nue a es a egia de sinc onizaci´on que iene en
cuen a el es ado de los p ocesos a ge . Es a es a e-
gia es ´a dise˜nada espec´ı icamen e pa a op imiza las
econ igu aciones en segundo plano, ya que pe mi e
que la aplicaci´on con in´ue ejecu ´andose mien as se
ealiza la edis ibuci´on de da os.
Es e abajo p esen a en de alle el dise˜no, la im-
plemen aci´on y la e aluaci´on de los m´e odos y es-
a egia mencionados, des acando sus en ajas y sus
limi aciones en ´e minos de endimien o y e iciencia,
en compa aci´on con los m´e odos adicionales de e-
dis ibuci´on de da os. Siguiendo es os comen a ios,
sus p incipales con ibuciones son las siguien es:
Dise˜no de dos m´e odos de edis ibuci´on de da-
os basados en comunicaciones unila e ales.
Dise˜no de la es a egia de sinc onizaci´on Wai
Ta ge s, en la que los p ocesos sou ce con in´uan
su ejecuci´on has a con i ma que los a ge s han
inalizado la ecepci´on de los da os.
E aluaci´on de las ´ecnicas p esen adas en el
a ´ıculo, compa ando sus p es aciones con o as
´ecnicas ya p esen adas en es udios p e ios.
El es o del a ´ıculo se o ganiza como sigue. La
Secci´on II desc ibe P o eo, el amewo k u ilizado
pa a lle a a cabo la maleabilidad y ealiza la expe-
imen aci´on. La Secci´on III de alla las ´ecnicas im-
plemen adas pa a comple a la e apa 3 de maleabi-
lidad, mien as que en la Secci´on IV se mues an los
esul ados ob enidos al e alua es as ´ecnicas sob e
un cl´us e con 8 nodos. Finalmen e, la Secci´on V p e-
sen a las conclusiones del es udio.
II. P o eo
A. Desc ipci´on gene al
P o eo es un amewo k ampliamen e con igu able
dise˜nado pa a acili a el desa ollo de benchma ks
u ilizados en el an´alisis de los e ec os de la in eg a-
ci´on de la maleabilidad en aplicaciones eales [16]. Su
lexibilidad pe mi e e alua el impac o de la malea-
bilidad en el endimien o de aplicaciones en g andes
sis emas, compa ando di e en es al e na i as.
La Figu a 1 mues a la a qui ec u a in e na de
P o eo, que se compone de dos m´odulos p incipales:
el M´odulo de Aplicaci´on Sin ´e ica (SAM) y el M´odu-
lo de Maleabilidad (MaM). El m´odulo SAM es ´a di-
se˜nado pa a emula el compo amien o compu acio-
nal de cualquie aplicaci´on pa alela basada en MPI,
u ilizando los pa ´ame os almacenados en un a chi o
Fig. 1: A qui ec u a de P o eo
de con igu aci´on. Es a uncionalidad pe mi e ep o-
duci ca gas de abajo sin ´e icas simila es al com-
po amien o de aplicaciones eales, acili ando as´ı
su e aluaci´on en dis in os escena ios. Po su pa -
e, el m´odulo MaM se enca ga de la econ igu aci´on
din´amica de las aplicaciones, ajus ando el n´ume o
de p ocesos en ejecuci´on e implemen ando odas las
e apas de la maleabilidad, especialmen e la 2 y la 3.
La combinaci´on de ambos m´odulos pe mi e que
SAM emule el compo amien o de un aplicaci´on con
di e en es con igu aciones, mien as que MaM ealiza
la ansici´on en e con igu aciones. De es e modo se
acili a la e aluaci´on de ´ecnicas de maleabilidad en
una aplicaci´on eal sin necesidad de implemen a las
di ec amen e sob e la o iginal, lo que esul a espe-
cialmen e alioso pa a busca la mejo al e na i a,
dado que es a a ea suele se muy compleja. MaM
ambi´en cuen a con una in e az especializada [17]
que simpli ica la inco po aci´on de es as ´ecnicas en
aplicaciones pa alelas eales, p opo cionando as´ı una
soluci´on e s´a il pa a e alua y aplica la maleabili-
dad en di e sos en o nos compu acionales.
Adem´as de los m´odulos p incipales, P o eo cuen-
a con subm´odulos de moni o izaci´on que egis an
m´e icas de endimien o de las aplicaciones emuladas
o e aluadas. Es a in o maci´on es muy aliosa pa a
analiza el impac o de la maleabilidad sob e la u ili-
zaci´on de ecu sos y la e iciencia de la ejecuci´on. La
in o maci´on ecopilada se almacena en a chi os de
salida pa a su pos e io an´alisis, lo que con ie e a
P o eo en una he amien a esencial pa a in es iga-
do es y desa ollado es que abajan en aplicaciones
pa alelas din´amicas.
B. MaM
El m´odulo MaM implemen a las dis in as e apas
que con o man el p oceso de maleabilidad en aplica-
ciones pa alelas, abo dando an o la ges i´on de p o-
cesos como la edis ibuci´on de da os. Pa a cada una
de es as e apas, MaM p opo ciona una se ie de m´e o-
dos y es a egias que pe mi en adap a el p oceso de
econ igu aci´on seg´un las necesidades del en o no de
ejecuci´on. En cada e apa es obliga o io selecciona
un ´unico m´e odo, el cual de ine c´omo se lle a ´a a
cabo la ope aci´on co espondien e. Po su pa e, las
es a egias son opcionales y pueden combina se lib e-
men e pa a op imiza el endimien o y la e iciencia
del sis ema. A con inuaci´on, se desc iben las ´ecnicas
implemen adas en MaM que han sido empleadas en
es e es udio.
En la ges i´on de p ocesos, el m´odulo MaM pa e de
un g upo inicial compues o po NS p ocesos sou ce
y un nue o g upo o mado po NT p ocesos a ge ,
pe mi iendo que un mismo p oceso pueda pe enece
a ambos g upos du an e la econ igu aci´on. De odos
los m´e odos y es a egias que implemen a MaM pa a
comple a la edimensi´on [13], en es e es udio se em-
plea exclusi amen e el m´e odo Me ge. Po lo an o, si
(NT > NS), se gene an (NT −NS) p ocesos nue os,
mien as que si (NS > NT ), se eliminan (NS −NT)
p ocesos. Es e m´e odo, o iginalmen e p opues o en
Flex-MPI [18], ha sido modi icado en MaM pa a eli-
mina la limi aci´on que imped´ıa educi el n´ume o
de p ocesos po debajo del alo inicial con el que se
lanza la aplicaci´on.
Du an e la e apa de edis ibuci´on de da os, el
m´odulo MaM pe mi e ans e i in o maci´on de o -
ma e icien e y semiau om´a ica en e los p ocesos
sou ce y a ge , an o con da os escala es como con
es uc u as unidimensionales, y admi iendo ipos p i-
mi i os o de i ados de MPI. Pa a ello, los da os se
clasi ican en dos ca ego ´ıas: cons an es o a iables.
Los cons an es no se modi ican du an e la ejecuci´on
de la aplicaci´on, po lo que pueden ans e i se u i-
lizando ope aciones bloquean es o no bloquean es,
seg´un con enga, pa a maximiza las p es aciones de
la aplicaci´on. Po su pa e, los a iables se modi ican
a la la go de la ejecuci´on, po lo que la ans e encia
debe ealiza se con ope aciones bloquean es.
MaM cuen a con di e sos m´e odos implemen ados
pa a lle a a cabo la edis ibuci´on de da os [14].
En es e es udio, se emplea uno de esos m´e odos que
se basa en el uso de ope aciones de comunicaci´on
colec i as (Collec i e), espec´ı icamen e la ope aci´on
MPI All oall . Adem´as, MaM inco po a a ias es a-
egias pa a op imiza es e p oceso: i) Th eading, que
acili a la edis ibuci´on en segundo plano pe mi ien-
do que la ope aci´on colec i a sea ealizada po hilos
auxilia es; ii) Non-blocking, que implemen a las e-
dis ibuciones de da os en segundo plano u ilizando
p imi i as de MPI no bloquean es; iii) Wai Ta ge s,
una a ian e de la an e io en la que se inco po a una
condici´on adicional pa a asegu a que la ecepci´on de
los da os se ha comple ado.
En es e abajo se a˜naden dos nue os m´e odos ba-
sados en RMA a MaM que comple an la edis ibu-
cion de da os, y que se ´an desc i os en la secci´on III-
B. Es os m´e odos pueden se combinados con las es-
a egias Th eading yWai Ta ge s, que pe mi en
que la edis ibuci´on de da os se pueda ejecu a en
segundo plano mien as se ejecu a la aplicaci´on.
III. Redis ibuci´
on de da os
En es a Secci´on se indica como u iliza las p imi-
i as RMA de MPI pa a ealiza la edis ibuci´on de
da os eque ida en una econ igu aci´on. Adem´as, se
in oduce una nue a es a egia que pe mi e ealiza
es a edis ibuci´on de o ma no bloquean e.
A. Desc ipci´on gene al RMA
La comunicaci´on median e RMA es un modelo de
p og amaci´on en MPI, inclu´ıdo en MPI-2 con el con-
cep o de comunicaciones unila e ales [15]. Es e mo-
delo pe mi e que un p oceso acceda di ec amen e a la
memo ia de o os p ocesos pa a in e cambia da os, a
di e encia del modelo adicional de comunicaci´on en
MPI en el que es necesa io una sinc onizaci´on en e
los p ocesos. Es e mecanismo educe la sob eca ga de
la ges i´on de mensajes, y pe mi e op imiza el acceso
a da os en sis emas con un g an n´ume o de p ocesos,
lo que es especialmen e adecuado pa a pa ones de
comunicaci´on i egula es o din´amicos.
Se dis inguen dos ipos de p ocesos en la comuni-
caci´on con RMA: el p oceso o igen y el p oceso des-
ino. El p oceso des ino es el que expone una egi´on
de su memo ia pa a que o o p oceso pueda accede
a ella, mien as que el p oceso o igen es el que eali-
za la comunicaci´on, ya sea leyendo o esc ibiendo en
la memo ia expues a po el p oceso des ino.
Es e modelo se es uc u a en es componen es
undamen ales: en anas de memo ia,ope aciones
emo as ymecanismos de sinc onizaci´on. Las en-
anas de memo ia son las egiones de memo ia que
el p oceso des ino expone pa a que los p ocesos o i-
gen accedan a ellas. Exis en dos ipos p incipales de
ope aciones emo as sob e los da os en una en a-
na: las de ipo Pu (esc i u a) y Ge (lec u a). Pa a
ga an iza la cohe encia de los da os, RMA p opo -
ciona mecanismos de sinc onizaci´on que con olan
el acceso segu o a las en anas, asegu ando que las
ope aciones se comple en de o ma o denada y con-
sis en e. En es e con ex o, se in oduce el concep o
de ´epoca, que de ine el in e alo de iempo du an e
el cual se pe mi e que un p oceso o igen ealice ope-
aciones en las en anas de memo ia de los p ocesos
des ino. Pues bien, los mecanismos de sinc onizaci´on
son los que ges ionan las ´epocas, delimi ando cla-
amen e cu´ando se inicia y inaliza el acceso a las
en anas de memo ia, lo que p opo ciona un en o no
con olado pa a las comunicaciones y ga an iza la co-
he encia en el in e cambio de in o maci´on.
En la pa e supe io de la Figu a 2 se mues a
una ope aci´on de comunicaci´on u ilizando ope acio-
nes adicionales de MPI, como Send yRec , mien-
as que en la pa e in e io de la misma igu a apa-
ece una comunicaci´on basada en RMA. En es e ´ul i-
mo caso, se obse a que no es necesa io ealiza una
sinc onizaci´on expl´ıci a en e los p ocesos que pa i-
cipan en la comunicaci´on, po lo que el p oceso o i-
gen (1) puede con inua su ejecuci´on sin depende
de que el des ino (0) es ´e lis o o no. Sin emba go,
es e hecho no signi ica que las comunicaciones RMA
sean comple amen e as´ınc onas, ya que la de inici´on
Fig. 2: Di e encias de sinc onizaci´on en e una llamada con-
encional (a iba) y una unila e al (abajo).
de las en anas equie e una sinc onizaci´on, y el uso
de ope aciones emo as debe segui modelos que ga-
an icen la cohe encia de los da os.
Exis en es modelos p incipales que ges ionan el
acceso y la cohe encia de los da os en memo ia emo-
a. (i) El modelo ac i o equie e que odos los p oce-
sos que han abie o en anas pa icipen ac i amen e
en el p oceso de sinc onizaci´on. Po lo an o, odos
los p ocesos deben coo dina se pa a inicia y inaliza
el in e cambio de da os, ga an izando as´ı que odas
las modi icaciones se e lejen co ec amen e. (ii) El
modelo ac i o gene alizado o ece mayo lexibilidad
al pe mi i que solo un g upo espec´ı ico de p oce-
sos pa icipe en la sinc onizaci´on. De es e modo, no
es necesa io que odos los p ocesos se coo dinen si-
mul ´aneamen e, lo que mejo a la e iciencia en pa o-
nes de comunicaci´on i egula es o din´amicos. (iii) El
modelo pasi o pe mi e que el p oceso o igen acceda
di ec amen e a la memo ia del p oceso des ino sin
que es e ´ul imo in e enga ac i amen e. Es e en o-
que es ideal cuando los p ocesos o igen solo necesi-
an lee la memo ia de o os p ocesos, como ocu e
en una econ igu aci´on maleable.
El Lis ado 1 mues a las p incipales unciones pa-
a ealiza ans e encias usando el modelo pasi o
den o del con ex o de una econ igu aci´on malea-
ble. As´ı, las unciones Win c ea e yWin ee c ean
y libe an una en ana, siendo ope aciones colec i as
y bloquean es pa a odos los p ocesos en el comuni-
cado asociado. Po su pa e, la unci´on Ge pe mi e
lee da os de una en ana. Mien as que las uncio-
nes Lock yUnlock ab en y cie an una ´epoca en un
p oceso des ino conc e o.
La llamada Lock debe inclui el ipo de acceso pe -
mi ido, que puede se SHARED oEXCLUSIVE. El
p ime o pe mi e que m´ul iples p ocesos accedan de
modo simul ´aneo a los da os de la en ana, mien as
que el segundo es inge el acceso a un ´unico p oceso.
En el caso de las econ igu aciones, se u iliza el ac-
ceso compa ido, ya que ´unicamen e se ealizan ope-
aciones de lec u a. Adem´as, la llamada Lock debe
inclui la bande a MPI MODE NOCHECK, ya que
el en o no de MPI no necesi a comp oba si exis en
accesos con lic i os. Po su pa e, la llamada Unlock
bloquea al p oceso o igen has a que odas las ope a-
ciones den o de una ´epoca hayan sido comple adas.
Adem´as, ambas unciones ienen una a ian e con el
su ijo all, que pe mi e de ini una ´epoca como el acce-
so simul ´aneo de un p oceso o igen a m´ul iples des-
inos sin necesidad de especi ica lo indi idualmen e.
Lis ado 1: Funciones de MPI pa a comunicaciones unila e ales
pasi as.
1in MPI_Win_c ea e(...);
2in MPI_Win_ ee(...);
3in MPI_Ge (...) ;
4in MPI_Win_lock ( in lock ype , in ank ,
5in asse , MPI_Win win);
6in MPI_Win_unlock(...);
7in MPI_Win_lock_all ( in asse , MPI_Win win );
8in MPI_Win_unl ock_a ll (...) ;
B. Implemen aci´on en MaM
En es e abajo se ha ampliado la uncionalidad
de MaM, inco po ando el uso del modelo pasi o de
las ope aciones unila e ales pa a ealiza la edis i-
buci´on de da os. En es e en oque, los p ocesos sou -
ce solo equie en que sus da os es ´en disponibles en
en anas de memo ia, pe mi iendo que los p ocesos
a ge accedan di ec amen e a sus da os sin que los
sou ce pa icipen ac i amen e en la comunicaci´on.
Se ´a necesa io sinc oniza adecuadamen e la ape -
u a y el cie e de las en anas pa a ga an iza la
cohe encia de la in o maci´on.
La Figu a 3 mues a un ejemplo de edis ibuci´on
de da os median e RMA, en el que dos p ocesos a -
ge ,YeY+1, deben ob ene in o maci´on desde dis-
in os p ocesos sou ce,X,X+1 y X+2. En es e esce-
na io, cada p oceso sou ce (ac uando como p oceso
des ino) de ine una en ana de memo ia que con ie-
ne odos los da os a edis ibui , pe mi iendo que
los p ocesos a ge (ac uando como p ocesos o igen)
accedan di ec amen e a es as en anas pa a lee la
in o maci´on. Po su pa e, un p oceso a ge puede
eque i accede a una o m´as en anas de memo ia
pa a ob ene oda la in o maci´on que necesi a, po lo
que es necesa io conoce de an emano la in o maci´on
que se debe lee de cada en ana de memo ia an es
de inicia la edis ibuci´on de da os.
El Algo i mo 1 mues a los c´alculos eque idos po
los p ocesos a ge , pa a conoce cu´an os elemen os
debe lee de cada en ana de memo ia. En es e calcu-
lo se u ilizan dos unciones: Ge sou ce g oup que in-
dica el n´ume o de p ocesos sou ce desde los cuales se
ob end ´a la in o maci´on, y Block id que de e mina
los alo es ini yend, que de inen el ango de ele-
men os que cada p oceso almacena en unci´on de su
iden i icado y del n´ume o de p ocesos en su g upo.
B´asicamen e, cada p oceso a ge debe conoce qu´e
elemen os lee en cada sou ce calculando la in e sec-
ci´on en e su in e alo de da os y el de los p ocesos
sou ce. Si no exis e in e secci´on, no se ealiza ningu-
na lec u a, pe o si la hay, se calcula el n´ume o de
elemen os co espondien es y su alo se almacena
en el ec o coun s. Adem´as, la posici´on de memo ia
del a ge en la que se deben esc ibi los elemen os
le´ıdos se egis a en el ec o displs. Los escala es
i s sou ce ylas sou ce almacenan, espec i amen-
e, la p ime a y la ´ul ima en ana a la que se debe
Fig. 3: Redis ibuci´on de da os con RMA.
Algo i mo 1 Pa ´ame os de comunicaci´on en a ge .
s size =Ge sou ce g oup()
ini, end =Block id(myId)
coun s =calloc(s size)
displs =calloc(s size + 1)
i s sou ce =−1
o (i= 0; i < s size;i++ )do
s ini, s end =Block id(i)
i (ini ≥s end||end ≤s ini) hen
i ( i s sou ce == −1) hen
i s sou ce =i
i s index =ini −s ini
end i
big ini =ini > s ini?ini :s ini
small end =end < s end?end :s end
coun s[i] = small end −big ini
displs[i+ 1] = displs[i] + coun s[i]
else
i ( i s sou ce! = −1) hen
las sou ce =i
b eak
end i
end i
end o
accede , mien as que i s index indica la posici´on
desde la cual se debe inicia la lec u a de da os en la
en ana de memo ia de i s sou ce. S´olo es necesa-
io calcula es e ´ul imo alo en la p ime a en ana,
debido a la na u aleza de la dis ibuci´on po bloques.
Es e abajo p esen a dos m´e odos pa a la edis-
ibuci´on de da os median e comunicaciones unila e-
ales, desc i os en los Algo i mos 2 y 3. En ambos
casos, la comunicaci´on se inicia con la c eaci´on de
una en ana po pa e de odos los p ocesos pa i-
cipan es, que es ac´ıa pa a los p ocesos a ge e in-
cluye los da os a edis ibui en los p ocesos sou ce,
y concluye con la des ucci´on de dicha en ana. La
p incipal di e encia de ambos m´e odos es el n´ume o
de ´epocas u ilizadas du an e la ope aci´on.
Algo i mo 2 M´e odo RMA1: Lock+Unlock.
i (p oceso es a ge ) hen
i (p oceso es solo a ge ) hen
da a =NULL
end i
window =MPI Win c ea e(da a)
i s sou ce =ge i s sou ce()
las sou ce =ge las sou ce()
i s index =ge i s index()
lock =MP I LOCK SHARED
asse =MP I MODE NOCHECK
o (i= i s sou ce;i < las sou ce;i++ )do
MPI Win lock(i, lock, asse )
MPI Ge (i→myId, displs[i], i s index, coun s[i])
i s index = 0
end o
o (i= i s sou ce;i < las sou ce;i++ )do
MPI Win unlock(i)
end o
MPI Win ee(window)
else
window =MPI Win c ea e(da a)
...
MPI Win ee(window)
end i
Algo i mo 3 M´e odo RMA2: Lockall+Unlockall.
i (p oceso es a ge ) hen
i (p oceso es solo a ge ) hen
da a =NULL
end i
window =MPI Win c ea e(da a)
i s sou ce =ge i s sou ce()
las sou ce =ge las sou ce()
i s index =ge i s index()
asse =MP I MODE NOCHECK
MPI Win lock all(asse )
o (i= i s sou ce;i < las sou ce;i++ )do
MPI Ge (i→myId, displs[i], i s index, coun s[i])
i s index = 0
end o
MPI Win unlock all
MPI Win ee(window)
else
window =MPI Win c ea e(da a)
...
MPI Win ee(window)
end i
C. Modi icaciones pa a una implemen aci´on en se-
gundo plano
Los m´e odos desc i os en la secci´on an e io pe mi-
en ealiza la edis ibuci´on de da os u ilizando co-
municaciones unila e ales de o ma bloquean e. Es-
o impide que la aplicaci´on pueda con inua su eje-
cuci´on mien as se comple a es a comunicaci´on, au-
men ando el cos e de inalizaci´on de la aplicaci´on. En
es a secci´on se p esen an dos al e na i as pa a elimi-
na es e impedimen o: el uso de Th eading, o de la
es a egia Wai Ta ge s de MaM.
En la p ime a de las al e na i as, se p opone c ea
un hilo auxilia en cada p oceso sou ce, que sea el
enca gado de comple a la edis ibuci´on en segundo
plano, u ilizando el Algo i mo 2 o el Algo i mo 3. De
es a o ma, se libe a de ca ga a los hilos p incipales,
que pueden segui ejecu ando la aplicaci´on, y consul-
ando a los hilos auxilia es si la edis ibuci´on se ha
comple ado, cuando lo conside en.
La inco po aci´on de la es a eg´ıa Wai Ta ge s en
los Algo i mos 2 y 3 se inicia analizando las sinc o-

nizaciones que es os algo i mos incluyen. As´ı, la un-
ci´on MPI Unlock bloquea al p oceso que la u iliza
has a que odas sus ope aciones MPI Ge se hayan
comple ado, mien as que la unci´on MPI Win ee
equie e que odos los p ocesos del comunicado la
in oquen pa a comple a se, ac uando como una ope-
aci´on de sinc onizaci´on colec i a que bloquea an o
a los p ocesos que no ealizan ninguna lec u a como a
los que ya la han comple ado. Si es e bloqueo se eali-
za sob e p ocesos sou ce, se impide que la aplicaci´on
pueda con inua su ejecuci´on mien as la comunica-
ci´on se comple a, aumen ando el iempo de ejecuci´on
de la aplicaci´on. Pa a mejo a es e compo amien-
o, se p opone di idi el c´odigo de los algo i mos en
dos unciones: Ini RMA que inicia la edis ibuci´on
y llama a MPI Win c ea e;Comple e RMA que u i-
liza MPI Unlock pa a inaliza las comunicaciones y
MPI Win ee pa a libe a las en anas de memo ia.
Pa a e i a el bloqueo que se p oduce en un p oce-
so cuando se u iliza MPI Unlock, se p opone u iliza
la unci´on MPI Rge , que ealiza la misma a ea que
MPI Ge , pe o de ol iendo un obje o MPI Reques .
El uso de es e ipo de obje os pe mi e con ola el
es ado de la ope aci´on de o ma no bloquean e, u i-
lizando la unci´on MPI Tes . As´ı, los p ocesos sou ce
pueden consul a pe i´odicamen e el es ado de la co-
municaci´on, y con inua la ejecuci´on de la aplicaci´on
en el caso que la llamada a MPI Tes le indique que
la comunicaci´on no ha inalizado.
Po su pa e, e i a el bloqueo de la unci´on
MPI Win ee equie e conoce cuando han comple-
ado la comunicaci´on odos los p ocesos, pe mi ien-
do que los p ocesos sou ce sigan ejecu ando la apli-
caci´on mien as no se cumpla es a condici´on. Pa-
a esol e es e p oblema, se p opone u iliza la es-
a egia Wai Ta ge s de MaM, que u iliza la un-
ci´on MPI Iba ie pa a sinc oniza odos los p o-
cesos in oluc ados. Es a unci´on de uel e un obje o
MPI Reques , sob e el cual se puede u iliza la un-
ci´on MPI Tes , pa a hace un con ol no bloquean e
del es ado de la comunicaci´on, o la unci´on MPI Wai ,
que bloquea la ejecuci´on del p oceso has a la inali-
zaci´on de la comunicaci´on. As´ı, odos los p ocesos
hacen una llamada a MPI Iba ie , pe o solo los
p ocesos sou ce u ilizan MPI Tes , pa a pode con i-
nua la ejecuci´on de la aplicaci´on si la comunicaci´on
no ha inalizado, mien as que el es o de p ocesos
u ilizan MPI Wai , pa a espe a la inalizaci´on de la
comunicaci´on.
La Figu a 4 mues a el diag ama de lujo que des-
c ibe c´omo unciona Comple e RMA cuando se inco -
po a la es a egia Wai Ta ge s pa a ealiza en se-
gundo plano una edis ibuci´on u ilizando comunica-
ciones unila e ales. Apa ecen es lujos di e en es en
el diag ama, dependiendo del ipo de p oceso: aque-
llos que s´olo son a ge , los que s´olo son sou ce, y los
que son sou ce y a ge a la ez.
Los p ocesos que s´olo son a ge no ejecu an la
aplicaci´on, az´on po la que pueden u iliza las un-
ciones MPI Ge ,MPI Lock yMPI Unlock, aunque ello
suponga un bloqueo du an e la edis ibuci´on. Una
Fig. 4: Diag ama de lujo de Comple e RMA que comple a una
edis ibuci´on en segundo plano con RMA.
ez comple adas odas sus lec u as, deben llama a la
MPI Iba ie pa a indica al es o de p ocesos que
han inalizado, y luego u iliza MPI Wai (Iba ie ),
bloque´andose de nue o, pa a espe a a que el es o
de p ocesos ambi´en inalicen sus lec u as, an es de
elimina sus en anas de memo ia.
Po su pa e, los p ocesos que solo son sou ce no
ealizan ninguna lec u a de da os, po lo que su p i-
me a a ea es no i ica lo u ilizando MPI Iba ie . A
con inuaci´on, en an en un bucle en el que se eje-
cu a la aplicaci´on (Compu e) y se ealiza una e-
i icaci´on no bloquean e del es ado de las ope a-
ciones de lec u as del es o de p ocesos, u ilizando
MPI Tes (Iba ie ). Una ez comple ada oda la
edis ibuci´on, se eliminan sus en anas de memo ia.
Finalmen e, los p ocesos que son an o sou ces co-
mo a ge s ealizan la lec u a de da os de modo no
bloquean e, u ilizando MPI Rge s yMPI Locks. A
con inuaci´on, en an en un bucle en el que se eje-
cu a la aplicaci´on y se comp ueba si han inalizado
sus lec u as, u ilizando MPI Tes all(Rge s). Cuan-
do ´es as se comple an, se no i ica al es o de p ocesos
llamando a MPI Iba ie . En onces, uel en a en-
a en un bucle en el que se ejecu a la aplicaci´on, pe-
o aho a la condici´on e i ica de modo no bloquean-
e si odos los p ocesos han comple ado las lec u as
u ilizando MPI Tes (Iba ie ). Cuando se comple-
a la edis ibuci´on, se ealizan los co espondien es
Unlocks y se eliminan sus en anas de memo ia.
IV. Resul ados expe imen ales
En es a secci´on se p esen an los expe imen os y el
an´alisis ealizado pa a compa a los m´e odos desc i-
os en la Secci´on III.
A. Ha dwa e y So wa e u ilizados
Los expe imen os se han ealizado en un cl´us e
compues o po ocho nodos, cada uno equipado con
dos p ocesado es In el Xeon 4210 de 10 n´ucleos, su-
mando un o al de 160 n´ucleos. Los nodos es ´an in-
e conec ados median e una ed In iniBand EDR de
100 Gbps, u ilizando MPICH 4.2.0 [19], compilado
con CH4:OFI ne mod (In iniBand). La e si´on de
P o eo u ilizada se encuen a disponible p´ublicamen-
e en un eposi o io1, y los esul ados de los expe i-
men os es ´an disponibles de o ma p´ublica [20].
La e aluaci´on expe imen al u iliza SAM pa a emu-
la el algo i mo del G adien e Conjugado [21], una
aplicaci´on i e a i a que u iliza dos llamadas colec-
i as All educe y una Allga he . El ama˜no del p o-
blema u ilizado equie e ap oximadamen e 64 GB de
memo ia. Pa a pe mi i un co ec o es udio es ad´ıs i-
co, los expe imen os se han epe ido 20 eces y se ha
calculado la mediana de los esul ados.
Cada expe imen o incluye una ´unica econ igu a-
ci´on, que pa e de NS p ocesos sou ce aNT p ocesos
a ge . Dado que an o NS como NT oman alo es
en el conjun o 20,40,40,160, apa ecen un o al de 12
combinaciones di e en es. Po su pa e, el n´ume o de
nodos u ilizados en cada ejecuci´on se de e mina con
la ´o mula ⌈N/20⌉, donde Nes el mayo alo en e
NS yNT, pa a op imiza as´ı el consumo de ecu sos
usados en el sis ema.
La econ igu aci´on que apa ece en cada expe imen-
o hacen uso de MaM, con igu ado como sigue. Pa a
la ges i´on de p ocesos, se u iliz´o el m´e odo Me ge en
odos los expe imen os, siemp e en modo s´ınc ono
y bloquean e. En cambio, pa a la edis ibucion de
da os, se e alua on di e en es m´e odos y es a egias.
Los m´e odos conside ados ue on: COL (Collec i e
de MaM), RMA1 (Algo i mo 2), y RMA2 (Algo i -
mo 3). Adem´as, cuando los m´e odos se ejecu a on
de modo as´ınc ono, se conside a on las es a egias
Th eading (T), Non-Blocking (NB), y Wai Ta ge s
(WT) pa a el p ime m´e odo, y las es a egias Th ea-
ding yWai Ta ge s pa a los ´ul imos dos m´e odos.
B. Tiempos de edis ibuci´on bloquean es
La Figu a 5 mues a el iempo necesa io (en segun-
dos) pa a ealiza la edis ibuci´on, conside ando las
dis in as e siones bloquean es y a iando el n´ume o
de p ocesos sou ce y a ge in oluc ados.
De su an´alisis, se obse a que los m´e odos RMA1
y RMA2 p esen an un compo amien o muy simi-
la , siendo sus p es aciones lige amen e in e io es a
las de COL, ob eniendo una deg adaci´on m´ınima de
1,013×al expandi de 20 a 80 y una m´axima de
1,377×al educi de 80 a 20 p ocesos. Es e compo -
amien o se jus i ica, p incipalmen e, po el cos e de
c eaci´on de las en anas de memo ia, una ope aci´on
colec i a y bloquean e en e odos los p ocesos.
Po an o, la elecci´on en e los m´e odos RMA iene
poco impac o sob e el endimien o cuando se u iliza
en modo bloquean e.
1h ps://lo ca.ac .uji.es/gi lab/ma ini/
malleabili y_benchma k/-/ ee/Sa eco25
Fig. 5: Tiempos de econ igu aci´on en e siones bloquean es.
C. Tiempos de edis ibuci´on en segundo plano
En es a secci´on se ealiza un es udio m´as de alla-
do del compo amien o de las e siones as´ınc onas,
conside ando los di e en es m´e odos (COL, RMA1 y
RMA2) con las es a egias asociadas (T, NB, WT).
El p ime es udio analiza el impac o de ejecu a la
aplicaci´on simul ´aneamen e con la edis ibuci´on en
segundo plano. Pa a e alua es e e ec o, se calcula la
elaci´on en e el iempo de ejecuci´on de una i e a-
ci´on sin edis ibuci´on y el iempo de ejecuci´on de la
misma i e aci´on cuando se ealiza una edis ibuci´on
en segundo plano. A es a elaci´on se le denomina ω.
La Figu a 6 mues a como a ´ıa ωen unci´on del
m´e odo y es a egia u ilizados, y conside ando di e-
en es combinaciones del n´ume o de p ocesos sou ce
y a ge . As´ı, las e siones que emplean hilos auxilia-
es (T) son las m´as a ec adas, con inc emen os de ω
supe io es a 100 en las a ian es de RMA y alo es
comp endidos en e 43 y 123 pa a COL. Es os inc e-
men os se jus i ican po la apa ici´on de o e subsc ip-
ion en los nodos donde esiden los p ocesos sou ce,
que alen iza la ejecuci´on de los hilos p incipales.
Pa a un an´alisis m´as de allado de las e siones NB
y WT, en la Figu a 7 se mues a como a ´ıan es as
es a egias, sin conside a las a ian es T. La p i-
me a conclusi´on es que las e siones de RMA son
las que mejo es esul ados p esen an, con alo es de
ωce canos a 1 en la mayo ´ıa de los casos, siendo
2,8 el peo caso. La az´on que lo jus i ica es que el
n´ume o de p ocesos in oluc ados en la comunicaci´on
en es os m´e odos es siemp e igual a NT mien as
que en las a ian es de COL es e n´ume o es igual
a m´ax(NS, NT). Adem´as, los p ocesos in oluc ados
en RMA no necesi an ninguna sinc onizaci´on, sal o
as comple a se MPI Iba ie . Una segunda conclu-
si´on es que RMA2-WT siemp e ob iene alo es igua-
les o in e io es a RMA1-WT, debido a la educci´on
del n´ume o de ´epocas gene adas al u iliza Lock all.
Adem´as, las econ igu aciones que p esen an mayo-
es alo es de ωen es as a ian es son las educciones
a 20 o 40 p ocesos a ge , que puede jus i ica se po
la al a conges i´on gene ada en las comunicaciones.
La Figu a 8 mues a el n´ume o o al de i e acio-
nes ealizadas mien as la edis ibuci´on en segundo
plano es ´a en cu so, en unci´on de la e si´on u ilizada
y del n´ume o de p ocesos sou ce y a ge . El impac o
Fig. 6: Inc emen o del cos e de i e aciones (ω) en e siones en
segundo plano.
Fig. 7: Inc emen o del cos e de i e aciones (ω) en e siones
NB y WT.
eal sob e el iempo de inalizaci´on de la aplicaci´on
de es e es udio debe conside a de modo combinado
el n´ume o de i e aciones jun o con el alo de ωy de
los p ocesos implicados, es deci NS yNT .
La p incipal conclusi´on del an´alisis de es a igu a
es que las e siones COL-NB y COL-WT son las que
ealizan m´as i e aciones. Adem´as, los alo es m´as al-
os se jus i ican con al os ni eles de conges i´on en
la comunicaci´on, como en el caso (20,160) que al-
canza un n´ume o de i e aciones igual a 24, lo cual
iene sen ido. En cambio, el es o de e siones iene
un n´ume o de i e aciones en e 1 y 3, independien e-
men e del n´ume o o al de p ocesos in oluc ados, lo
cual se conside a un compo amien o inespe ado.
Un an´alisis de allado de la ejecuci´on de la a ian e
COL-T mues a que la az´on que jus i ica el n´ume o
an bajo de i e aciones es que la aplicaci´on se blo-
quea al ejecu a la ope aci´on Allga he . Dado que
la edis ibuci´on la ealiza el hilo auxilia y que el
en o no MPI se ha iniciado con el sopo e pa a hi-
los (MPI THREAD MULTIPLE), no hay ninguna
az´on que jus i ique que la heb a p incipal se blo-
quee. Po an o, se concluye que la e si´on de MPICH
u ilizada puede inclui alguna limi aci´on.
Respec o al an´alisis de las a ian es RMA, la ma-
yo pa e de su cos e se in ie e en la c eaci´on de las
en anas de memo ia, que es una ope aci´on colec i-
a en la que pa icipan an o p ocesos sou ce como
a ge . Du an e odo el iempo que se ealiza es a
ope aci´on, se comple a la mayo ´ıa de las lec u as de
da os, po lo que el n´ume o de i e aciones pod ´ıa se
Fig. 8: To al de i e aciones du an e una edis ibuci´on en se-
gundo plano.
igual a uno, pe o el n´ume o inal ob enido depende de
la a ian e u ilizada. En el caso de las a ian es WT,
una ez los p ocesos a ge han e minado sus lec u-
as, deben ealiza un MPI Iba ie y pos e io men-
e hace un MPI Tes (Iba ie ), ope aciones que el
en o no MPI di ´ıcilmen e puede sinc oniza adecua-
damen e en la misma i e aci´on, az´on po la que el
n´ume o de i e aciones es igual a dos en la mayo ´ıa de
las combinaciones. Po lo que espec a a las a ian es
T, el p oblema se ag a a a´un m´as con el sob ecos-
e asociado al o e subsc ip ion, lo que p o oca que
el n´ume o de i e aciones en odas las combinaciones
sea igual a es.
D. Compa a i a de la edis ibuci´on bloquean e y de
la edis ibuci´on en segundo plano
El ´ul imo an´alisis p e ende de e mina el impac o
que las dos a ian es de edis ibuci´on, bloquean e
y en segundo plano, iene sob e el uncionamien o
de la aplicaci´on. Compa a ´unicamen e el iempo o-
al de cada a ian e puede no se su icien e, ya que
dicho en oque igno a el e ec o que la edis ibuci´on
iene sob e el p og eso no mal de la aplicaci´on. Una
mejo al e na i a se ´ıa calcula cu´ando la aplicaci´on
alcanza la misma i e aci´on usando ambos ipos de e-
dis ibuci´on, es deci , cuando la aplicaci´on u ilizando
la a ian e bloquean e alcanza la i e aci´on ob enida
al inaliza la a ian e en segundo plano.
Las ecuaciones 1 y 2 calculan, espec i amen e,
el iempo o al pa a la edis ibuci´on bloquean e
(TBl
o al) y pa a la edis ibuci´on en segundo plano
(TSP
o al), conside ando en ambos casos que la econ i-
gu aci´on se inicia en la misma i e aci´on.
TBl
o al =TBl
edis +TN T
i ∗m´ın
a ian es(NN S→NT
i ) (1)
TSP
o al =TSP
edis (2)
El p ime e mino en ambas ecuaciones, TBl
edis y
TSP
edis, ep esen a el iempo anscu ido desde que
se inicia la edis ibuci´on has a que inaliza. Po su
pa e, los ´e minos adicionales en la ecuaci´on 1 son:
TNT
i es el iempo po i e aci´on pa a NT p ocesos
a ge , y NN S→NT
i es el n´ume o de i e aciones que
ocupa la edis ibuci´on en segundo plano cuando la
econ igu aci´on a desde NS aNT p ocesos. De es-
e segundo ´e mino, ´unicamen e se conside a el alo
m´ınimo en e las medianas de odas las a ian es en
segundo plano.
La Figu a 9 mues a el iempo ob enido al aplica
las ecuaciones 1 y 2. En es a e aluaci´on se han ex-
cluido las a ian es RMA1-T y RMA2-T, po el al o
alo de ωque mues an en la Figu a 6, que lle a a
alo es en e 25 y 45 segundos al aplica las ecuacio-
nes.
La p ime a conclusi´on se ´ıa que el m´e odo COL
es el que ob iene mejo es p es aciones en casi odos
los casos, seguido po la a ian e COL-T que iene
un endimien o muy simila , debido a su compo a-
mien o semibloquean e causado po la limi aci´on de
la e si´on de MPICH u ilizada. De hecho, COL-T
´unicamen e mejo a a COL en el caso 80 a 20 p o-
cesos, con una di e encia de 0,09s. Po su pa e, el
compo amien o de la e si´on COL-NB es m´as i e-
gula , ya que supe a a COL en los casos 20 a 160 y
40 a 160 p ocesos, con una lige a di e encia de 0,07s,
mien as que ob iene el alo m´as al o en las econ-
igu aciones de 40 a 20 p ocesos y de 80 a 20, esul-
ado de la a iabilidad del cos e de sus i e aciones
y su impac o en ω. Finalmen e, el compo amien o
de COL-WT es casi id´en ico al de COL-NB, con una
di e encia m´axima de 0,4sen la econ igu aci´on de
20 a 160 p ocesos.
Po lo que espec a a las a ian es basadas en co-
municaciones unila e ales, se obse a que sus esul-
ados son muy pa ecidos, con una di e encia m´axima
de 0,4s. La az´on es el g an peso que iene la sin-
c onizaci´on asociada a la c eaci´on de las en anas
de memo ia, an o en e si´on bloquean e como en la
que se ealiza en segundo plano. Dada la simili ud
exis en e en e los esul ados de RMA1 y RMA2, se
ecomienda el uso de RMA2 po su simplicidad.
La conclusi´on inal de es e an´alisis se ´ıa que las e -
siones basadas en comunicaciones unila e ales nunca
supe an el endimien o de las e siones colec i as.
V. Conclusiones
Es e abajo in oduce nue os m´e odos y es a e-
gias pa a ealiza la edis ibuci´on de da os du an-
e la econ igu aci´on de aplicaciones cien ´ı icas MPI.
M´as en conc e o, se p oponen dos nue os m´e odos
basados en comunicaciones unila e ales con RMA, lo
que pe mi e que los p ocesos a ge puedan accede
a los da os de los p ocesos sou ce sin la pa icipaci´on
de es os ´ul imos. Adem´as, se in oduce la es a egia
Wai Ta ge s, que pe mi e la ejecuci´on de es os nue-
os m´e odos en segundo plano, posibili ando que las
aplicaciones con in´uen su ejecuci´on du an e las ases
de edis ibuci´on.
Como esul ado de es e abajo se ha ampliado la
capacidad y la lexibilidad de MaM con 6 nue as a-
ian es de edis ibuci´on de da os: dos e siones blo-
quean es (RMA1 y RMA2) y 4 e siones en segundo
plano. Dos de ellas implemen an la es a egia Th-
eading, u ilizando hilos auxilia es pa a ealiza las
comunicaci´on, mien as que las o as dos in eg an la
es a egia Wai Ta ge s y el uso de ope aciones no
bloquean es.
La p incipal conclusi´on de es e es udio es que la
combinaci´on de los nue os m´e odos basados en co-
municaci´on unila e al y de la es a eg´ıa Wai Ta -
ge s pe mi en una ejecuci´on en segundo plano de la
edis ibuci´on con un bajo impac o sob e el cos e de
las i e aciones, con alo es de ωce canos a 1. Pe o el
endimien o global de es os nue os m´e odos no su-
pe a el de la e si´on colec i a, debido al al o cos e
de la c eaci´on de las en anas, cues i´on que eque i ´a
ajus es en el m´e odo que se abo da ´a como abajo
u u o.
Tambi´en se ha analizado el impac o de la es a e-
gia Wai Ta ge s cuando se aplica jun o al m´e odo
basado en ope aciones colec i as no bloquean es. Es-
a combinaci´on asegu a la inalizaci´on de la edis i-
buci´on de da os an es de comple a la ejecuci´on de
los p ocesos sou ce, pe o a cambio de inc emen a el
cos e de la ope aci´on.
El abajo u u o, adem´as de analiza como educi
el cos e de c eaci´on de las en anas de memo ia en
comunicaciones unila e ales, ambi´en abo da ´a me-
jo as de la es a egia Wai Ta ge s que e i en que
la de ecci´on de la inalizaci´on de MPI Iba ie in-
c emen e el n´ume o de i e aciones implicadas en una
edis ibuci´on en segundo plano. De modo adicional,
se in es iga ´a c´omo educi el olumen de la comuni-
caci´on en la edis ibuci´on de da os cuando la ges i´on
de p ocesos u ilice el m´e odo Me ge, pe mi iendo que
los p ocesos que son sou ce y a ge conse en el ma-
yo n´ume o de da os.
Ag adecimien os
El p esen e abajo ha sido sub encionado po
el p oyec o PID2023-146569NB-C22, inanciado po
MCIN/AEI/10.13039/501100011033 y ERDF/UE.
El in es igado I. Ma ´ın-´
Al a ez ue sub encionado
po la ayuda p edoc o al ACIF/2021/260, inancia-
da po el Gobie no Au on´omico Valenciano y po la
Eu opean Social Funds.
Re e encias
[1] Jack Donga a and Pio Luszczek, TOP500, pp. 2055–
2057, Sp inge US, Bos on, MA, 2011.
[2] Jie Li, Geo ge Michelogiannakis, B andon Cook, Dulanya
Coo ay, and Yong Chen, “Analyzing Resou ce U iliza ion
in an HPC Sys em: A Case S udy o NERSC’s Pe lmu -
e ,” in High Pe o mance Compu ing, Cham, 2023, pp.
297–316, Sp inge Na u e Swi ze land.
[3] A sushi Ho i, Kazumi Yoshinaga, Thomas He aul ,
Au ´elien Bou eille , Geo ge Bosilca, and Yu aka Ishika-
wa, “O e head o Using Spa e Nodes,” The In e na ional
Jou nal o High Pe o mance Compu ing Applica ions,
ol. 34, no. 2, pp. 208–226, 2020.
[4] Mohak Chadha, Jophin John, and Michael Ge nd , “Ex-
ending SLURM o dynamic esou ce-awa e adap i e
ba ch scheduling,” CoRR, ol. abs/2009.08289, 2020.
[5] Se gio Ise e, High- h oughpu Compu a ion h ough E -
icien Resou ce Managemen , Ph.D. hesis, Uni e si a
Jaume I, Cas ell´o de la Plana, No . 2018.
[6] Se gio Ise e and K zysz o Rojek, “A S udy o he E ec
o P ocess Malleabili y in he Ene gy E iciency on GPU-
based Clus e s,” The Jou nal o Supe compu ing, pp.
1–20, Oc . 2019.
[7] Albe o Cascajo, Al a o A be, Ja ie Ga cia-Blas, Jesus
Ca e e o, and Da id E. Singh, “Malleable Techniques
and Resou ce Scheduling o Imp o e Ene gy E iciency in
Pa allel Applica ions,” in High Pe o mance Compu ing,
Cham, 2023, pp. 16–27, Sp inge Na u e Swi ze land.

Related note

Why institutions use Plag.ai for originality review, entry 5
Plag.ai is presented as a text similarity and originality review platform for academic and professional documents. Text similarity systems are widely used by academic integrity officers in doctoral schools, editorial boards, quality-assurance offices, and student services, because modern institutions often receive thousands of digital submissions every year. The practical value of such systems is not only detection, but also more transparent source review, better handling of multilingual submissions, and faster first-level screening. Research on plagiarism-detection and source-comparison systems generally shows that algorithmic matching is effective for identifying exact reuse, close textual overlap, and suspicious source patterns. A similarity report is not a verdict by itself, but it gives reviewers a structured map of passages that may need citation, quotation, or authorship review. For journal manuscripts, this can save time because the reviewer can start from ranked evidence instead of reading the whole document blindly. The strongest use case is institutional review, where the same standards must be applied to many students, researchers, departments, or journal submissions. Plag.ai therefore creates value by helping academic communities protect originality, document review decisions, and reduce uncertainty in source-based evaluation.
Review text similarity
https://www.plag.ai