scieee Science in your language
[ca] (orig)

Classificació de miralls de vehicles segons característiques de sorollositat

Author: Bonet Domènech, Josep
Publisher: Universitat Politècnica de Catalunya
Year: 2010
Source: https://upcommons.upc.edu/bitstream/2099.1/10267/1/memoria.pdf






  !

∀#∃
%
&∋(∋


∀
Disc iminaci´
o
Mi alls So ollosos
Josep Bone i Dom`
enech
Tu o a: L´
ıdia Mon e o
Dedico aques eball a la me a esposa i ills, semp e han es a
mol comp ensius en els momen s que el papa no podia es a amb
ells i ha ia d’es a en la mem`
o ia.
Tamb´
e a la me a u o a, la L´
ıdia, que semp e m’ha ajuda quan
la necessi a a i als seus bons sugge imen s es ad´
ıs ics pe dona
o ma al p ojec e.
2
´
Index
1 In oducci´
o 3
1.1 Desc ipci´
o sis ema de es . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Es ad´
ıs ica desc ip i a . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Elimina a iables segons co elacions . . . . . . . . . . . . . . . 19
2 A b es de decisi´
o 22
2.1 C5.0................................. 24
2.1.1 Resul a s C5.0 . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Ques ................................ 32
2.2.1 De e mina llinda Ques .................. 33
2.2.2 Selecci´
o de a iables . . . . . . . . . . . . . . . . . . . . 34
2.2.3 Sepa aci´
o mul i a ian . . . . . . . . . . . . . . . . . . . 34
2.2.4 Resul a s Ques . . . . . . . . . . . . . . . . . . . . . . . 35
2.3 Taula esum dels esul a s dels a b es de decisi´
o . . . . . . . . . . 73
3 Models Lineals Gene ali za s 75
3.1 Conjun sense a iables al amen co elacionades . . . . . . . . . 79
3.2 Conjun inicial dels a b es de decisi´
o . . . . . . . . . . . . . . . . 81
3.3 Elimina a iables amb s epAIC .................. 83
3.4 Conjun inicial ex e de les componen s p incipals . . . . . . . . 85
3.5 Conjun basa en l’espai de les componen s p incipals no mali zades 88
3.6 Conjun basa en l’espai de les componen s p incipals no mali za-
des usan s epAIC .......................... 89
3.7 Taula esum dels esul a s dels models lineals gene ali za s . . . . 91
4 Nea es Neighbou 92
5 Soluci´
o plan ejada 96
6 Fu u es l´
ınies d’ac uaci´
o 102
Ap`
endix 105
A Es a del p ojec e indus ial . . . . . . . . . . . . . . . . . . . . . 105
B P ocessamen del senyal . . . . . . . . . . . . . . . . . . . . . . 106
1
C Nai e Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
D Lab iew............................... 110
D.1 Qu`
e´
es el LabVIEW? . . . . . . . . . . . . . . . . . . . . 110
D.2 Com eballa el LabVIEW? . . . . . . . . . . . . . . . . 110
D.3 Exemple d’un VI senzill . . . . . . . . . . . . . . . . . . 111
2

Cap´
ı ol 1
In oducci´
o
Aques p ojec e ´
es el esul a d’in en a esold e un p oblema de la ind´
us ia de
l’au om`
obil. El clien olia descob i si es podia disc imina en e una mos a de
e o iso s aba ibles pe oba quins e en so ollosos (dolen s) i quins no (bons, o
amb´
e anomena s silenciosos al lla g del ex ).
No malmen en l’en o n indus ial hi ha unes especi icacions pe al de classi i-
ca di e en s componen s, pe exemple, el consum d’aques apa ell ha de se meno
de 3 ampe s o la ensi´
o gene ada pe aques a on ha de se 10 ol s. Pe `
o en aques
cas aques es especi icacions no hi e en, nom´
es hi ha ia dos g ups de e o iso s
cadascun amb 3 mos es, i di ´
ıcilmen disc iminables en e els uns i als al es a
simple o¨
ıda.
Pe an , el p ime que es a e a se anali za l’espec e del so i in en a eu-
e si hi ha ia alguna mesu a (po `
encia, dis o si´
o ha m`
onica, e c.) que pe me ´
es
disc imina els bons dels dolen s. Malau adamen no n’hi ha ia una su icien men
obus a, que es dongu´
es en m´
es del 95% dels casos. Da an d’aix`
o es a op-
a pe amplia els pa `
ame es i u ili za d’al es que no depenguessin nom´
es de
l’espec e sono . Aques s pa `
ame es que es an aga a an se mesu es del con-
sum de co en a l’ho a de plega i desplega el mi all. Pe al de ba eja m´
es
d’una mesu a es a decidi u ili za el c i e i de Nai e Bayes que es oba expli-
ca a l’ap`
endix C. Aques c i e i es basa a en les a iables que enien mi janes
i a i`
ancies poc solapades. ´
Es a di , assumin que les a iables s´
on gaussianes
ind ´
ıem dos casos. Un ep esen a a la igu a 1.21a on enim la ep esen aci´
o d’u-
na a iable gaussiana amb a i`
ancia uni `
a ia i amb mi jana -1 pel cas de mi alls
silenciosos ( ep esen ada en blau) i una al a amb mi jana 1 ep esen an els so o-
llosos (pin ada en e mell). En aques cas, aques a a iable no se i ia en aques
c i e i ja que la p obabili a de mala classi icaci´
o´
es mol al a: Pe=R∞
0 X(x)dx =
R∞
01
σ√2πexp−1
2(x+1)2
σ2=1−1
21+e 1
√2=0.159. En can i, en la ep e-
sen aci´
o 1.1 a on les gaussianes enen mi janes de -4 i 4, alesho es enim que l’e -
1To es les g `
a iques enen l’explicaci´
o del que s´
on les abscisses (Absc) i el que s´
on les o denades
(O d).
3
o ´
es nom´
es de Pe=R∞
01
σ√2πexp−1
2(x+4)2
σ2=1−1
21+e 4
√2=3e−5.
Pe an les a iables que in e essen s´
on aquelles que no enen gai e solapamen .
Aques solapamen es a de e mina u ili zan la mi jana de les a iables a una
dis `
ancia de ±3σ. Seguin aques c i e i es an oba 3 a iables que aplican el
m`
e ode Nai e Bayes i escollin com a classi icaci´
o el alo m´
es p obable, classi i-
ca a b´
e o es les mos es que es enien de e o iso s.
0.2
0.1
01050
0.4
0.3
-5-10
Figu a 1.1: Va iable amb solapamen mol pe i que pe me la disc iminaci´
o. Absc:
Valo s a iable alea `
o ia; O d: P obabili a .
Un cop con i ma que es podien classi ica es a ana a la `
ab ica pe eu e si
es podia in eg a amb la se a m`
aquina. Aques a m`
aquina ´
es una m`
aquina de es
al inal d’una l´
ınia de mun a ge que s’enca ega de e i ica el bon uncionamen
del mi all: si es plega i s’ob e b´
e, si gi a el id e, e c. Un cop a iba s a la `
ab ica,
es a di que s’ha ia de p o a amb un al e model de mi all que enia el ma eix
mo o pe e -lo plega . Les a iables u ili zades an e io men no se ien pe aques
model, enien un compo amen di e en . Es a o na a p end e mesu es del nou
model de mi all i in en a oba unes a iables que donguessin bon esul a . No es
an oba . Es a decidi d’aga a 3 mi alls so ollosos i 3 de no so ollosos del nou
model de e o iso i es udia m´
es p o undamen el so oll pe eu e si es oba en
no es a iables que pe me essin la disc iminaci´
o.
A l’es udi eali za en un en o n de labo a o i es a oba que si s’anali za en
els componen s eq¨
uencials del consum es podia oba a iables que conjun a-
men amb el so pe me essin e b´
e la classi icaci´
o. Es a o na ana a la `
ab ica i
en aquell en o n les a iables no enien el ma eix compo amen que en l’es udi de
labo a o i, amb el que no hi ha ia o ma de disc imina . Es an p end e di e en s
4
0.2
0.1
01050
0.4
0.3
-5-10
Figu a 1.2: Va iable amb solapamen g an que no pe me la disc iminaci´
o. Absc:
Valo s a iable alea `
o ia; O d: P obabili a .
mesu es en aques en o n de p oducci´
o pe o na a es udia la classi icaci´
o.
Aques es udi es basa en aques es ´
ul imes mos es, adqui ides amb els elemen s
de mesu a i l’en o n de p oducci´
o inal. Es pa la b eumen del p ocessamen del
senyal, sob e o en la pa de desc ipci´
o de les a iables u ili zades, pe `
o es cen a
en les `
ecniques es ad´
ıs iques u ili zades pe a la classi icaci´
o. En el seg¨
uen apa -
a s’explica el sis ema de es i les a iables que s’han p es pe la classi icaci´
o.
To segui es a un es udi es ad´
ıs ic desc ip iu d’aques es a iables a la secci´
o 1.2.
Desp ´
es es passa a explica i a alo a di e en s `
ecniques pe classi ica :
•A b es de decisi´
o (cap´
ı ol 2). Aques algo i me pe me p end e decisions,
classi ica en aques cas, a pa i de condicions en les a iables. S’han u ili -
za dues `
ecniques que enen el so wa e de o ma g a u¨
ı a que s´
on el C5.0 i
el Ques . En el cap´
ı ol co esponen s’explica m´
es de alladamen com unci-
onen els a b es de decisi´
o i en conc e aques es dues `
ecniques.
•Models lineals gene ali za s (cap´
ı ol 3). Aques a `
ecnica in en a modela
la p obabili a de mi alls so ollosos a pa i d’una combinaci´
o lineal de les
a iables ecollides. Els models lineals gene ali za s depenen mol de les a-
iables que es conside in impo an s, ja que si s’u ili zen o es, el model po
pe d e p edic abili a . Les di e en s es a `
egies que s’han segui pe ob eni
el conjun de a iables signi ica i es, els esul a s ob ingu s u ili zan el p o-
g ama R, i una explicaci´
o m´
es p o unda de la `
ecnica, es poden oba en el
co esponen cap´
ı ol.
5
•El e´
ı m´
es p ope (cap´
ı ol 4) ´
es un m`
e ode de classi icaci´
o a on a la no a
mos a a classi ica se li calculen les dis `
ancies als p o o ipus pa ´
o i se li
assigna l’e ique a que enen la majo ia dels K e¨
ıns m´
es p ope s.
Un cop is os els di e en s algo i mes es p esen en els seus esul a s i es eu quina
´
es la millo soluci´
o al cap´
ı ol 5. Finalmen es comen en l´
ınies u u es d’ac uaci´
o al
cap´
ı ol 6.
1.1 Desc ipci´
o sis ema de es
La m`
aquina de es del e o iso de la l´
ınia de p oducci´
o es `
a o mada pe dues
pa s ben di e enciades con olades amb un PLC (P og ammable Logic Con ol).
A la p ime a pa es comp o a que el e o iso es plegui, desp ´
es l’ope a i el
desconnec a i el connec a a la segona pa on es comp o a que la lluna gi i, que
l’in e mi en s’encengui, que el colo del e o iso es co espongui al demana ,
e c.La de ecci´
o de la so ollosi a es a a la p ime a pa , a egin -hi els ins umen s
de mesu a necessa is: un mic `
o on d’al a sensibili a i un ampe ´
ıme e. Les da-
des d’aques s senso s s´
on digi ali zades amb una a ge a d’adquisici´
o de Na ional
Ins umen s i p ocessades amb el Lab iew ([1]). Els dos senyals han es a mos e-
ja s a 25000 mos es pe segon, ja que l’o¨
ıda humana ´
es sensible a uns 12.5 Khz,
complin d’aques a mane a el eo ema de Nyquis (m´
es in o maci´
o a l’ap`
endix B).
Aques s senyals s´
on p ocessa s i se n’ex euen o un segui de a iables que en-
en en els algo i mes de classi icaci´
o. Un cop classi ica el nou mi all, el Lab iew
en ia la in o maci´
o al PLC pe qu`
e a egeixi el esul a d’aques es a o s els al es
es os que s’han e : colo , in e mi en , e c.
Els senyals p o inen s del mic `
o on i l’ampe ´
ıme e s’han p ocessa espec al-
men il an -los en 4 bandes eq¨
uencials que no es solapen. Els amples de banda
dels il es s´
on pel cas del co en :
1. 0-24 Hz.
2. 24-45 Hz.
3. 45-80 Hz.
4. 80-500 Hz
En el cas del mic `
o on enim que les qua e bandes s´
on:
1. 40-315 Hz.
2. 315-780 Hz.
3. 780-2500 Hz.
4. 2500-14000 Hz.
6
100 150 200 250 300
F4Co Ta_FF
0.0 0.2 0.4 0.6 0.8 1.0
F4Co Ta_THD
−0.1 0.0 0.1 0.2 0.3 0.4
F4Co Ta_SINAD
0.96 0.97 0.98 0.99 1.00 1.01 1.02
F4Co Ta_THDN
2e−04 4e−04 6e−04 8e−04
F4Co Ta_Powe
Figu a 1.12: F4Co Ta Va .Absc: ac¸a densi a ; O d: Valo a iable.
400 450 500 550 600 650 700
F2AudOb_FF
0.0000 0.0002 0.0004 0.0006 0.0008 0.0010 0.0012
F2AudOb_THD
−0.2 0.0 0.2 0.4
F2AudOb_SINAD
0.96 0.98 1.00 1.02
F2AudOb_THDN
0 50 100 150
F2AudOb_Powe
Figu a 1.13: F2AudOb Va .Absc: ac¸a densi a ; O d: Valo a iable.
13

400 450 500 550 600 650 700
F2AudTa_FF
1e−04 2e−04 3e−04 4e−04 5e−04 6e−04
F2AudTa_THD
−0.10 −0.05 0.00 0.05 0.10 0.15 0.20 0.25
F2AudTa_SINAD
0.98 0.99 1.00 1.01
F2AudTa_THDN
02468
F2AudTa_Powe
Figu a 1.14: F2AudTa Va .Absc: ac¸a densi a ; O d: Valo a iable.
1000 1200 1400 1600 1800 2000
F3AudOb_FF
0.0 0.1 0.2 0.3 0.4
F3AudOb_THD
−0.15 −0.10 −0.05 0.00 0.05 0.10 0.15 0.20
F3AudOb_SINAD
0.98 0.99 1.00 1.01
F3AudOb_THDN
0 20 40 60 80 100 120
F3AudOb_Powe
Figu a 1.15: F3AudOb Va .Absc: ac¸a densi a ; O d: Valo a iable.
14
0 500 1000 1500 2000
F3AudTa_FF
0.0 0.2 0.4 0.6 0.8
F3AudTa_THD
−0.10 −0.05 0.00 0.05 0.10
F3AudTa_SINAD
0.990 0.995 1.000 1.005 1.010
F3AudTa_THDN
0 1 2 3 4 5
F3AudTa_Powe
Figu a 1.16: F3AudTa Va Absc: ac¸a densi a ; O d: Valo a iable.
15
Po sembla que algunes g `
a iques dels ioplo s, com a a F2AudOb Powe (que
es oba a la igu a 1.13) o F2AudTa Powe (que es oba a la igu a 1.14), p esen in
ou lie s, pe `
o hem de eni en comp e que aques es dades han es a ecollides en
un en o n so oll´
os. Pe `
o´
es un so oll que no podem menys eni en el nos e es udi,
ja que l’aplicaci´
o inal ha d’es a eballan en una l´
ınia de p oducci´
o, a on hi ha
mol so oll ambien al, i la nos a soluci´
o ha de se p ou bona pe pode dis ingi els
mi alls bons dels dolen s ins i o en aques ambien an ad e s. Volem una soluci´
o
obus a que pugui disce ni malg a l’en o n, pe aix`
o conside em els possibles
ou lie s com a bons en el nos e sis ema, pe qu`
e´
es gai eb´
e segu que hi hau `
a algun
momen dins la p oducci´
o de mi alls, en el pas que de e mina si s´
on so ollosos o
no, que ind `
a un ni ell de so oll semblan , i pe aix`
o aques es dades que sembla ien
ou lie s s´
on bones pe al nos e sis ema.
A a b´
e, pe al de eu e si hi hagu´
es alguna mos a que no hagu´
es unciona
b´
e la sinc oni zaci´
o amb la m`
aquina de es o s’hagu´
es p odu¨
ı un e o amb la
ans e `
encia de les dades, u ili za em l’an`
alis de componen s p incipals. La g `
a ica
de les dues p ime ess componen s p incipals es po oba a la igu a 1.17 a on s’han
ep esen a els mi alls bons amb una c eu bla a, i els so ollosos amb una e mella.
-10000 0 10000
-10000
-5000
0
5000
-20000
10000
F1
F2 F3
Figu a 1.17: Dos p ime s componen s p incipals. Absc: P ime a componen p incipal.
O d: Segona componen p incipal.
De la g `
a ica es po eu e com no hi ha cap pun que es igui mol sepa a de la
es a i com els g ups no es an gai e ba eja s, amb el que podem in en a in es iga
algun algo i me que sigui capac¸ de sepa a -los. I amb´
e sembla que no hi hagi cap
mos a que es igui mol sepa ada del seu g up, e o c¸an d’aques a mane a la nos a
es a `
egia d’aga a o es les dades com a bones sense de e mina ou lie s conc e s.
Aques a o ma d’ac ua amb´
e es eu e o c¸ada en la g `
a ica, ja que en aques a
ep esen aci´
o, les dues componen s p incipals enen el 99% de la a iaci´
o. Aques
16
c`
alcul es po eali za a pa i de la seg¨
uen in o maci´
o ex e a usan l’R:
Impo ance o componen s: PC1 PC2 PC3 PC4 PC5 PC6
S anda d de ia ion 6099.641 3076.067 2.94e+02 2.39e+02 78.37771 65.86049
P opo ion o Va iance 0.795 0.202 1.85e-03 1.22e-03 0.00013 0.00009
Cumula i e P opo ion 0.795 0.997 9.98e-01 1.00e+00 0.99978 0.99987
PC7 PC8 PC9 PC10 PC11 PC12 PC13 PC14
S anda d de ia ion 56.60962 49.15459 20.39197 4.63 3.49 1.42 0.872 0.504
P opo ion o Va iance 0.00007 0.00005 0.00001 0.00 0.00 0.00 0.000 0.000
Cumula i e P opo ion 0.99994 0.99999 1.00000 1.00 1.00 1.00 1.000 1.000
PC15 PC16 PC17 PC18 PC19 PC20 PC21 PC22 PC23
S anda d de ia ion 0.43 0.412 0.263 0.255 0.232 0.171 0.134 0.126 0.117
P opo ion o Va iance 0.00 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
Cumula i e P opo ion 1.00 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
PC24 PC25 PC26 PC27 PC28 PC29 PC30 PC31
S anda d de ia ion 0.1 0.0941 0.091 0.0754 0.0709 0.06 0.0572 0.0486
P opo ion o Va iance 0.0 0.0000 0.000 0.0000 0.0000 0.00 0.0000 0.0000
Cumula i e P opo ion 1.0 1.0000 1.000 1.0000 1.0000 1.00 1.0000 1.0000
[...]
De les dues p ime es componen s p incipals, l’apo aci´
o de les di e en s a ia-
bles a aques es componen s ´
e la dis ibuci´
o que es po oba a la Taula 1.1, a on
podem obse a que les a iables F1Co Ob Leng h i F1Co Ta Leng h enen m´
es
del 99% en les dues componen s.
Taula 1.1: Taula amb els pesos de les a iables segons les p ime es componen s
p incipals.
Va iable Pes 1acomponen Pes 2acomponen
F1Co Ob Leng h 98.81 2.78
F1Co Ta Leng h 1.16 96.82
F3AudOb FF 0.01 0.19
F4Co Ob FF 0.01 0.01
F3AudTa FF 0.01 0.17
Tamb´
e podem ob eni m´
es in o maci´
o si em l’an`
alisi de les componen s p in-
cipals pe `
o eballan amb la ma iu de co elacions en lloc de la de co a i`
ancies
que ´
es la que s’ha u ili za m´
es amun . T eballan amb aques a ma iu ob enim el
seg¨
uen an`
alisi de componen s p incipals:
Impo ance o componen s: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
S anda d de ia ion 3.0900238 2.3989146 2.22662842 1.9356047 1.87487024
P opo ion o Va iance 0.1515595 0.0913459 0.07869641 0.0594693 0.05579585
Cumula i e P opo ion 0.1515595 0.2429054 0.32160179 0.3810711 0.43686693
Comp.6 Comp.7 Comp.8 Comp.9 Comp.10
S anda d de ia ion 1.79709013 1.63759468 1.59086668 1.54798774 1.48428061
P opo ion o Va iance 0.05126243 0.04256693 0.04017233 0.03803597 0.03496967
17
Cumula i e P opo ion 0.48812936 0.53069628 0.57086861 0.60890458 0.64387425
Comp.11 Comp.12 Comp.13 Comp.14 Comp.15
S anda d de ia ion 1.46841610 1.37129655 1.2775379 1.23788296 1.18614408
P opo ion o Va iance 0.03422612 0.02984848 0.0259064 0.02432308 0.02233235
Cumula i e P opo ion 0.67810037 0.70794885 0.7338552 0.75817833 0.78051068
Comp.16 Comp.17 Comp.18 Comp.19 Comp.20
S anda d de ia ion 1.16782781 1.15058752 1.08104662 1.02631332 0.9470677
P opo ion o Va iance 0.02164797 0.02101352 0.01855019 0.01671935 0.0142371
Cumula i e P opo ion 0.80215864 0.82317216 0.84172235 0.85844170 0.8726788
Comp.21 Comp.22 Comp.23 Comp.24 Comp.25
S anda d de ia ion 0.91438092 0.88148818 0.86114075 0.789470416 0.772770327
P opo ion o Va iance 0.01327131 0.01233367 0.01177085 0.009893072 0.009478952
Cumula i e P opo ion 0.88595011 0.89828378 0.91005463 0.919947699 0.929426651
[...]
-0.1 -0.0500.05 0.1 0.15 0.2 0.25 0.3 0.35
P1
-0.3
-0.2
-0.1
0
0.1
P2
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
P3
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
-0.2 -0.1 0 0.1 0.2 0.3 0.4
P2
P1
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
-0.2 -0.1 0 0.1 0.2 0.3 0.4
P3
P1
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
-0.4 -0.3 -0.2 -0.1 0 0.1 0.2
P3
P2
Figu a 1.18: T es p ime es componen s p incipals pa in de la ma iu de co e-
laci´
o. Eixos: di e en s componen s p incipals (P1=p ime a compponen , P2=segona componen i
P3= e ce a componen ).
Si em la ep esen aci´
o de les mos es en les 3 p ime es componen s p incipals
ob ingudes a pa i de la ma iu de co elaci´
o ob enim el dibuix de la Figu a 1.18 a
18

on es po ap ecia que aqu´
ı els mi alls no es an an ben sepa a s com en la ma iu
de co a i`
ancies, hi ha pe i s subconjun s de so ollosos i silenciosos que s´
ı que es an
ben sepa a s en algunes dimensions, pe `
o n’hi ha d’al es que es an ba eja s. Hem
de eni en comp e pe `
o, que en aques a ep esen aci´
o les 3 p ime es componen s
p incipals nom´
es apo en ap oximadamen el 30% de la a iabili a , men e que en
la ma iu de co a i`
ancies aques a p opo ci´
o e a del 99%.
En el nos e an`
alisi enim el p oblema que la quan i a de a iables explica-
i es ´
es mol ele a . Pe al de mi a de simpli ica els algo i mes s’ha segui una
es a `
egia que calcula la ma iu de co elacions i es queda nom´
es amb una de les a-
iables d’un g up de a iables que es iguin al amen co elacionades. Pe exemple,
si F1Co Ta THD i F3Co Ob FF enen una co elaci´
o de 0.9, ens quedem nom´
es,
de o ma a bi `
a ia, amb F3Co Ob FF. L’explicaci´
o de allada d’aques a es a `
egia
i els esul a s es oben a la seg¨
uen secci´
o.
1.3 Elimina a iables segons co elacions
Pe al d’elimina el nomb e de a iables i e l’algo i me i els c`
alculs m´
es senzills
s’han elimina les a iables que es a en m´
es co elacionades. Pe eu e-les s’ha
segui un p oc´
es i e a iu que consis eix en:
1. Calcula la ma iu de co elacions de les dades.
2. Elimina la diagonal p incipal, ja que no ´
e in o maci´
o in e essan pe nosal-
es, semp e al 1, el m`
axim de la co elaci´
o, ja que ´
es l’au oco elaci´
o.
3. T oba els m`
axims en alo s absolu s de la ma iu de co elacions. Si el
m`
axim ´
es meno que 0.5 (llinda ixa a bi `
a iamen ), acaba. Al amen
con inua al pas seg¨
uen .
4. Elimina algunes a iables del sis ema segons les an e io s co elacions.
5. To na al pas 1.
Pe exemple, suposem que el nos e sis ema es `
a explica pe les a iables
V1,V2,iV3 que enen la seg¨
uen ma iu de co elacions: 

1 0.8 0.2
0.8 1 0.3
0.2 0.3 1 
. En
la p ime a i e aci´
o de l’algo i me de ec a ´
ıem que el m`
axim es oba en la co ela-
ci´
o de les a iablesV1 iV2 que al 0.8. Eliminem la a iableV1 i ens queda que la
ma iu de co elacions del p oblema a a al 1 0.3
0.3 1 . Com que les co elacions
a a s´
on meno s que el llinda que ha ´
ıem ixa (0.5), pa em l’algo i me i el nos e
p oblema a a es `
a desc i nom´
es pe les a iables V1 i V2.
Seguin aques p oc´
es s’ha a iba a eni en comp e les seg¨
uen s a iables:
F1Co Ta THD, F1Co Ta THDN, F1Co Ta Leng h, F2Co Ta THDN, F3Co Ob FF,
F3Co Ob THD,F3Co Ob THDN,F3Co Ta FF,F3Co Ta THDN, F3Co Ta Powe ,
19
F4Co Ob THD, F4Co Ob THDN,F4Co Ob Powe , F4Co Ta THD, F4Co Ta THDN,
F4Co Ta Powe , F2AudOb FF, F2AudOb THD, F2AudOb THDN, F2AudTa FF,
F2AudTa THD,F2AudTa THDN,F3AudOb THD,F3AudOb THDN,F3AudOb Powe ,
F3AudTa THDN i F3AudTa Powe . Amb aques es a iables enim la seg¨
uen ma-
iu de co elacions que no ´
e cap alo m´
es g an que 0.5:
Columns 1 h ough 11:
0.00000 0.33730 -0.26203 -0.31877 -0.22351 0.11675 0.28925 0.10437 -0.03415 0.20136 -0.10786
0.33730 0.00000 -0.37792 -0.18492 -0.17442 -0.01420 0.16119 0.04623 -0.00975 -0.04861 -0.00247
-0.26203 -0.37792 0.00000 0.17463 0.23679 -0.34792 -0.14167 0.05086 -0.02167 -0.18884 -0.42249
-0.31877 -0.18492 0.17463 0.00000 0.05199 0.00972 0.03114 -0.12991 -0.04831 0.08283 0.17183
-0.22351 -0.17442 0.23679 0.05199 -0.00000 -0.27847 -0.37308 0.03210 0.26093 -0.06196 0.07636
0.11675 -0.01420 -0.34792 0.00972 -0.27847 0.00000 0.19267 -0.02705 -0.07420 0.07119 0.15206
0.28925 0.16119 -0.14167 0.03114 -0.37308 0.19267 0.00000 0.02984 -0.15028 0.00769 -0.12616
0.10437 0.04623 0.05086 -0.12991 0.03210 -0.02705 0.02984 0.00000 0.30922 0.01512 -0.03392
-0.03415 -0.00975 -0.02167 -0.04831 0.26093 -0.07420 -0.15028 0.30922 0.00000 -0.03540 -0.01359
0.20136 -0.04861 -0.18884 0.08283 -0.06196 0.07119 0.00769 0.01512 -0.03540 0.00000 0.18642
-0.10786 -0.00247 -0.42249 0.17183 0.07636 0.15206 -0.12616 -0.03392 -0.01359 0.18642 0.00000
0.06546 0.07878 -0.04578 -0.12211 -0.02667 -0.08361 0.07454 -0.00852 0.27776 -0.08437 0.00026
-0.13873 -0.23765 0.25129 0.10917 0.17887 -0.47037 -0.46636 -0.06112 0.22622 0.12205 0.12203
0.20358 0.14475 -0.41233 -0.02459 -0.07279 0.34068 0.08767 -0.07864 -0.07233 0.03209 0.27529
0.07022 -0.09774 -0.09144 0.17762 -0.15112 0.22537 0.11934 -0.08461 -0.03738 0.11112 0.10155
-0.05654 -0.10435 0.02916 -0.13324 -0.08015 0.27377 -0.10030 0.18742 0.10543 0.15305 -0.21346
0.00803 0.15834 0.04142 0.09037 0.00285 -0.09568 0.07187 -0.07292 -0.00124 0.02262 -0.10894
0.28648 0.17953 -0.38691 -0.08855 -0.10640 0.10406 0.08128 -0.00324 0.10356 0.05313 0.06745
0.07496 0.01151 -0.01111 -0.00939 -0.06083 -0.09554 0.30282 -0.10134 -0.08347 -0.10955 -0.03520
-0.06238 -0.15040 0.33222 -0.15517 0.12794 -0.28874 -0.07531 0.11620 0.16422 -0.10309 -0.30376
-0.01941 0.03308 -0.42497 0.06116 -0.19973 0.27118 0.05729 -0.07390 0.03511 0.20876 0.20434
0.10104 -0.04277 0.12409 -0.19124 0.05496 -0.24706 0.03156 0.03496 0.03632 0.11157 -0.20611
0.09867 0.00368 -0.23646 -0.04153 -0.18479 0.26598 0.18740 -0.15230 -0.03596 -0.02648 0.13593
0.11460 0.04056 0.06331 -0.16508 -0.15915 -0.06923 -0.07688 -0.14514 -0.10398 -0.04904 0.00695
0.03654 -0.13552 0.02091 0.10428 0.00874 0.02335 -0.07608 -0.02986 -0.03332 0.00449 0.07385
-0.02735 -0.03623 0.11823 0.20844 0.01673 -0.14352 0.07220 -0.02527 0.09742 -0.02418 -0.07873
0.00203 -0.04454 0.00935 0.14418 0.04766 0.10817 -0.01724 -0.02961 -0.08462 -0.13941 0.01602
Columns 12 h ough 22:
0.06546 -0.13873 0.20358 0.07022 -0.05654 0.00803 0.28648 0.07496 -0.06238 -0.01941 0.10104
0.07878 -0.23765 0.14475 -0.09774 -0.10435 0.15834 0.17953 0.01151 -0.15040 0.03308 -0.04277
-0.04578 0.25129 -0.41233 -0.09144 0.02916 0.04142 -0.38691 -0.01111 0.33222 -0.42497 0.12409
-0.12211 0.10917 -0.02459 0.17762 -0.13324 0.09037 -0.08855 -0.00939 -0.15517 0.06116 -0.19124
-0.02667 0.17887 -0.07279 -0.15112 -0.08015 0.00285 -0.10640 -0.06083 0.12794 -0.19973 0.05496
-0.08361 -0.47037 0.34068 0.22537 0.27377 -0.09568 0.10406 -0.09554 -0.28874 0.27118 -0.24706
0.07454 -0.46636 0.08767 0.11934 -0.10030 0.07187 0.08128 0.30282 -0.07531 0.05729 0.03156
-0.00852 -0.06112 -0.07864 -0.08461 0.18742 -0.07292 -0.00324 -0.10134 0.11620 -0.07390 0.03496
0.27776 0.22622 -0.07233 -0.03738 0.10543 -0.00124 0.10356 -0.08347 0.16422 0.03511 0.03632
-0.08437 0.12205 0.03209 0.11112 0.15305 0.02262 0.05313 -0.10955 -0.10309 0.20876 0.11157
0.00026 0.12203 0.27529 0.10155 -0.21346 -0.10894 0.06745 -0.03520 -0.30376 0.20434 -0.20611
0.00000 0.20336 0.09012 0.16991 -0.04685 0.00441 0.04238 0.13024 0.12008 -0.02224 0.12026
0.20336 -0.00000 -0.11099 0.01672 -0.22904 -0.03232 0.04117 -0.00359 0.23692 -0.06152 0.34194
0.09012 -0.11099 0.00000 0.13223 -0.14705 -0.08169 0.24330 -0.10600 -0.30754 0.06883 -0.23758
0.16991 0.01672 0.13223 -0.00000 0.02120 -0.08910 0.04479 -0.18650 0.02960 0.24624 0.09848
-0.04685 -0.22904 -0.14705 0.02120 0.00000 0.06091 -0.08039 -0.02264 0.15059 0.06895 0.06496
0.00441 -0.03232 -0.08169 -0.08910 0.06091 -0.00000 -0.36318 0.15176 0.05753 -0.06560 -0.01423
0.04238 0.04117 0.24330 0.04479 -0.08039 -0.36318 0.00000 0.03149 -0.15217 0.07737 0.09953
0.13024 -0.00359 -0.10600 -0.18650 -0.02264 0.15176 0.03149 -0.00000 0.06067 -0.10562 0.08631
0.12008 0.23692 -0.30754 0.02960 0.15059 0.05753 -0.15217 0.06067 -0.00000 -0.26190 0.37094
-0.02224 -0.06152 0.06883 0.24624 0.06895 -0.06560 0.07737 -0.10562 -0.26190 -0.00000 0.01879
0.12026 0.34194 -0.23758 0.09848 0.06496 -0.01423 0.09953 0.08631 0.37094 0.01879 -0.00000
-0.04940 -0.18687 0.21477 0.09089 -0.17358 -0.09742 0.09385 0.00734 -0.19973 0.23117 -0.12924
-0.04006 0.10940 0.06982 -0.06043 -0.04376 0.15355 -0.06097 0.11129 0.03999 -0.06604 0.12848
-0.10676 -0.06111 -0.02901 -0.08180 -0.01136 -0.08830 0.04274 0.07650 -0.07711 0.06772 -0.08962
0.11729 0.23618 -0.04540 0.17476 -0.00995 0.33721 -0.01812 0.03763 0.15738 -0.03305 0.19977
-0.15036 -0.05625 -0.02870 0.06521 -0.02497 -0.04341 -0.03741 -0.10493 -0.13492 0.13628 0.08048
Columns 23 h ough 27:
0.09867 0.11460 0.03654 -0.02735 0.00203
0.00368 0.04056 -0.13552 -0.03623 -0.04454
-0.23646 0.06331 0.02091 0.11823 0.00935
-0.04153 -0.16508 0.10428 0.20844 0.14418
-0.18479 -0.15915 0.00874 0.01673 0.04766
0.26598 -0.06923 0.02335 -0.14352 0.10817
0.18740 -0.07688 -0.07608 0.07220 -0.01724
-0.15230 -0.14514 -0.02986 -0.02527 -0.02961
-0.03596 -0.10398 -0.03332 0.09742 -0.08462
-0.02648 -0.04904 0.00449 -0.02418 -0.13941
0.13593 0.00695 0.07385 -0.07873 0.01602
-0.04940 -0.04006 -0.10676 0.11729 -0.15036
20
-0.18687 0.10940 -0.06111 0.23618 -0.05625
0.21477 0.06982 -0.02901 -0.04540 -0.02870
0.09089 -0.06043 -0.08180 0.17476 0.06521
-0.17358 -0.04376 -0.01136 -0.00995 -0.02497
-0.09742 0.15355 -0.08830 0.33721 -0.04341
0.09385 -0.06097 0.04274 -0.01812 -0.03741
0.00734 0.11129 0.07650 0.03763 -0.10493
-0.19973 0.03999 -0.07711 0.15738 -0.13492
0.23117 -0.06604 0.06772 -0.03305 0.13628
-0.12924 0.12848 -0.08962 0.19977 0.08048
-0.00000 -0.02509 0.09172 -0.02809 -0.05212
-0.02509 0.00000 0.05679 0.03252 -0.09539
0.09172 0.05679 0.00000 -0.11365 -0.00843
-0.02809 0.03252 -0.11365 0.00000 0.07973
-0.05212 -0.09539 -0.00843 0.07973 0.00000
I ´
e els m`
axims a
> [Val, Pos] = max( abs(co 2) )
Val =
Columns 1 h ough 11:
0.33730 0.37792 0.42497 0.31877 0.37308 0.47037 0.46636 0.30922 0.30922 0.20876 0.42249
Columns 12 h ough 22:
0.27776 0.47037 0.41233 0.24624 0.27377 0.36318 0.38691 0.30282 0.37094 0.42497 0.37094
Columns 23 h ough 27:
0.26598 0.16508 0.13552 0.33721 0.15036
Pos =
Columns 1 h ough 23:
2 3 21 1 7 13 13 9 8 21 3 9 6 3 21 6 18 3 7 22 3 20 6
Columns 24 h ough 27:
4 2 17 12
Tal com es po ap ecia , no hi ha cap co elaci´
o que supe i el 0.5 que ´
es el
llinda que s’ha ia ixa .
21
Cap´
ı ol 2
A b es de decisi´
o
Els a b es de decisi´
o s´
on una `
ecnica de la mine ia de dades que desc iuen les
elacions en un conjun de dades d’una mane a in e p e able pels humans, i poden
se u ili za s pe classi ica i p edi . S´
on unes egles pe esb ina la ca ego ia d’un
objec e a pa i dels alo s de les se es a iables. L’a b e es cons ueix pa in
ecu si amen una mos a pa ´
o de les dades que es an ca ego i zades i enen les
a iables conegudes. Cada pa ici´
o´
es ep esen ada pe un node de l’a b e.
Un a b e de decisi´
o´
es una es uc u a que con ´
e:
• ulles: indiquen una classe, una ca ego ia.
•nodes de decisi´
o: que especi iquen un es a eali za i que enen una b anca
i un suba b e pe cada possible esul a del es .
Un a b e de decisi´
o po se u ili za pe classi ica una mos a comenc¸an pe
l’a el de l’a b e i desplac¸an -se a a ´
es d’ell ins que s’a iba a una ulla. A cada
node de decisi´
o es calcula el esul a del es pe la mos a que s’in en a classi ica
i l’a enci´
o es cen a a l’a el del suba b e co esponen al esul a . Quan aques
p oc´
es inalmen (i ine i ablemen ) a iba a una ulla, la mos a es classi ica segons
la ca ego ia, classe, d’aques a ulla.
El p oc´
es de gene a un a b e de decisi´
o a pa i d’un conjun Tde casos d’en-
enamen , pa eix del seg¨
uen algo i me: Sigui {C1,C2,...,Cn}el conjun de clas-
ses, alesho es hi ha 3 possibili a s:
•Tcon ´
e un o m´
es casos, o s pe anyen a una sola classe Cj: L’a b e de
decisi´
o pe T´
es una sola ulla iden i ican la classe Cj
•Tno con ´
e cap cas: L’a b e de decisi´
o´
es un al e cop una sola ulla, pe `
o
la classe associada amb aques node es de e mina a pa i d’in o maci´
o que
no es oba a T. Pe exemple, la ulla po se escollida en conco danc¸a amb
coneixemen p e i del domini, com pe exemple la classe majo i `
a ia o la
classe m´
es eq¨
uen del node an e io , el pa e.
22
(a) (b) <-classi ied as
---- ----
8 1 (a): class 1
3 20 (b): class 0
Time: 0.8 secs
La p ime a pa iden i ica la e si´
o de C5.0, la da a d’execuci´
o, i les opcions
amb les que el sis ema s’ha c ida . C5.0 cons ueix un a b e de decisi´
o a pa i dels
75 casos (amb 63 a iables) del i xe
DadesAmbComa.da a
.
L’a b e de decisi´
o ob ingu amb aques algo i me ´
es el que apa eix a pa i de
Decision ee:
i que es pod ia pa a aseja com
si F1Co Ta_SINAD ´
es m´
es pe i o igual que -0.942071 alesho es ´
es no so oll´
os
si no
si F1Co Ta_Leng h ´
es m´
es g an que 55119 alesho es ´
es no so oll´
os
si no
si F1Co Ta_SINAD ´
es m´
es g an que -0.0428809 alesho es ´
es no so oll´
os
si no
si F4Co Ob_THD ´
es m´
es pe i que ....
i d’aques a mane a ana eco en o l’a b e. El n´
ume o en e pa `
en esi al inal
de cada ulla de l’a b e indica el n´
ume o de casos de les dades d’en enamen que
es an mapeja s a aques a ulla.
Desp ´
esdelade inici´
o del’a b e, obem l’a aluaci´
od’aques . Enel nos e cas,
l’a b e esul an ´
es de 6 ulles no-buides i nom´
es ha com`
es 1 e o de classi icaci´
o
amb les dades d’en enamen . To segui es mos a l’´
us de les a iables pe p edi
la classe a la que pe anyen les mos es. Desp ´
es passa a alo a les mos es de es
i donen que dels 32 casos nom´
es s’han classi ica malamen 4, 1 de so oll´
os i 3 de
no so ollosos, en o al un 12.5% d’e o .
Resul a s C5.0 sense a iables al amen co elacionades
En aques apa a enim el esul a de l’algo i me C5.0 pa in del subconjun de
a iables a on s’han elimina les a iables al amen co elacionades.
C5.0 [Release 2.05] Thu Oc 15 10:50:47 2009
-------------------
Op ions:
Use 70% o da a o aining
Class speci ied by a ibu e ‘So oll’
Read 75 cases (28 a ibu es) om Dad5.da a
Decision ee:
29

F1Co Ta_Leng h <= 50734: 0 (23)
F1Co Ta_Leng h > 50734:
:...F1Co Ta_Leng h > 55119: 0 (14)
F1Co Ta_Leng h <= 55119:
:...F4Co Ob_THD <= 0.434302: 1 (25)
F4Co Ob_THD > 0.434302:
:...F3Co Ob_THD <= 0.00191166: 0 (8)
F3Co Ob_THD > 0.00191166: 1 (5/1)
E alua ion on aining da a (75 cases):
Decision T ee
----------------
Size E o s
5 1( 1.3%) <<
(a) (b) <-classi ied as
---- ----
29 (a): class 1
1 45 (b): class 0
A ibu e usage:
100% F1Co Ta_Leng h
51% F4Co Ob_THD
17% F3Co Ob_THD
E alua ion on es da a (32 cases):
Decision T ee
----------------
Size E o s
5 3( 9.4%) <<
(a) (b) <-classi ied as
---- ----
10 1 (a): class 1
2 19 (b): class 0
Time: 0.7 secs
Els esul a s s´
on bas an semblan s a l’an e io a b e, pe `
o aqu´
ı no u ili za
F1Co Ta SINADque s’ha elimina ja que es a aco elada un 0.99939 amb F1Co Ta THDN,
i que ampoc su , i ampoc apa eix F2Co Ta THD co elada un 0.5938 amb F4Co Ta Powe ,
i que ampoc su ; pe `
o en can i u ili za la a iable F3Co Ob THD que ´
e una
30
baixa co elaci´
o amb les dues a iables an e io s: F1Co Ta SINAD de 0.01012 i
F2Co Ta THD de 0.04273.
Hem de des aca que o i u ili za un node menys que el p ime esul a , ob ´
e
un e o menys.
Resul a s C5.0 a l’espai PCA
To segui apa eix el esul a d’aplica l’algo i me C5.0 a les a iables que s’han
ob ingu de l’espai de les componen s p incipals de la ma iu de co elacions.
C5.0 [Release 2.05] Sa Jul 24 13:28:52 2010
-------------------
Class speci ied by a ibu e ‘So oll’
Read 91 cases (17 a ibu es) om Y2_DadesNouEspaiPCA_SenseG up.da a
Decision ee:
Va 15 > -10256.64: 0 (32)
Va 15 <= -10256.64:
:...Va 12 > 9606.438: 0 (15)
Va 12 <= 9606.438:
:...Va 6 <= -1806.583: 1 (28)
Va 6 > -1806.583:
:...Va 8 <= 2058.937: 1 (4)
Va 8 > 2058.937:
:...Va 8 <= 2487: 0 (9)
Va 8 > 2487: 1 (3/1)
E alua ion on aining da a (91 cases):
Decision T ee
----------------
Size E o s
6 1( 1.1%) <<
(a) (b) <-classi ied as
---- ----
34 (a): class 1
1 56 (b): class 0
A ibu e usage:
100% Va 15
65% Va 12
48% Va 6
18% Va 8
31
E alua ion on es da a (16 cases):
Decision T ee
----------------
Size E o s
6 3(18.8%) <<
(a) (b) <-classi ied as
---- ----
4 2 (a): class 1
1 9 (b): class 0
Time: 0.8 secs
Aques ´
ul im esul a d´
ona el ma eix nomb e d’e o s que l’an e io , 1 en l’en-
enamen i 3 en les dades de es .
To segui s’explica un al e algo i me pe gene a a b es de decisi´
o que ´
es el
Ques .
2.2 Ques
Les sigles de Ques p o enen de Quick, Unbiased, E icien , S a is ical T ee,´
es
a di , a b e es ad´
ıs ic e icien , no biaixa i `
apid. Les ca ac e ´
ıs iques d’aques
algo i me desc i es pels seus au o s s´
on:
•T´
e un biaix negligible en la selecci´
o de a iables.
•´
Es de c`
alcul compu acional simple.
•Inclou l’opci´
o de p uning, que s’ha adu¨
ı com poda , ja que un cop c ea
l’a b e de decisi´
o e alla les ulles menys impo an s pe al que l’a b e sigui
m´
es gene al.
•Pe me una di isi´
o de les dades en o ma bina i, com el C5.0, pe `
o amb´
e
pe me una combinaci´
o lineal d’aques es u ili zan un an`
alis disc iminan
lineal.
La u ili zaci´
o d’aques algo i me au b`
asicamen en l’´
ul ima p opie a , ja que
al com s’explica en [5] el e de se mul i a ian d´
ona no es opo uni a s a la
class icaci´
o, ja que els a b es de decisi´
o que u ili zen nom´
es una a iable pe node
de decisi´
o nom´
es poden di idi l’espai amb una on e a que ´
es o ogonal a l’eix
de la a iable, men e que si la decisi´
o´
es mul i a ian , es po pa i l’espai amb
un hipe pl`
a. Aix`
o´
es el que es po eu e a la igu a 2.1 a on es eu que decisions
uni a ian s an un a b e mol lla g, men e que si s’u ili za la decisi´
ox+y≤8 amb
un sol node es di ideix o l’espai.
32
Figu a 2.1: Di e `
encia en e decisi´
o uni a ian i mul i a ian .
El Ques ´
es un algo i me pe c ea a b es de decisi´
o, pe an la o ma de c ea
l’a b e amb els nodes i les ulles ´
es la ma eixa que s’ha explica an e io men . A a
b´
e, la di e `
encia es `
a en el c i e i pe escolli quina a iable ´
es impo an i quin ´
es
el llinda .
2.2.1 De e mina llinda Ques
En el nos e cas que les mos es es classi iquen nom´
es en dues classes, l’algo i me
a aplica ´
es:
1. Sigui Xla a iable seleccionada pe sepa a el node .
2. Sigui ¯xAis2
Ala mi jana i la a i`
ancia mos al de la classe A. An`
alogamen ¯xB
is2
Bpe la classe B. Siguin p(A| )ip(B| ) = 1−p(A| )els p io s de la classe
AiB espec i amen .
3. Sigui l’equaci´
oax2+bx+c=0 a on
a=s2
A−s2
B
b=2(¯xAs2
B−¯xBs2
A)
c= (¯xBsA)2−(¯xA−¯xB)−1s2
Alogp(A| )
p(B| )
4. El node ´
e el llinda dde ini com:
(a) Si a=0 alesho es
d=((¯xA+¯xB
2−(¯xA−¯xB)−1s2
Alog p(A| )
p(B| ),¯xA6=¯xB
¯xA,¯xA=¯xB(2.6)
(b) Si no (a6=0):
33
i. Si b2−4ac <0, de inim d=¯xA+¯xB
2.
ii. si no (b2−4ac <0) de inim d=−b+−√b2−4ac
2asi a que els nodes
no es iguin bui s. Al amen d=¯xA+¯xB
2.
2.2.2 Selecci´
o de a iables
Pe al de selecciona les a iables dins l’algo i me de c eaci´
o de l’a b e de deci-
si´
o s’u ili za l’es ad´
ıs ic Fde l’ANOVA. Es de e mina un llinda F0i es calcula
l’es ad´
ıs ic Fpe o es les a iables. Si l’es ad´
ıs ic m´
es g an supe a F0s’escull la
a iable co esponen a aquell es ad´
ıs ic.
2.2.3 Sepa aci´
o mul i a ian
En el cas de classi icaci´
o bin`
a ia pe sepa a u ili zan una combinaci´
o lineal de les
a iables s’usa el Linea Disc iminan Analysis (LDA). L’objec iu d’aques an`
alisi
´
es pode oba una no ma que millo sepa i dos g ups que assumim que s´
on sepa-
ables pe una combinaci´
o lineal de les ca ac e ´
ıs iques que desc iuen els objec es.
El c i e i pe de e mina quin millo sepa a ´
es edui la p obabili a de classi icaci´
o
e `
onia d’un objec e. La no ma consis eix en assigna un objec e al g up amb la
p obabili a condicional m´
es al a (la no ma de Bayes). Pe exemple, si hi ha G
g ups, la no ma de Bayes assigna `
a el nou objec e amb mesu es xal g up ique
compleixi que P(i|x)>P(j|x),pe ∀j6=i,j,i∈G(2.7)
Pe an , el que necessi em sabe ´
es la p obabili a P(i|x)que un objec e pe anyi
al g up idonades un conjun de mesu es x. Malau adamen aques a p obabili a
´
es di ´
ıcil d’ob eni . El que s´
ı que podem ob eni ´
es P(x|i), i g `
acies al eo ema de
Bayes les podem elaciona :
P(i|x) = P(x|i)P(i)
∑j∈GP(x|j)P(j)(2.8)
a on P(j)´
es la p obabili a del g up jconeguda sense e cap ipus de mesu a. A
la p `
ac ica podem assumi que ´
es igual pe o s els g ups o ponde a -la pel nomb e
de mos es de cada g up.
Si apliquem l’equaci´
o (2.8) al nos e c i e i (2.7) ob enim que assigna em l’ob-
jec e al g up isemp e i quan:
P(x|i)P(i)
∑k∈GP(x|k)P(k)>P(x|j)P(j)
∑k∈GP(x|k)P(k),pe ∀j6=i(2.9)
com que el nume ado i el denominado s´
on iguals ens queda
di(x) = P(x|i)P(i)>P(x|j)P(j) = dj(x),pe ∀j6=i(2.10)
34

Si enim mol es dades i mol es classes, el c`
alcul de P(x|i)P(i)´
es complica .
Pe aix`
o assumim que les nos es dades p o enen d’una dis ibuci´
o no mal mul i-
a ian :
P(x|i) = 1
(2π)2|ˆ
Σi|1
2exp−1
2(x−µi)Tˆ
Σ−1
i(x−µi)(2.11)
a on µi´
es la mi jana del g up iiˆ
Σi´
es la ma iu es imada de co a i`
ancies pel g up i.
Si assumim que la a i`
ancia ´
es la ma eixa pe o s els g ups i si subs i u¨
ım (2.11
a (2.10) ob enim:
dj(y) = ˆµ′jˆ
Σ−1y−1
2ˆµ′jˆ
Σ−1ˆµj+ln{p(j| )}(2.12)
a on y´
es un ec o de l’espai de la m´
es g an componen p incipal. Pe al de pode
e i a ma ius de co a i`
ancies mol p ope es a la singula i a , es eali za una an`
alisi
de componen s p incipals de la ma iu de co elacions a cada node. Les uncions
disc iminan s lineals es calculen a pa i d’aquelles componen s que enen alo s
p opis que excedeixen β egades el alo p opi m´
es g an (a on 0 <β<1); ˆµj´
es
el ec o de la mi jana mos al de la classe jiˆ
Σ´
es l’es imaci´
o combinada de la
ma iu de co a i`
ancies al node.
2.2.4 Resul a s Ques
Pe u ili za aques algo i me no cal c ea un g up edu¨
ı pe alida les dades, com
eia el C5.0, ja que u ili za la alidaci´
o c euada V- old que consis eix en di idi
les dades en V subconjun s d’apoximadamen el ma eix amany. S’es udia l’algo-
i me V egades, a on pe cada i e aci´
o es deixa un subconjun o a de les dades
d’en enamen pe calcula m´
es a d l’e o .
Tal i com s’ha e pe l’algo i me C5.0 s’han c ea a b es pa in de di e en
nomb e de a iables. Els es p ime s esul a s que es p esen en co esponen als
es conjun s inicials de a iables amb una sola a iable de selecci´
o en els nodes
que s´
on: amb o es les a iables a la p`
agina 35, sense co elacions a la p`
agina 47
i a l’espai de les componen s p incipals de la ma iu de co elacions a la 53. En
can i els es ´
ul ims co esponen als ma eixos conjun s de a iables inicials pe `
o
amb nodes mul i a ian s: amb o es les a iables a 59, sense co elacions a la 66 i
a l’espai de les componen s p incipals a la 70.
Un esum de o s els esul a s es po oba a la secci´
o 2.3.
Resul a s Ques amb o es les a iables
To segui es mos a la so ida del p og ama quan s’ha pa i de o es les 62 a ia-
bles.
@@@
@ @
@ @
@ @ U U Eee Sss TTTTT
@ @ Q Q Q Q Q
35
@ Q @ Q Q Eee Sss Q
@ Q@ Q Q Q Q Q
@@@ Q QUUQ Eee Sss Q
Classi ica ion ee p og am: QUEST e sion 1.9.2
Copy igh (c) 1997-2005, by Shih, Yu-Shan
This e sion was upda ed on: June 23, 2005
Please send commen s, ques ions, o bug epo s o
[email p o ec ed]
This job was s a ed on: 01/21/2009 a : 12:27
P1Va iable desc ip ion ile: namesques . x
Lea ning sample ile: DadesAmbComa. x
Code o missing alues: ?
Va iables in da a ile a e
( a iable ypes a e d=dependen , n=nume ical,
c=ca ego ical, = equency, x=excluded):
Column # Va iable name Va iable ype
1 F1Co Ob_FF n
2 F1Co Ob_TH n
3 F1Co Ob_SI n
4 F1Co Ob_TH n
5 F1Co Ob_Po n
6 F1Co Ob_Le n
7 F1Co Ta_FF n
8 F1Co Ta_TH n
9 F1Co Ta_SI n
10 F1Co Ta_TH n
11 F1Co Ta_Po n
12 F1Co Ta_Le n
13 F2Co Ob_FF n
14 F2Co Ob_TH n
15 F2Co Ob_SI n
16 F2Co Ob_TH n
17 F2Co Ob_Po n
18 F2Co Ta_FF n
19 F2Co Ta_TH n
20 F2Co Ta_SI n
21 F2Co Ta_TH n
22 F2Co Ta_Po n
23 F3Co Ob_FF n
24 F3Co Ob_TH n
25 F3Co Ob_SI n
26 F3Co Ob_TH n
27 F3Co Ob_Po n
28 F3Co Ta_FF n
29 F3Co Ta_TH n
30 F3Co Ta_SI n
31 F3Co Ta_TH n
32 F3Co Ta_Po n
33 F4Co Ob_FF n
36
34 F4Co Ob_TH n
35 F4Co Ob_SI n
36 F4Co Ob_TH n
37 F4Co Ob_Po n
38 F4Co Ta_FF n
39 F4Co Ta_TH n
40 F4Co Ta_SI n
41 F4Co Ta_TH n
42 F4Co Ta_Po n
43 F2AudOb_FF n
44 F2AudOb_TH n
45 F2AudOb_SI n
46 F2AudOb_TH n
47 F2AudOb_Po n
48 F2AudTa_FF n
49 F2AudTa_TH n
50 F2AudTa_SI n
51 F2AudTa_TH n
52 F2AudTa_Po n
53 F3AudOb_FF n
54 F3AudOb_TH n
55 F3AudOb_SI n
56 F3AudOb_TH n
57 F3AudOb_Po n
58 F3AudTa_FF n
59 F3AudTa_TH n
60 F3AudTa_SI n
61 F3AudTa_TH n
62 F3AudTa_Po n
63 So oll d
P2Numbe o cases in da a ile: 107
Numbe o lea ning samples: 107
Cases wi h missing alues among
hose wi h non-missing dependen a iable: 0
Pe cen age o missing alues: 0.00%
Numbe o nume ical a iables: 62
Numbe o ca ego ical a iables: 0
P3Summa y o nume ical a iable: F1Co Ob_FF
Size Obs Min Max Mean Sd
107 107 0.768E+00 0.203E+02 0.311E+01 0.550E+01
Summa y o nume ical a iable: F1Co Ob_THD
Size Obs Min Max Mean Sd
107 107 0.250E-04 0.295E+01 0.156E+01 0.681E+00
Summa y o nume ical a iable: F1Co Ob_SINAD
Size Obs Min Max Mean Sd
107 107 -0.136E+01 0.378E+00 -0.367E+00 0.330E+00
Summa y o nume ical a iable: F1Co Ob_THDN
37
Size Obs Min Max Mean Sd
107 107 0.957E+00 0.117E+01 0.104E+01 0.398E-01
Summa y o nume ical a iable: F1Co Ob_Powe
Size Obs Min Max Mean Sd
107 107 0.148E-01 0.607E-01 0.229E-01 0.105E-01
Summa y o nume ical a iable: F1Co Ob_Leng h
Size Obs Min Max Mean Sd
107 107 0.156E+05 0.452E+05 0.347E+05 0.610E+04
Summa y o nume ical a iable: F1Co Ta_FF
Size Obs Min Max Mean Sd
107 107 0.511E+00 0.249E+01 0.879E+00 0.320E+00
Summa y o nume ical a iable: F1Co Ta_THD
Size Obs Min Max Mean Sd
107 107 0.251E+00 0.180E+01 0.132E+01 0.332E+00
Summa y o nume ical a iable: F1Co Ta_SINAD
Size Obs Min Max Mean Sd
107 107 -0.128E+01 0.110E+01 -0.630E+00 0.427E+00
Summa y o nume ical a iable: F1Co Ta_THDN
Size Obs Min Max Mean Sd
107 107 0.881E+00 0.116E+01 0.108E+01 0.515E-01
Summa y o nume ical a iable: F1Co Ta_Powe
Size Obs Min Max Mean Sd
107 107 0.110E-01 0.290E-01 0.169E-01 0.400E-02
Summa y o nume ical a iable: F1Co Ta_Leng h
Size Obs Min Max Mean Sd
107 107 0.475E+05 0.603E+05 0.526E+05 0.308E+04
Summa y o nume ical a iable: F2Co Ob_FF
Size Obs Min Max Mean Sd
107 107 0.278E+02 0.306E+02 0.281E+02 0.414E+00
Summa y o nume ical a iable: F2Co Ob_THD
Size Obs Min Max Mean Sd
107 107 0.621E-04 0.215E-02 0.479E-03 0.457E-03
Summa y o nume ical a iable: F2Co Ob_SINAD
Size Obs Min Max Mean Sd
107 107 -0.403E-01 0.789E+00 0.320E+00 0.141E+00
Summa y o nume ical a iable: F2Co Ob_THDN
Size Obs Min Max Mean Sd
107 107 0.913E+00 0.100E+01 0.964E+00 0.156E-01
Summa y o nume ical a iable: F2Co Ob_Powe
Size Obs Min Max Mean Sd
107 107 0.784E-04 0.134E-02 0.477E-03 0.284E-03
38
**************************************************
Node 7: Te minal node assigned o Class 0
Class # cases
0 20
1 0
-------
20
**************************************************
Node 3: Te minal node assigned o Class 1
Class # cases
0 0
1 10
-------
10
P11
Classi ica ion ma ix based on lea ning sample
p edic ed class
ac ual class 0 1
0 62 5
1 0 40
Classi ica ion ma ix based on 10- old CV
p edic ed class
ac ual class 0 1
0 60 7
1 4 36
P12
Ps icks codes a e s o ed in ile: esul _To esDades. ex
elapsed ime: 0.50 seconds (use : 0.47, sys em: 0.03)
This job was comple ed on: 01/21/2009 a : 12:28
Pe al d’explica els esul a s, s’ha ma ca la so ida amb di e en s P pe sepa a
les di e en s seccions del esul a . El signi ica d’aques es P ´
es:
•P1: Aques pa `
ag a mos a la con igu aci´
o m´
es impo an , els noms dels
i xe s de dades i de desc ipci´
o, el s´
ımbol pels camps incomple s i inalmen
es llis en o es les a iables amb el ipus que s´
on.
•P2: S’indiquen el n´
ume o o al de casos, el n´
ume o de casos que enen alo s
incomple s en algunes a iables, el an pe cen d’aques s casos amb el o al
i el n´
ume o de a iables.
•P3: Aqu´
ı es mos a el esum es ad´
ıs ic pe cada a iable. Tamb´
e es po eu e
el alo dels p io s. En el nos e cas hem aga a els que enien pe de ec e
que ´
es el an pe cen de cada classe. Pe la classe 0 (no so ollosos) ´
es
65
95 =0.63 i el co esponen pe la classe 1.
•P4: En aques apa a podem oba di e en s alo s de la con igu aci´
o de
45

l’algo i me. En el nos e cas hem escolli que com a m´
ınim hi ha d’ha-
e 2 nodes, que la selecci´
o d’aques s ´
es uni a ian (com en el C5.0) sense
biaix amb una ce ca exhaus i a pe di idi les mos es u ili zan el a i de
e semblanc¸a.
•P5: Aqu´
ı s’indiquen el nomb e de SE u ili za pe e la poda, aques nomb e
con ola el amany de l’a b e poda . 0-SE indical’a b e amb l’e o es ima
de alidaci´
o c euada m´
es pe i . Tamb´
e hi obem el nomb e de eixos ( old)
de la alidaci´
o c euada.
•P6: Aques a aula mos a la seq¨
u`
encia dels suba b es poda s. A la e ce a
columna hi obem el alo de complexi a pe cada suba b e u ili zan . La
qua a columna d´
ona el cos de esubs i uci´
o (e o ) de cada suba b e.
•P7: La aula d’aques a secci´
o d´
ona el amany, el cos es ima de mala classi-
icaci´
o i el seu e o es `
anda d pe cada suba b e poda . La segona columna
mos a el nomb e de nodes e minals. La e ce a, la mi jana de l’e o co-
men a abans. I la qua a, d´
ona l’e o es `
anda d es ima . L’a b e ma ca amb
un as e isc (*) ´
es el que ´
e el alo m´
ınim es ima de cos de mala classi ica-
ci´
o (el que an e io men ha ´
ıem anomen a 0-SE). L’a b e ma ca amb (**)
´
es el que s’ha is a la secci´
o P6.
•P8: L’es uc u a de l’a b e de ini iu (el ma ca amb **). El node a el ´
e
semp e l’e ique a 1. El nomb e o al de nodes i de nodes e minals amb´
e
apa eix.
•P9: L’es uc u a de l’a b e en un o ma adequa pe se impo a en pog a-
mes ipus allCLEAR.
•P10: Aqu´
ı obem de alls de la di isi´
o, esum de les classes pe cada node, i
l’assignaci´
o del node. Podem eu e la on e a en e els casos i la decisi´
o.
•P11: Les ma ius de classi icaci´
o basades en la mos a d’ap enen a ges s´
on
epo ades aqu´
ı.
•P12: Finalmen obem el nom del i xe en o ma ps icks a on hi ha l’a b e
i el emps que ha a da en p ocessa .
A la igu a 2.2 hi ha la ep esen aci´
o g `
a ica de l’a b e ob ingu . El alo a so a
de cada node e minal ´
es la classe p edi a pe al node. El n´
ume o que apa eix al
cos a de cada node e minal indica el nomb e de mos es d’ap enen a ge de cada
classe u ili zades en el node. Les e ique es de les classes s´
on 0 pels no so ollosos
i 1 pels e o iso s so ollosos. La compa aci´
o pe e la sepa aci´
o pe cada node
in e mig apa eix al seu cos a .
Si compa em aques a b e amb l’ob ingu amb el C5.0 eiem que l’´
unica a-
iable que coincideix ´
es la F1Co Ta Leng h. La a iable F4Co Ta Powe ´
e una
46
F4Co Ta Po
≤0.1852E-03
F1Co Ta Le
≤0.5187E+05
34|0
0
F1Co Ta Le
≤0.5529E+05
F1Co Ob Po
≤0.3493E-01
5|30
1
8|0
0
20|0
0
0|10
1
Figu a 2.2: G `
a ic gene a amb ps icks de l’a b e uni a ian usan o es les dades
en Ques .
co elaci´
o de 0.59 amb F2Co Ta THD pe `
o les al es a iables no enen cap e-
laci´
o des acable. El e que no hi hagi gai e coincid`
encia en e els algo i mes ´
es
degu que el C5.0 u ili za el c i e i d’in o maci´
o pe selecciona les a iables i el
Ques u ili za el de disc iminan lineal.
Tamb´
e cal des aca que aques a b e d´
ona un e o de 5 casos en la mos a
d’en enamen i 11 (7+4) quan el e i ica amb la `
ecnica 10- old (V=10).
Resul a s Ques sense a iables al amen co elacionades
A a mos a em el esul a de l’a b e amb el g up edu¨
ı de a iables i el compa-
a em amb el esul a del Ques amb o es les a iables i amb el ma eix esul a
ob ingu amb el C5.0. Com que les dades s´
on les ma eixes que en el cas an e io ,
les seccions P2, P3, P4 i P5 s’han om`
es. Finalmen comen a que el esul a es po
eu e dibuixa a la Figu a 2.3.
@@@
@ @
@ @
@ @ U U Eee Sss TTTTT
@ @ Q Q Q Q Q
@ Q @ Q Q Eee Sss Q
@ Q@ Q Q Q Q Q
@@@ Q QUUQ Eee Sss Q
Classi ica ion ee p og am: QUEST e sion 1.9.2
Copy igh (c) 1997-2005, by Shih, Yu-Shan
47
This e sion was upda ed on: June 23, 2005
Please send commen s, ques ions, o bug epo s o
[email p o ec ed]
This job was s a ed on: 10/15/2009 a : 11:00
Va iable desc ip ion ile: Dad5Ques .names
Lea ning sample ile: Dad5.da a
P6sub ee # Te minal complexi y cu en
numbe nodes alue cos
1 7 0.0000 0.0000
2 5 0.0280 0.0561
3 4 0.0654 0.1215
4 2 0.0794 0.2804
5 1 0.0935 0.3738
P7Size and CV misclassi ica ion cos and SE o sub ees:
T ee #Tnodes Mean SE(Mean)
1** 7 0.1402 0.3356E-01
2 5 0.1776 0.3694E-01
3 4 0.2243 0.4032E-01
4 2 0.3271 0.4535E-01
5 1 0.3738 0.4677E-01
CART 0-SE ee is ma ked wi h *
CART SE- ule using CART SE is ma ked wi h **
The * and ** ees a e he same
P8Following ee is based on **
S uc u e o inal ee
Node Le node Righ node Spli a iable P edic ed class
1 2 3 F4Co Ta_Powe
2 4 5 F1Co Ta_Leng h
4 * e minal node * 0
5 6 7 F1Co Ta_Leng h
6 8 9 F3Co Ob_THDN
8 * e minal node * 0
9 10 11 F4Co Ob_THD
10 * e minal node * 1
11 12 13 F4Co Ob_THDN
12 * e minal node * 1
13 * e minal node * 0
7 * e minal node * 0
3 * e minal node * 1
48
Numbe o e minal nodes o inal ee = 7
To al numbe o nodes o inal ee = 13
P9Classi ica ion ee:
Node 1: F4Co Ta_Powe <= 0.1852E-03
Node 2: F1Co Ta_Leng h <= 0.5187E+05
Node 4: 0
Node 2: F1Co Ta_Leng h > 0.5187E+05
Node 5: F1Co Ta_Leng h <= 0.5529E+05
Node 6: F3Co Ob_THDN <= 0.9682
Node 8: 0
Node 6: F3Co Ob_THDN > 0.9682
Node 9: F4Co Ob_THD <= 0.4499
Node 10: 1
Node 9: F4Co Ob_THD > 0.4499
Node 11: F4Co Ob_THDN <= 0.9925
Node 12: 1
Node 11: F4Co Ob_THDN > 0.9925
Node 13: 0
Node 5: F1Co Ta_Leng h > 0.5529E+05
Node 7: 0
Node 1: F4Co Ta_Powe > 0.1852E-03
Node 3: 1
P10
In o ma ion o each node:
**************************************************
Node 1: In e media e node
A case goes in o Node 2 i i s alue o F4Co Ta_Powe <= 1.8519000E-04
Class # cases Mean o F4Co Ta_Powe
0 67 0.10601E-03
1 40 0.22714E-03
--------
107
**************************************************
Node 2: In e media e node
A case goes in o Node 4 i i s alue o F1Co Ta_Leng h <= 51872.00
Class # cases Mean o F1Co Ta_Leng h
0 67 52420.
1 30 53182.
--------
97
**************************************************
Node 4: Te minal node assigned o Class 0
Class # cases
0 34
1 0
-------
34
**************************************************
49
Node 5: In e media e node
A case goes in o Node 6 i i s alue o F1Co Ta_Leng h <= 55293.50
Class # cases Mean o F1Co Ta_Leng h
0 33 55847.
1 30 53182.
--------
63
**************************************************
Node 6: In e media e node
A case goes in o Node 8 i i s alue o F3Co Ob_THDN <= 0.9681643
Class # cases Mean o F3Co Ob_THDN
0 13 0.96953
1 30 0.98274
--------
43
**************************************************
Node 8: Te minal node assigned o Class 0
Class # cases
0 7
1 0
-------
7
**************************************************
Node 9: In e media e node
A case goes in o Node 10 i i s alue o F4Co Ob_THD <= 0.4498705
Class # cases Mean o F4Co Ob_THD
0 6 0.63212
1 30 0.30204
--------
36
**************************************************
Node 10: Te minal node assigned o Class 1
Class # cases
0 0
1 25
-------
25
**************************************************
Node 11: In e media e node
A case goes in o Node 12 i i s alue o F4Co Ob_THDN <= 0.9924926
Class # cases Mean o F4Co Ob_THDN
0 6 1.0007
1 5 0.98239
--------
11
**************************************************
Node 12: Te minal node assigned o Class 1
Class # cases
0 0
1 5
50

-------
5
**************************************************
Node 13: Te minal node assigned o Class 0
Class # cases
0 6
1 0
-------
6
**************************************************
Node 7: Te minal node assigned o Class 0
Class # cases
0 20
1 0
-------
20
**************************************************
Node 3: Te minal node assigned o Class 1
Class # cases
0 0
1 10
-------
10
P11
Classi ica ion ma ix based on lea ning sample
p edic ed class
ac ual class 0 1
0 67 0
1 0 40
Classi ica ion ma ix based on 10- old CV
p edic ed class
ac ual class 0 1
0 62 5
1 10 30
P12
Ps icks codes a e s o ed in ile: esul Dad5. ex
elapsed ime: 0.20 seconds (use : 0.16, sys em: 0.05)
This job was comple ed on: 10/15/2009 a : 20:02
El p ime e que so p `
en ´
es que el e de edui a iables ha e que inguem
un a b e amb m´
es a iables, enim les a iables F4Co Ta Powe i F1Co Ta Leng h
que coincideix en els dos casos, pe `
o en aques segon cas no hi apa eix la a iable
F1Co Ob Powe ja que ha ia es a eliminada pe `
o que es `
a co elacionada amb
F3Co Ob THDN amb un -0.612.
En aques cas l’a b e no ha dona cap e o en la seq¨
u`
encia d’en enamen ,
pe `
o quan ha u ili za la comp o aci´
o 10- old ha dona ins a 15 e o s, m´
es que en
l’a b e an e io .
51
F4Co Ta Po
≤0.1852E-03
F1Co Ta Le
≤0.5187E+05
34|0
0
F1Co Ta Le
≤0.5529E+05
F3Co Ob TH
≤0.9682
7|0
0
F4Co Ob TH
≤0.4499
0|25
1
F4Co Ob TH
≤0.9925
0|5
1
6|0
0
20|0
0
0|10
1
Figu a 2.3: G `
a ic gene a amb ps icks de l’a b e uni a ian usan el conjun que
no ´
e a iables al amen co elacionades en Ques .
52
Resul a s Ques a l’espai PCA
Finalmen , l’´
ul im cas uni a ian del Ques amb el conjun de a iables a l’espai
de les componen s p incipals. Tal com s’ha e an e io men , p ime es mos a el
llis a de so ida i una g `
a ica a 2.4 amb l’a b e ob ingu .
@@@
@ @
@ @
@ @ U U Eee Sss TTTTT
@ @ Q Q Q Q Q
@ Q @ Q Q Eee Sss Q
@ Q@ Q Q Q Q Q
@@@ Q QUUQ Eee Sss Q
Classi ica ion ee p og am: QUEST e sion 1.9.2
Copy igh (c) 1997-2005, by Shih, Yu-Shan
This e sion was upda ed on: June 23, 2005
Please send commen s, ques ions, o bug epo s o
[email p o ec ed]
This job was s a ed on: 06/23/2010 a : 15:39
Va iable desc ip ion ile: Y2_DadesNouEspaiPCA_Ques .names
Lea ning sample ile: Y2_DadesNouEspaiPCA.da a
Code o missing alues: ?
Va iables in da a ile a e
( a iable ypes a e d=dependen , n=nume ical,
c=ca ego ical, = equency, x=excluded):
Column # Va iable name Va iable ype
1 Va 1 n
2 Va 2 n
3 Va 3 n
4 Va 4 n
5 Va 5 n
6 Va 6 n
7 Va 7 n
8 Va 8 n
9 Va 9 n
10 Va 10 n
11 Va 11 n
12 Va 12 n
13 Va 13 n
14 Va 14 n
15 Va 15 n
16 Va 16 n
17 So oll d
Numbe o cases in da a ile: 107
Numbe o lea ning samples: 107
Cases wi h missing alues among
hose wi h non-missing dependen a iable: 0
Pe cen age o missing alues: 0.00%
Numbe o nume ical a iables: 16
53
Numbe o ca ego ical a iables: 0
Summa y o nume ical a iable: Va 1
Size Obs Min Max Mean Sd
107 107 -0.285E+04 0.499E+04 0.266E+04 0.155E+04
Summa y o nume ical a iable: Va 2
Size Obs Min Max Mean Sd
107 107 -0.100E+05 -0.556E+04 -0.808E+04 0.921E+03
Summa y o nume ical a iable: Va 3
Size Obs Min Max Mean Sd
107 107 -0.230E+05 -0.186E+05 -0.202E+05 0.116E+04
Summa y o nume ical a iable: Va 4
Size Obs Min Max Mean Sd
107 107 0.647E+04 0.959E+04 0.807E+04 0.642E+03
Summa y o nume ical a iable: Va 5
Size Obs Min Max Mean Sd
107 107 0.377E+04 0.505E+04 0.426E+04 0.269E+03
Summa y o nume ical a iable: Va 6
Size Obs Min Max Mean Sd
107 107 -0.306E+04 -0.129E+04 -0.183E+04 0.315E+03
Summa y o nume ical a iable: Va 7
Size Obs Min Max Mean Sd
107 107 -0.461E+04 -0.268E+04 -0.375E+04 0.393E+03
Summa y o nume ical a iable: Va 8
Size Obs Min Max Mean Sd
107 107 0.167E+04 0.450E+04 0.255E+04 0.502E+03
Summa y o nume ical a iable: Va 9
Size Obs Min Max Mean Sd
107 107 -0.477E+04 -0.282E+04 -0.390E+04 0.399E+03
Summa y o nume ical a iable: Va 10
Size Obs Min Max Mean Sd
107 107 -0.415E+04 -0.295E+04 -0.357E+04 0.263E+03
Summa y o nume ical a iable: Va 11
Size Obs Min Max Mean Sd
107 107 -0.316E+04 -0.106E+04 -0.172E+04 0.362E+03
Summa y o nume ical a iable: Va 12
Size Obs Min Max Mean Sd
107 107 0.817E+04 0.105E+05 0.913E+04 0.545E+03
Summa y o nume ical a iable: Va 13
Size Obs Min Max Mean Sd
107 107 -0.238E+04 -0.894E+03 -0.180E+04 0.285E+03
54
4 1 0.3738 0.4677E-01
CART 0-SE ee is ma ked wi h *
CART SE- ule using CART SE is ma ked wi h **
The * and ** ees a e he same
P8
Following ee is based on **
S uc u e o inal ee
Node Le node Righ node Spli a iable P edic ed class
1 2 3 linea
2 4 5 linea
4 * e minal node * 0
5 * e minal node * 1
3 6 7 linea
6 * e minal node * 0
7 * e minal node * 1
Numbe o e minal nodes o inal ee = 4
To al numbe o nodes o inal ee = 7
P9
Classi ica ion ee:
Node 1: linea combina ion <= -12.49
Node 2: linea combina ion <= -7.917
Node 4: 0
Node 2: linea combina ion > -7.917
Node 5: 1
Node 1: linea combina ion > -12.49
Node 3: linea combina ion <= 33.99
Node 6: 0
Node 3: linea combina ion > 33.99
Node 7: 1
P10
In o ma ion o each node:
**************************************************
Node 1: In e media e node
A case goes in o Node 2 i a linea combina ion o a iables <=
-12.48805
Class # cases
0 67
1 40
-------
107
The coe icien s in he linea combina ion a e:
Va iable Coe icien
F1Co Ob_FF -0.3541E-02
61

F1Co Ob_THD -0.5572E-01
F1Co Ob_SINAD 0.1354
F1Co Ob_THDN 0.4792
F1Co Ob_Powe -3.109
F1Co Ob_Leng h 0.4828E-05
F1Co Ta_FF 0.4670E-01
F1Co Ta_THD 0.8791E-01
F1Co Ta_SINAD -1.683
F1Co Ta_THDN -14.32
F1Co Ta_Powe -4.985
F1Co Ta_Leng h 0.1156E-04
F2Co Ob_FF 0.9414E-03
F2Co Ob_THD 0.8642
F2Co Ob_SINAD 0.1114
F2Co Ob_THDN 0.2741
F2Co Ob_Powe -0.6022
F2Co Ta_FF 0.4651E-02
F2Co Ta_THD 4.162
F2Co Ta_SINAD 0.1569
F2Co Ta_THDN 0.2170
F2Co Ta_Powe 0.4756E-02
F3Co Ob_FF -0.7694E-02
F3Co Ob_THD 8.789
F3Co Ob_SINAD -0.9304E-02
F3Co Ob_THDN -0.6416E-01
F3Co Ob_Powe -0.2426
F3Co Ta_FF 0.1274E-02
F3Co Ta_THD 0.4396
F3Co Ta_SINAD 0.6953E-01
F3Co Ta_THDN 0.1029E-01
F3Co Ta_Powe 0.7043E-02
F4Co Ob_FF -0.1079E-02
F4Co Ob_THD -0.2486
F4Co Ob_SINAD 0.3030
F4Co Ob_THDN -0.1224
F4Co Ob_Powe -0.1057
F4Co Ta_FF 0.7255E-04
F4Co Ta_THD 0.2526E-02
F4Co Ta_SINAD 0.1051
F4Co Ta_THDN 0.3263
F4Co Ta_Powe 0.1241
F2AudOb_FF 0.3214E-03
F2AudOb_THD 0.1567
F2AudOb_SINAD -0.7115E-01
F2AudOb_THDN 0.1584
F2AudOb_Powe -2.221
F2AudTa_FF 0.1410E-03
F2AudTa_THD 0.1812
F2AudTa_SINAD 0.2126E-01
F2AudTa_THDN 0.4525E-01
F2AudTa_Powe -6.889
F3AudOb_FF -0.1285E-03
F3AudOb_THD -0.1224
F3AudOb_SINAD 0.3922
62
F3AudOb_THDN -0.7714E-02
F3AudOb_Powe 2.823
F3AudTa_FF 0.9035E-04
F3AudTa_THD 0.2235
F3AudTa_SINAD 0.4208E-01
F3AudTa_THDN 0.1643E-02
F3AudTa_Powe 9.839
**************************************************
Node 2: In e media e node
A case goes in o Node 4 i a linea combina ion o a iables <=
-7.916549
Class # cases
0 65
1 1
-------
66
The coe icien s in he linea combina ion a e:
Va iable Coe icien
F1Co Ob_FF 0.3764E-03
F1Co Ob_THD 0.3512E-01
F1Co Ob_SINAD 0.3809E-01
F1Co Ob_THDN -0.4701E-01
F1Co Ob_Powe 10.87
F1Co Ob_Leng h 0.6318E-05
F1Co Ta_FF -0.1018
F1Co Ta_THD -0.3026E-01
F1Co Ta_SINAD 0.4236
F1Co Ta_THDN 3.258
F1Co Ta_Powe 29.73
F1Co Ta_Leng h -0.5201E-04
F2Co Ob_FF -0.2243
F2Co Ob_THD 0.8966
F2Co Ob_SINAD -0.3777
F2Co Ob_THDN 1.564
F2Co Ob_Powe 0.5700E-01
F2Co Ta_FF -0.2342E-01
F2Co Ta_THD 6.103
F2Co Ta_SINAD -0.2793
F2Co Ta_THDN 0.8291E-03
F2Co Ta_Powe 0.4992E-02
F3Co Ob_FF -0.9600E-01
F3Co Ob_THD 14.86
F3Co Ob_SINAD 1.058
F3Co Ob_THDN 0.3710
F3Co Ob_Powe 0.9706E-01
F3Co Ta_FF -0.5109E-02
F3Co Ta_THD 2.957
F3Co Ta_SINAD 0.5265E-01
F3Co Ta_THDN 0.6992
F3Co Ta_Powe -0.1076E-01
F4Co Ob_FF -0.6868E-03
F4Co Ob_THD -0.1189
63
F4Co Ob_SINAD 0.4672E-01
F4Co Ob_THDN -0.2412
F4Co Ob_Powe 0.3366E-01
F4Co Ta_FF -0.6322E-03
F4Co Ta_THD -0.1595
F4Co Ta_SINAD 0.1008
F4Co Ta_THDN -0.9045
F4Co Ta_Powe 0.6992
F2AudOb_FF -0.2105E-03
F2AudOb_THD -0.8418
F2AudOb_SINAD -0.1152
F2AudOb_THDN 0.7518
F2AudOb_Powe -2.048
F2AudTa_FF 0.2212E-03
F2AudTa_THD -0.9253E-01
F2AudTa_SINAD -0.1312
F2AudTa_THDN 0.1563
F2AudTa_Powe 5.824
F3AudOb_FF 0.2585E-03
F3AudOb_THD 0.2072
F3AudOb_SINAD 0.1163
F3AudOb_THDN -0.1007
F3AudOb_Powe 9.419
F3AudTa_FF -0.1080E-03
F3AudTa_THD -0.2264
F3AudTa_SINAD -0.2549
F3AudTa_THDN 0.9909E-01
F3AudTa_Powe -6.913
**************************************************
Node 4: Te minal node assigned o Class 0
Class # cases
0 65
1 0
-------
65
**************************************************
Node 5: Te minal node assigned o Class 1
Class # cases
0 0
1 1
-------
1
**************************************************
Node 3: In e media e node
A case goes in o Node 6 i a linea combina ion o a iables <=
33.98564
Class # cases
0 2
1 39
-------
41
The coe icien s in he linea combina ion a e:
64
Va iable Coe icien
F1Co Ob_FF -0.3813
F1Co Ob_THD 0.1517E-02
F1Co Ob_SINAD -0.2698
F1Co Ob_THDN -5.017
F1Co Ob_Powe 11.51
F1Co Ob_Leng h 0.5604E-04
F1Co Ta_FF 2.834
F1Co Ta_THD 0.8841
F1Co Ta_SINAD 2.347
F1Co Ta_THDN 5.516
F1Co Ta_Powe 22.85
F1Co Ta_Leng h -0.5099E-04
F2Co Ob_FF 0.3321
F2Co Ob_THD 1.312
F2Co Ob_SINAD 4.433
F2Co Ob_THDN -0.4422
F2Co Ob_Powe 0.8799
F2Co Ta_FF -0.8286E-01
F2Co Ta_THD -28.74
F2Co Ta_SINAD -0.4877E-01
F2Co Ta_THDN -1.364
F2Co Ta_Powe -0.5338E-02
F3Co Ob_FF 0.4133
F3Co Ob_THD -6.533
F3Co Ob_SINAD -1.265
F3Co Ob_THDN 0.3482E-01
F3Co Ob_Powe 0.3715
F3Co Ta_FF 0.3091E-02
F3Co Ta_THD 18.78
F3Co Ta_SINAD 0.8468
F3Co Ta_THDN -0.1740
F3Co Ta_Powe -0.9730E-04
F4Co Ob_FF 0.4890E-02
F4Co Ob_THD 0.3073
F4Co Ob_SINAD 0.5823
F4Co Ob_THDN -0.5838E-01
F4Co Ob_Powe 0.3476
F4Co Ta_FF 0.1569E-02
F4Co Ta_THD 4.059
F4Co Ta_SINAD -0.3171
F4Co Ta_THDN -1.309
F4Co Ta_Powe -1.222
F2AudOb_FF 0.8671E-03
F2AudOb_THD -0.7240
F2AudOb_SINAD 0.2936
F2AudOb_THDN 2.239
F2AudOb_Powe 7.383
F2AudTa_FF -0.1445E-03
F2AudTa_THD 0.8114
F2AudTa_SINAD 0.2104
F2AudTa_THDN 0.1903
F2AudTa_Powe 3.843
F3AudOb_FF -0.6902E-05
65
F3AudOb_THD 0.4359
F3AudOb_SINAD -0.2127
F3AudOb_THDN 0.9709
F3AudOb_Powe -9.386
F3AudTa_FF 0.6890E-03
F3AudTa_THD -0.4876
F3AudTa_SINAD -1.200
F3AudTa_THDN 0.1175
F3AudTa_Powe -5.192
**************************************************
Node 6: Te minal node assigned o Class 0
Class # cases
0 2
1 0
-------
2
**************************************************
Node 7: Te minal node assigned o Class 1
Class # cases
0 0
1 39
-------
39
P11
Classi ica ion ma ix based on lea ning sample
p edic ed class
ac ual class 0 1
0 67 0
1 0 40
Classi ica ion ma ix based on 10- old CV
p edic ed class
ac ual class 0 1
0 55 12
1 13 27
P12
Ps icks codes a e s o ed in ile: esul _To esDades_Lin. ex
elapsed ime: 0.38 seconds (use : 0.34, sys em: 0.03)
This job was comple ed on: 01/21/2009 a : 12:31
A di e `
encia del cas uni a ian , aqu´
ı la decisi´
o als nodes ´
es una combinaci´
o
lineal de o es les a iables. Tamb´
e cal des aca que no ´
e cap e o en l’en ena-
men pe `
o que ha e (12+13) en les comp o acions 10- old. Mol pi jo que o s
els al es casos uni a ian s.
Resul a s Ques mul i a ian sense a iables al amen co elacionades
En aques apa a comp o a em el esul a del Ques mul i a ian quan s’han e
les a iables al amen co elacionades.
66

linea
≤-18.32
59|0
0
1|35
1
Figu a 2.5: G `
a ic gene a amb ps icks de l’a b e mul i a ian usan Ques i o es
les a iables.
@@@
@ @
@ @
@ @ U U Eee Sss TTTTT
@ @ Q Q Q Q Q
@ Q @ Q Q Eee Sss Q
@ Q@ Q Q Q Q Q
@@@ Q QUUQ Eee Sss Q
Classi ica ion ee p og am: QUEST e sion 1.9.2
Copy igh (c) 1997-2005, by Shih, Yu-Shan
This e sion was upda ed on: June 23, 2005
Please send commen s, ques ions, o bug epo s o
[email p o ec ed]
This job was s a ed on: 10/15/2009 a : 11:09
Va iable desc ip ion ile: Dad5Ques .names
Lea ning sample ile: Dad5.da a
minimal node size: 5
use linea spli
spli poin me hod: exhaus i e sea ch
use likelihood a io Gˆ2
P5use 10- old CV sample p uning
SE- ule ees based on numbe o SEs = 1.00
P6sub ee # Te minal complexi y cu en
numbe nodes alue cos
1 4 0.0000 0.0187
2 3 0.0280 0.0467
3 2 0.0561 0.1028
4 1 0.2710 0.3738
P7Size and CV misclassi ica ion cos and SE o sub ees:
T ee #Tnodes Mean SE(Mean)
67
1 4 0.2523 0.4199E-01
2* 3 0.2243 0.4032E-01
3** 2 0.2523 0.4199E-01
4 1 0.3738 0.4677E-01
CART 0-SE ee is ma ked wi h *
CART SE- ule using CART SE is ma ked wi h **
P8Following ee is based on **
S uc u e o inal ee
Node Le node Righ node Spli a iable P edic ed class
1 2 3 linea
2 * e minal node * 0
3 * e minal node * 1
Numbe o e minal nodes o inal ee = 2
To al numbe o nodes o inal ee = 3
P9Classi ica ion ee:
Node 1: linea combina ion <= -7.689
Node 2: 0
Node 1: linea combina ion > -7.689
Node 3: 1
P10
In o ma ion o each node:
**************************************************
Node 1: In e media e node
A case goes in o Node 2 i a linea combina ion o a iables <=
-7.688888
Class # cases
0 67
1 40
-------
107
The coe icien s in he linea combina ion a e:
Va iable Coe icien
F1Co Ta_THD 0.1485
F1Co Ta_THDN -0.5367
F1Co Ta_Leng h -0.3323E-06
F2Co Ta_THDN 0.5979
F3Co Ob_FF -0.7113E-01
F3Co Ob_THD 18.26
F3Co Ob_THDN -1.874
F3Co Ta_FF 0.1088E-02
F3Co Ta_THDN 0.9792
68
F3Co Ta_Powe 0.7748E-03
F4Co Ob_THD -0.9187E-01
F4Co Ob_THDN -5.219
F4Co Ob_Powe -0.4346
F4Co Ta_THD -0.1042
F4Co Ta_THDN 0.2374
F4Co Ta_Powe 0.7898
F2AudOb_FF 0.2815E-03
F2AudOb_THD -0.2319E-01
F2AudOb_THDN 1.009
F2AudTa_FF 0.1254E-03
F2AudTa_THD 0.8200E-01
F2AudTa_THDN 2.445
F3AudOb_THD -0.8215E-01
F3AudOb_THDN -3.548
F3AudOb_Powe 0.9871E-03
F3AudTa_THDN 1.352
F3AudTa_Powe 0.1198E-01
**************************************************
Node 2: Te minal node assigned o Class 0
Class # cases
0 64
1 8
-------
72
**************************************************
Node 3: Te minal node assigned o Class 1
Class # cases
0 3
1 32
-------
35
P11
Classi ica ion ma ix based on lea ning sample
p edic ed class
ac ual class 0 1
0 64 3
1 8 32
Classi ica ion ma ix based on 10- old CV
p edic ed class
ac ual class 0 1
0 52 15
1 12 28
P12
Ps icks codes a e s o ed in ile: esul _Dad5_Lin. ex
elapsed ime: 0.16 seconds (use : 0.12, sys em: 0.03)
This job was comple ed on: 10/15/2009 a : 21:10
69
linea
≤-7.689
64|8
0
3|32
1
Figu a 2.6: G `
a ic gene a amb ps icks de l’a b e mul i a ian usan el conjun que
no ´
e a iables al amen co elacionades en Ques .
Aques a b e esul a que ´
e mol s m´
es e o s en la seq¨
u`
encia d’en enamen , 11
en o al (3+8), pe `
o pel que a a la comp o aci´
o 10- old no ´
es gai e m´
es p oblem`
a ic
que l’an e io , aques ´
e 27 e o s (15+12) men e que el p ime enia 25 (12+13).
Resul a s Ques mul i a ian a l’espai PCA
Finalmen en aques a secci´
o mos em l’´
ul im cas del Ques mul i a ian amb el
g up de a iables a l’espai PCA.
@@@
@ @
@ @
@ @ U U Eee Sss TTTTT
@ @ Q Q Q Q Q
@ Q @ Q Q Eee Sss Q
@ Q@ Q Q Q Q Q
@@@ Q QUUQ Eee Sss Q
Classi ica ion ee p og am: QUEST e sion 1.9.2
Copy igh (c) 1997-2005, by Shih, Yu-Shan
This e sion was upda ed on: June 23, 2005
Please send commen s, ques ions, o bug epo s o
[email p o ec ed]
This job was s a ed on: 06/23/2010 a : 15:42
Va iable desc ip ion ile: Y2_DadesNouEspaiPCA_Ques .names
Lea ning sample ile: Y2_DadesNouEspaiPCA.da a
Code o missing alues: ?
Va iables in da a ile a e
( a iable ypes a e d=dependen , n=nume ical,
c=ca ego ical, = equency, x=excluded):
Column # Va iable name Va iable ype
1 Va 1 n
2 Va 2 n
3 Va 3 n
4 Va 4 n
5 Va 5 n
70
Taula 3.1: Taula de dades dels pesos dels co xes.
Weigh Mos es Han alla P opo ion
2100 48 1 0.02083
2300 42 2 0.04762
2500 31 0 0.00000
2700 34 3 0.08824
2900 31 8 0.25806
3100 21 8 0.38095
3300 23 14 0.60870
3500 23 17 0.73913
3700 21 19 0.90476
3900 16 15 0.93750
4100 17 17 1.00000
4300 21 21 1.00000
indica + a la columna “Han alla ”). La ep esen aci´
o de la p opo ci´
o de co xes que
allen l’e ici`
encia ene g`
e ica segons el pes es oba a la Figu a 3.1.
Sembla aonable assumi que les e ades p o enen d’una dis ibuci´
o binomial
amb un pa `
ame e Pque augmen a amb el pes. Pe `
o com exac amen hau ia Pde
depend e del pes? P o em d’encaixa una ec a amb aques es dades i ob enim la
Figu a 3.2.
Hi ha dos p oblemes amb aques ajus amen . El p ime ´
es que la l´
ınia p e eu
p opo cions m´
es pe i es que ze o i m´
es g an que 1 que s´
on impossibles. El segon
´
es que les p opo cions no es an no malmen dis ibu¨
ıdes. Aix`
o iola una de les
assumpcions eque ides pe ajus a amb un model simple de eg essi´
o.
Podem p o a amb un polinomi d’o d e supe io ob enin la Figu a 3.3.
Pe `
o enim el p oblema que la p opo ci´
o comenc¸a a dec ´
eixe quan el pes es `
a
pe sob e dels 4000, i de e a iba ia a alo s nega ius pe pesos mol g ans. I
pe descomp a , segueix iolan el e que no es igui no malmen dis ibu¨
ıda. A a
mi em d’ajus a seguin un model lineal gene ali za amb la unci´
o d’enllac¸ logi ,
ob enin la Figu a 3.4.
Amb aques a i amen eiem que les p opo cions endeixen cap 0 pe pesos
pe i s i cap a 1 pe pesos mol g ans.
Pe pode e l’a i amen de l’exemple an e io , s’han de oba els pa `
ame es β
del model lineal gene ali za . Pe e -ho s’u ili za la eg essi´
o basada en la m`
axima
e semblanc¸a. Una demos aci´
o e`
o ica de com es an elaciona s la podeu oba al
cap´
ı ol 2 del llib e [7]. En aques es udi s’ha u ili za la unci´
oglm de Rque u ili za
un m`
e ode i e a iu de m´
ınims quad a s amb ec`
alcul dels pesos [8] pe oba les
es imacions m`
axim e semblan s del model.
El p oblema del m`
e ode MLGz ´
es que ´
es mol depenen del conjun inicial de
77

Figu a 3.1: Imp essi´
o dels pesos i la
p opo ci´
o/p obabili a . Figu a 3.2: Ap oximaci´
o amb un po-
linomi de p ime g au.
Figu a 3.3: Ap oximaci´
o amb un po-
linomi d’o d e supe io . Figu a 3.4: Ap oximaci´
o amb la un-
ci´
o logi .
a iables i de l’o d e que segueixes pe elimina -les. En el nos e cas enim 62
a iables que an una combina `
o ia in ac able, alesho es s’han u ili za di e en s
m`
e odes pe al d’escolli un subg up inicial d’aques conjun de 62 elemen s. A
pa i d’aques subconjun s’ha u ili za el alo de l’AIC oba a pa i de la unci´
o
glm del p og ama R pe sabe si un model e a millo que un al e i les a iables
s’han ana eliminan pe c i e is de signi ic`
ancia.
L’AIC, Akaike’s in o ma ion c i e ion, a se desen olupa pe Hi o suguAkaike
el 1971 i ´
es una mesu a de la bonda d’ajus amen d’un model es ad´
ıs ic. Es `
a ba-
sa en el concep e d’en opia, o e in una mesu a ela i a de la p`
e dua d’in o maci´
o
quan un model dona ´
es u ili za pe desc iu e la eali a i amb´
e po se desc i com
el comp om´
ıs en e el biaix i la a i`
ancia en la cons ucci´
o de models, o de o ma
m´
es `
amplia en e la p ecisi´
o i la complexi a del model. De o ma gene al l’AIC es
de ineix com: AIC =2k−2ln(L)(3.8)
on k´
es el nomb e de pa `
ame es del model es ad´
ıs ic i L´
es el alo maximi za de
la e semblanc¸a del model es ima .
En les di e en s es a `
egies pe de e mina un conjun inicial, s’ha u ili za un
g up d’en enamen o ma pe 34 mos es so olloses i 57 de silencioses i un con-
jun de es o ma pe 10 mos es silencioses i 6 de so olloses. En les seg¨
uen s
seccions es desc iuen els esul a s ob ingu s pa in de sis es a `
egies di e en s:
78
1. Conjun sense les a iables al amen co elacionades (secci´
o 3.1 p`
ag. 79).
2. Conjun dels a b es de decisi´
o (secci´
o 3.2 p`
ag. 81).
3. Conjun sence u ili zan s epAIC (secci´
o 3.3 p`
ag. 83).
4. Conjun de les componen s p incipals (secci´
o 3.4 p`
ag. 85).
5. Conjun basa en les componen s p incipals no mali zades (secci´
o 3.5 p`
ag.
88).
6. Conjun basa en les componen s p incipals no mali zades usan s epAIC
(secci´
o 3.6 p`
ag. 89).
Com que hi ha mol s m`
e odes, pe al d’acla i o s els esul a s i eu e’ls conjun-
amen s’acaba el cap´
ı ol amb una aula esum dels di e en s esul a s. Aques a es
oba a la p`
agina 91.
3.1 Conjun sense a iables al amen co elacionades
En aques a secci´
o pa im del conjun de a iables ob ingu seguin el p ocedimen
de la p`
agina 19 que elimina a les a iables que es a en mol co elacionades, pe
al d’ob eni un model lineal gene ali za que ingui el m´
ınim AIC. El model o igi-
nal ´
e el seg¨
uen esul a :
> summa y(M5)
Call:
glm( o mula = So oll ˜ F1Co Ta_THD + F1Co Ta_THDN + F1Co Ta_Leng h +
F2Co Ta_THDN + F3Co Ob_FF + F3Co Ob_THD + F3Co Ob_THDN +
F3Co Ta_FF + F3Co Ta_THDN + F3Co Ta_Powe + F4Co Ob_THD +
F4Co Ob_THDN + F4Co Ob_Powe + F4Co Ta_THD + F4Co Ta_THDN +
F4Co Ta_Powe + F2AudOb_FF + F2AudOb_THD + F2AudOb_THDN +
F2AudTa_FF + F2AudTa_THD + F2AudTa_THDN + F3AudOb_THD + F3AudOb_THDN +
F3AudOb_Powe + F3AudTa_THDN + F3AudTa_Powe , amily = binomial(link = "logi "))
De iance Residuals:
Min 1Q Median 3Q Max
-3.280e-05 -2.107e-08 -2.107e-08 2.107e-08 3.702e-05
Coe icien s: Es ima e S d. E o z alue P (>|z|)
(In e cep ) 4.178e+03 1.557e+07 0.000268 1.000
F1Co Ta_THD 1.379e+02 8.508e+04 0.002 0.999
F1Co Ta_THDN -1.437e+02 4.180e+05 -0.000344 1.000
F1Co Ta_Leng h 9.801e-03 1.680e+01 0.001 1.000
F2Co Ta_THDN -1.527e+03 5.080e+06 -0.000301 1.000
F3Co Ob_FF -6.228e+01 9.278e+04 -0.001 0.999
F3Co Ob_THD 2.289e+04 3.167e+07 0.001 0.999
F3Co Ob_THDN -1.636e+03 4.502e+06 -0.000363 1.000
F3Co Ta_FF 4.889e+00 8.932e+03 0.001 1.000
F3Co Ta_THDN -5.356e+02 4.247e+06 -0.000126 1.000
79
F3Co Ta_Powe 9.814e+06 2.752e+10 0.000357 1.000
F4Co Ob_THD -1.593e+02 1.941e+05 -0.001 0.999
F4Co Ob_THDN -8.528e+03 5.050e+06 -0.002 0.999
F4Co Ob_Powe 2.707e+05 5.058e+08 0.001 1.000
F4Co Ta_THD -1.745e+02 3.562e+05 -0.000490 1.000
F4Co Ta_THDN 3.298e+03 5.494e+06 0.001 1.000
F4Co Ta_Powe 2.192e+05 3.289e+08 0.001 0.999
F2AudOb_FF 7.736e-01 7.927e+02 0.001 0.999
F2AudOb_THD 2.271e+05 3.047e+08 0.001 0.999
F2AudOb_THDN 3.165e+03 4.437e+06 0.001 0.999
F2AudTa_FF -1.878e-01 4.458e+02 -0.000421 1.000
F2AudTa_THD 4.541e+05 5.696e+08 0.001 0.999
F2AudTa_THDN 2.535e+03 5.680e+06 0.000446 1.000
F3AudOb_THD -1.524e+02 7.191e+05 -0.000212 1.000
F3AudOb_THDN -5.937e+03 6.969e+06 -0.001 0.999
F3AudOb_Powe 5.356e-01 3.077e+03 0.000174 1.000
F3AudTa_THDN 6.420e+03 2.223e+07 0.000289 1.000
F3AudTa_Powe -1.971e+01 6.592e+04 -0.000299 1.000
(Dispe sion pa ame e o binomial amily aken o be 1)
Null de iance: 1.2028e+02 on 90 deg ees o eedom
Residual de iance: 1.1607e-08 on 63 deg ees o eedom
AIC: 56
Numbe o Fishe Sco ing i e a ions: 25
Finalmen desp ´
es de di e ses i e acions aconseguim a iba al esul a :
summa y( glm( o mula = So oll ˜ F1Co Ta_THD + F2Co Ta_THDN + F3Co Ob_FF +
F3Co Ob_THD + F3Co Ta_Powe + F4Co Ob_THD + F4Co Ob_THDN +
F4Co Ob_Powe + F4Co Ta_THD + F4Co Ta_Powe + F2AudOb_FF + F2AudOb_THD +
F2AudOb_THDN, amily = binomial(link = "logi ")))
Call:
glm( o mula = So oll ˜ F1Co Ta_THD + F2Co Ta_THDN + F3Co Ob_FF +
F3Co Ob_THD + F3Co Ta_Powe + F4Co Ob_THD + F4Co Ob_THDN +
F4Co Ob_Powe + F4Co Ta_THD + F4Co Ta_Powe + F2AudOb_FF +
F2AudOb_THD + F2AudOb_THDN, amily = binomial(link = "logi "))
De iance Residuals:
Min 1Q Median 3Q Max
-6.056e-03 -2.107e-08 -2.107e-08 2.107e-08 6.762e-03
Coe icien s: Es ima e S d. E o z alue P (>|z|)
(In e cep ) 1.828e+05 8.665e+05 0.211 0.833
F1Co Ta_THD 3.431e+03 1.597e+04 0.215 0.830
F2Co Ta_THDN 3.908e+04 1.827e+05 0.214 0.831
F3Co Ob_FF -1.786e+03 8.317e+03 -0.215 0.830
F3Co Ob_THD 9.048e+05 4.222e+06 0.214 0.830
F3Co Ta_Powe 3.684e+08 1.719e+09 0.214 0.830
F4Co Ob_THD -3.708e+03 1.732e+04 -0.214 0.830
F4Co Ob_THDN -1.690e+05 7.915e+05 -0.214 0.831
F4Co Ob_Powe 7.577e+06 3.534e+07 0.214 0.830
80
F4Co Ta_THD -9.947e+05 4.602e+06 -0.216 0.829
F4Co Ta_Powe 2.334e+06 1.089e+07 0.214 0.830
F2AudOb_FF 2.174e+01 1.010e+02 0.215 0.830
F2AudOb_THD 7.450e+06 3.463e+07 0.215 0.830
F2AudOb_THDN 6.783e+03 3.884e+04 0.175 0.861
(Dispe sion pa ame e o binomial amily aken o be 1)
Null de iance: 1.2028e+02 on 90 deg ees o eedom
Residual de iance: 3.2022e-04 on 77 deg ees o eedom
AIC: 28.000
Numbe o Fishe Sco ing i e a ions: 25
Si implemen em aques algo i me ob enim els seg¨
uen s esul a s:
Taula 3.2: Taula d’e o s del conjun eliminan les a iables al amen co elaciona-
des.
E o s en enamen E o s es % E o
So Sil So Sil
0 9 1 5 14.01
3.2 Conjun inicial dels a b es de decisi´
o
Un conjun possible de a iables s´
on les que han u ili za els a b es de decisi´
o. En
aques cas hem ajun a les a iables ob ingudes del C5.0 amb o es les a iables
i del Ques uni a ian amb o es les a iables (aques a in o maci´
o es `
a ex e a del
cap´
ı ol dels a b es de decisi´
o, p`
ag. 22). I s’ha c ea el seg¨
uen model:
> summa y( glm( So oll ˜ F1Co Ta_Powe + F1Co Ta_Leng h + F1Co Ob_Powe + F2AudTa_FF
+ F2Co Ob_THD + F3Co Ta_Powe + F3AudTa_Powe + F4Co Ta_Powe + F4Co Ta_FF
+ F4Co Ob_FF, amily = binomial(link = "logi "))
Call:
glm( o mula = So oll ˜ F1Co Ta_Powe + F1Co Ta_Leng h + F1Co Ob_Powe +
F2AudTa_FF + F2Co Ob_THD + F3Co Ta_Powe + F3AudTa_Powe +
F4Co Ta_Powe + F4Co Ta_FF + F4Co Ob_FF, amily = binomial(link = "logi ")
De iance Residuals:
Min 1Q Median 3Q Max
-2.1218 -0.5265 -0.1430 0.4227 2.3784
Coe icien s: Es ima e S d. E o z alue P (>|z|)
(In e cep ) -4.179e+01 1.216e+01 -3.437 0.000589 ***
F1Co Ta_Powe 2.032e+01 1.943e+02 0.105 0.916710
F1Co Ta_Leng h 2.243e-04 2.300e-04 0.975 0.329423
F1Co Ob_Powe -1.881e+02 6.926e+01 -2.716 0.006602 **
81
F2AudTa_FF 1.370e-02 5.618e-03 2.439 0.014708 *
F2Co Ob_THD 4.186e+03 1.507e+03 2.777 0.005492 **
F3Co Ta_Powe 5.924e+05 2.015e+05 2.939 0.003288 **
F3AudTa_Powe 1.049e+00 2.311e+00 0.454 0.649718
F4Co Ta_Powe 7.937e+03 5.389e+03 1.473 0.140810
F4Co Ta_FF 2.651e-02 9.882e-03 2.683 0.007304 **
F4Co Ob_FF 4.061e-04 7.839e-03 0.052 0.958678
---
Signi . codes: 0 ’**’ ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
(Dispe sion pa ame e o binomial amily aken o be 1)
Null de iance: 120.276 on 90 deg ees o eedom
Residual de iance: 59.867 on 80 deg ees o eedom
AIC: 81.867
Numbe o Fishe Sco ing i e a ions: 7
Desp ´
es d’un pa ell d’i e acions eliminan les a iables menys signi ica i es, ob e-
nim:
> summa y( glm( So oll ˜ F1Co Ta_Leng h + F1Co Ob_Powe + F2AudTa_FF
+ F2Co Ob_THD + F3Co Ta_Powe + F4Co Ta_FF, amily = binomial(link = "logi ")))
Call:
glm( o mula = So oll ˜ F1Co Ta_Leng h + F1Co Ob_Powe + F2AudTa_FF +
F2Co Ob_THD + F3Co Ta_Powe + F4Co Ta_FF, amily = binomial(link = "logi "))
De iance Residuals:
Min 1Q Median 3Q Max
-2.1067 -0.5222 -0.1600 0.6253 2.1745
Coe icien s: Es ima e S d. E o z alue P (>|z|)
(In e cep ) -4.527e+01 1.131e+01 -4.004 6.24e-05 ***
F1Co Ta_Leng h 2.605e-04 1.293e-04 2.015 0.043932 *
F1Co Ob_Powe -1.490e+02 5.183e+01 -2.874 0.004049 **
F2AudTa_FF 1.483e-02 5.254e-03 2.823 0.004756 **
F2Co Ob_THD 5.659e+03 1.532e+03 3.694 0.000221 ***
F3Co Ta_Powe 5.955e+05 1.733e+05 3.437 0.000589 ***
F4Co Ta_FF 3.078e-02 9.739e-03 3.160 0.001577 **
---
Signi . codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
(Dispe sion pa ame e o binomial amily aken o be 1)
Null de iance: 120.276 on 90 deg ees o eedom
Residual de iance: 66.495 on 84 deg ees o eedom
AIC: 80.495
Numbe o Fishe Sco ing i e a ions: 6
Si implemen em aques algo i me ob enim els seg¨
uen s esul a s:
82

Taula 3.3: Taula d’e o s del conjun eliminan les a iables ob ingudes de l’a b e
de decisi´
o.
E o s en enamen E o s es % E o
So Sil So Sil
22 0 4 1 25.23
3.3 Elimina a iables amb s epAIC
Un al e m`
e ode que s’ha u ili za pe edui el nomb e de a iables ´
es l’algo i me
de R s epAIC que s’enca ega de busca models pas a pas seguin el c i e i de
l’AIC. To segui hi ha els esul a s d’aplica aques a es a `
egia pa in de o es les
a iables.
> s epAIC( M0, di ec ion="bo h")
S a : AIC=101.04
So oll ˜ F1Co Ob_FF + F1Co Ob_THD + F1Co Ob_SINAD + F1Co Ob_THDN +
F1Co Ob_Powe + F1Co Ob_Leng h + F1Co Ta_FF + F1Co Ta_THD +
F1Co Ta_SINAD + F1Co Ta_THDN + F1Co Ta_Powe + F1Co Ta_Leng h +
F2Co Ob_FF + F2Co Ob_THD + F2Co Ob_SINAD + F2Co Ob_THDN +
+F2Co Ta_FF + F2Co Ta_THD + F2Co Ta_Powe + F3Co Ob_FF +
F3Co Ob_THD + F3Co Ob_SINAD + +F3Co Ta_FF + F3Co Ta_THD +
F3Co Ta_SINAD + +F3Co Ta_Powe + F4Co Ob_FF + +++++F4Co Ta_SINAD +
F4Co Ta_THDN + ++F2AudOb_THD
D De iance AIC
- F1Co Ta_Powe 1 39.038 99.038
- F1Co Ob_Leng h 1 39.044 99.044
- F3Co Ob_FF 1 39.131 99.131
- F3Co Ta_THD 1 39.219 99.219
- F1Co Ta_Leng h 1 39.293 99.293
- F3Co Ob_SINAD 1 39.407 99.407
- F2Co Ta_FF 1 39.450 99.450
- F2Co Ta_THD 1 39.487 99.487
- F1Co Ob_Powe 1 39.619 99.619
- F2Co Ob_THDN 1 39.953 99.953
- F2Co Ob_SINAD 1 39.953 99.953
- F1Co Ta_THD 1 40.491 100.491
- F3Co Ob_THD 1 40.676 100.676
- F2Co Ta_Powe 1 40.782 100.782
- F1Co Ob_FF 1 40.889 100.889
<none> 39.036 101.036
- F3Co Ta_Powe 1 42.236 102.236
- F1Co Ta_FF 1 42.587 102.587
- F2Co Ob_FF 1 43.126 103.126
- F4Co Ob_FF 1 43.410 103.410
- F3Co Ta_SINAD 1 43.489 103.489
- F4Co Ta_SINAD 1 43.550 103.550
- F4Co Ta_THDN 1 43.571 103.571
83
- F3Co Ta_FF 1 47.260 107.260
- F2AudOb_THD 1 48.634 108.634
- F1Co Ob_THDN 1 51.782 111.782
- F1Co Ob_SINAD 1 52.068 112.068
- F1Co Ob_THD 1 53.163 113.163
- F2Co Ob_THD 1 55.143 115.143
- F1Co Ta_THDN 1 59.557 119.557
- F1Co Ta_SINAD 1 60.237 120.237
S ep: AIC=99.04
[...]
So oll ˜ F1Co Ob_FF + F1Co Ob_THD + F1Co Ob_SINAD + F1Co Ob_THDN +
F1Co Ta_FF + F1Co Ta_THD + F1Co Ta_SINAD + F1Co Ta_THDN +
F2Co Ob_FF + F2Co Ob_THD + F2Co Ta_Powe + F3Co Ob_THD +
F3Co Ta_FF + F3Co Ta_SINAD + F3Co Ta_Powe + F4Co Ob_FF +
F4Co Ta_SINAD + F4Co Ta_THDN + F2AudOb_THD
D De iance AIC
<none> 41.968 81.968
- F1Co Ob_FF 1 44.441 82.441
- F3Co Ob_THD 1 44.989 82.989
- F1Co Ta_THD 1 45.059 83.059
+ F1Co Ob_Powe 1 41.182 83.182
- F2Co Ta_Powe 1 45.218 83.218
+ F3Co Ob_SINAD 1 41.415 83.415
+ F2Co Ta_FF 1 41.687 83.687
+ F1Co Ob_Leng h 1 41.810 83.810
+ F2Co Ob_THDN 1 41.828 83.828
+ F2Co Ob_SINAD 1 41.835 83.835
+ F1Co Ta_Powe 1 41.871 83.871
+ F3Co Ob_FF 1 41.871 83.871
+ F2Co Ta_THD 1 41.923 83.923
+ F3Co Ta_THD 1 41.951 83.951
+ F1Co Ta_Leng h 1 41.958 83.958
- F3Co Ta_Powe 1 47.625 85.625
- F4Co Ob_FF 1 48.161 86.161
- F4Co Ta_SINAD 1 49.010 87.010
- F4Co Ta_THDN 1 49.051 87.051
- F3Co Ta_SINAD 1 51.272 89.272
- F2Co Ob_FF 1 52.270 90.270
- F1Co Ta_FF 1 56.516 94.516
- F3Co Ta_FF 1 56.789 94.789
- F2AudOb_THD 1 57.990 95.990
- F1Co Ob_THD 1 58.034 96.034
- F2Co Ob_THD 1 62.455 100.455
- F1Co Ob_THDN 1 63.860 101.860
- F1Co Ob_SINAD 1 64.209 102.209
- F1Co Ta_THDN 1 64.294 102.294
- F1Co Ta_SINAD 1 64.755 102.755
Call: glm( o mula = So oll ˜ F1Co Ob_FF + F1Co Ob_THD + F1Co Ob_SINAD +
F1Co Ob_THDN + F1Co Ta_FF + F1Co Ta_THD + F1Co Ta_SINAD + F1Co Ta_THDN +
84
F2Co Ob_FF + F2Co Ob_THD + F2Co Ta_Powe + F3Co Ob_THD + F3Co Ta_FF +
F3Co Ta_SINAD + F3Co Ta_Powe + F4Co Ob_FF + F4Co Ta_SINAD + F4Co Ta_THDN
+ F2AudOb_THD, amily = binomial(link = "logi "))
Coe icien s:
(In e cep ) F1Co Ob_FF F1Co Ob_THD F1Co Ob_SINAD F1Co Ob_THDN
-2.273e+04 7.240e-01 1.004e+01 6.612e+02 5.334e+03
F1Co Ta_FF F1Co Ta_THD F1Co Ta_SINAD F1Co Ta_THDN F2Co Ob_FF
-4.780e+01 4.505e+00 -2.180e+02 -1.819e+03 -1.405e+01
F2Co Ob_THD F2Co Ta_Powe F3Co Ob_THD F3Co Ta_FF F3Co Ta_SINAD
1.064e+04 -4.612e+05 -7.489e+02 6.184e-01 1.989e+01
F3Co Ta_Powe F4Co Ob_FF F4Co Ta_SINAD F4Co Ta_THDN F2AudOb_THD
1.099e+06 2.186e-02 2.230e+03 1.959e+04 -1.704e+04
Deg ees o F eedom: 90 To al (i.e. Null); 71 Residual
Null De iance: 120.3
Residual De iance: 41.97 AIC: 81.97
Aix´
ı doncs, s’ha pa i d’un model que enia un AIC de 99.04 i s’ha aconsegui
un model amb un AIC de 81.97. La implemen aci´
o d’aques algo i me d´
ona els
seg¨
uen s esul a s:
Taula 3.4: Taula d’e o s del conjun eliminan les a iables amb s epAIC.
E o s en enamen E o s es % E o
So Sil So Sil
10 4 4 2 18.69
3.4 Conjun inicial ex e de les componen s p incipals
Els componen s p incipals indiquen el pes de les a iables pe al d’explica o a
la poblaci´
o. Tal com ha ´
ıem is en la secci´
o 1.2 la p ime a componen p incipal
explica el 79% de o es les mos es. Pe an , mi a em quines a iables s´
on les que
m´
es con ibueixen en aques a explicaci´
o, pe e aix`
o usa em la mesu a
Sco ePondi=
Sco esi
Va ianc¸a(3.9)
a on iindica el n´
ume o de la a iable i en el nos e cas Sco esi´
es el sco e de la
p ime a componen p incipal. S’ha di idi pe la a i`
ancia pe qu`
e no ´
es el ma eix
un alo de sco e de 0.5 quan la a i`
ancia ´
es de 0.1 que quan la a i`
ancia ´
es de 10.
Els esul a s ob ingu s s´
on:
7.8222e-003 6.1000e+001 F3AudTa_THDN
9.0996e-003 4.4000e+001 F2AudOb_THD
1.0272e-002 5.0000e+000 F2AudTa_SINAD
1.3569e-002 2.6000e+001 F3Co Ob_THDN
85
1.4127e-002 1.9000e+001 F2Co Ta_THD
1.4866e-002 2.9000e+001 F3Co Ta_THD
1.6929e-002 1.4000e+001 F2Co Ob_THD
5.2674e-002 4.2000e+001 F4Co Ta_Powe
5.3643e-002 4.9000e+001 F2AudTa_THD
2.8919e-001 1.7000e+001 F2Co Ob_Powe
6.6156e-001 3.7000e+001 F4Co Ob_Powe
7.6245e-001 2.7000e+001 F3Co Ob_Powe
4.6992e+000 3.2000e+001 F3Co Ta_Powe
7.2488e+000 2.2000e+001 F2Co Ta_Powe
a on la p ime a columna ´
es el esul a del c`
alcul (3.9) i la segona ´
es el n´
ume o de
la a iable, que s’ha adu¨
ı al nom de la a iable co esponen a la columna 3.
U ili zan l’an e io s’ha pa i de les a iables que inguessin un Sco ePond
m´
es g an que 1e−2 pe pa i d’un model base pe ana eliminan les a iables
menys signi ica i es. Usan aques model base ob enim el seg¨
uen MLGz:
> summa y(M8)
Call:
glm( o mula = So oll ˜ F2Co Ta_Powe + F3Co Ta_Powe + F3Co Ob_Powe +
F4Co Ob_Powe + F2Co Ob_Powe + F2AudTa_THD + F4Co Ta_Powe +
F2Co Ob_THD + F3Co Ta_THD + F2Co Ta_THD + F3Co Ob_THDN +
F2AudTa_SINAD, amily = binomial(link = "logi "))
De iance Residuals:
Min 1Q Median 3Q Max
-1.1881 -0.4958 -0.1440 0.2155 2.8324
Coe icien s: Es ima e S d. E o z alue P (>|z|)
(In e cep ) 1.323e+02 7.110e+01 1.860 0.062837 .
F2Co Ta_Powe -4.297e+05 2.215e+05 -1.940 0.052412 .
F3Co Ta_Powe 3.674e+05 3.388e+05 1.084 0.278254
F3Co Ob_Powe -4.086e+04 6.263e+04 -0.652 0.514136
F4Co Ob_Powe 6.015e+04 1.704e+04 3.531 0.000414 ***
F2Co Ob_Powe -1.430e+04 2.345e+04 -0.610 0.542085
F2AudTa_THD -1.201e+03 4.188e+03 -0.287 0.774370
F4Co Ta_Powe 1.844e+04 9.971e+03 1.849 0.064420 .
F2Co Ob_THD -7.157e+02 1.076e+03 -0.665 0.506174
F3Co Ta_THD -1.157e+02 1.463e+02 -0.791 0.429040
F2Co Ta_THD -8.788e+02 5.737e+02 -1.532 0.125543
F3Co Ob_THDN -1.228e+02 6.888e+01 -1.782 0.074692 .
F2AudTa_SINAD -1.792e+01 8.025e+00 -2.233 0.025564 *
---
Signi . codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
(Dispe sion pa ame e o binomial amily aken o be 1)
Null de iance: 120.28 on 90 deg ees o eedom
Residual de iance: 53.32 on 78 deg ees o eedom
AIC: 79.32
Numbe o Fishe Sco ing i e a ions: 7
86
Aques algo i me ucniona b´
e quan els dos g ups d’en enamen es an cla a-
men sepa a s. Aix`
o succeeix en el nos e cas al i com s’obse a a la g `
a ica 1.17
a on en l’espai de les dues p ime es componen s p incipals s’ap ecia la sepa aci´
o
dels dos g ups. Aix`
o a pensa que si p ojec em una no a mos a a aques espai,
depenen de la posici´
o dins el pla, pod em classi ica el mi all com a so oll´
os o no
depenen dels seus e¨
ıns, al com s’ha explica amb l’algo i me m´
es p ope .
Pe `
o no nom´
es s’ha u ili za la p ojecci´
o a l’espai de les componen s p incipals,
sin´
o que amb´
e s’ha p o a l’algo i me amb o es les a iables, u ili zan nom´
es
el subg up de a iables aien les co elacionades i el subg up amb les a iables
ob ingudes amb s epAIC.
Pe cadascuna d’aques es di e en s p ojeccions, s’ha es udia quin se ia el nom-
b e de e¨
ıns Kmillo pe a cada espai. S’ha p o a pe alo s de K=1,3,5,7,9 i
els esul a s es poden comp o a a la Taula 4.1 a on la p ime a columna indica el
nomb e de e¨
ıns i el conjun inicial seguin lseg¨
uen ’es uc u a NNKYa on K´
es el
nomb e de e¨
ıns pe p end e la decisi´
o de classi icaci´
o i Yindica l’espai u ili za :
“PCA” s’ha eballa a l’espai de les componen s p incipals sense no mali za , les
que a l’es udi del p ime cap´
ı ol dona en un espai a on es a en ben delimi a s els
conjun s de so ollosos i de silenciosos; “To es” ´
es l’espai amb o es les a iables
o iginals; “Co ” ´
es l’espai eliminan les a iables que es an al amen co elaciona-
des; “s epAIC” ´
es l’espai a on nom´
es hi ha les a iables ob ingudes en els models
lineals gene ali za s u ili zan l’s epAIC de R; i inalmen “PCANo m” ´
es el esul a
u ili zan l’espai de les componen s p incipals no mali zades.
En els esul a s s’obse a que el nomb e de e¨
ıns `
op im ´
es el 3, a on “PCA”,
“To es”, “s epAIC” i “PCANo m” no come en cap e o i “Co ” nom´
es en come
3. Pe eu e-ho de o ma `
apida es po mi a la g `
a ica 4.2 a on l’eix de les abscisses
indica el nomb e de e¨
ıns u ili za s pe a la classi icaci´
o.
93

Taula 4.1: Taula dels esul a s del e´
ı m´
es p ope .
Conjun inicial E o s % e o
Silenciosos So ollosos
NN1 PCA 0 0 0.00
NN3 PCA 0 0 0.00
NN5 PCA 0 0 0.00
NN7 PCA 5 0 31.25
NN9 PCA 6 0 37.50
NN1 To es 0 0 0.00
NN3 To es 0 0 0.00
NN5 To es 0 0 0.00
NN7 To es 5 0 31.25
NN9 To es 6 0 37.50
NN1 Co 2 3 31.25
NN3 Co 2 1 18.75
NN5 Co 3 0 18.75
NN7 Co 5 0 31.25
NN9 Co 6 0 37.50
NN1 s epAIC 0 0 0.00
NN3 s epAIC 0 0 0.00
NN5 s epAIC 1 0 6.25
NN7 s epAIC 5 0 31.25
NN9 s epAIC 7 0 43.75
NN1 PCANo m 1 0 6.25
NN3 PCANo m 0 0 0.00
NN5 PCANo m 1 0 6.25
NN7 PCANo m 3 0 18.75
NN9 PCANo m 6 0 37.50
94
Figu a 4.2: Algo i me del e´
ı m´
es p ope pe di e en s K.Absc: Nomb e de e¨
ıns K.
O d: Nomb e d’e o s.
95
Cap´
ı ol 5
Soluci´
o plan ejada
A les an e io s seccions s’han is els di e en s m`
e odes de classi icaci´
o. En aques
apa a es mos a la aula esum de o s els algo i mes an e io s i es plan eja un nou
escena i pe comp o a la obus esa dels an e io s algo i mes.
A la Taula 5.1 enim o s els esul a s an e io s ag upa s i la se a ep esen aci´
o
g `
a ica es po oba a la Figu a 5.1. L’explicaci´
o de les en ades de “Conjun
inicial” ´
es la ma eixa que s’ha is en el seu cap´
ı ol co esponen .
Segons aques s quad es, el millo algo i me ´
es el del e´
ı m´
es p ope , u ili zan
qualse ol espai excep uan el que se li han e les a iables al amen co elaciona-
des, segui pe l’a b e de decisi´
o mul i a ian de l’espai de les componen s p in-
cipals no mali zades (Qmul i PCA), desp ´
es oba ´
ıem o s els C5.0 i ´
es aqu´
ı a on
obem el p ime classi icado basa amb els models lineals gene ali za s pa in del
conjun inicial ex e de les componen s p incipals.
96
Taula 5.1: Taula esum dels algo i mes
Conjun Inicial E o s % e o
Silenciosos So ollosos
C5 To es 4 1 4.67
C5 Co 3 1 3.74
C5 PCA 2 2 3.74
Ques To es 7 4 10.28
Ques Co 5 10 14.02
Ques PCA 2 6 7.48
Qmul i To es 12 13 23.36
Qmul i Co 15 12 25.23
Qmul i PCA 0 2 1.87
SenseAl Co 1 14 14.02
A bDec 26 1 25.23
s epAIC 14 6 18.69
PCA 8 2 9.35
PCANo m 27 10 34.58
PCANo mAIC 36 18 50.47
NN3 PCA 0 0 0.00
NN3 To es 0 0 0.00
NN3 Co 2 1 18.75
NN3 s epAIC 0 0 0.00
NN3 PCANo m 0 0 0.00
97
Figu a 5.1: G `
a ica de o s els esul a s.
Pe al de comp o a la obus esa dels m`
e odes, ens si uem en un nou esce-
na i. Aques escena i ens pe me c ea mos es sin `
e iques pe eu e qu`
e al es
compo en en el nos e sis ema. Pe gene a -les hem assumi que les a iables s´
on
independen s i que p o enen d’una dis ibuci´
o gaussiana a on hem es ima la a-
i`
ancia. Alesho es a cada a iable de cada mos a se li ha suma un nomb e alea o i
gaussi`
a amb la a i`
ancia co esponen i la mos a esul an ha en a en els di e en s
algo i mes de classi icaci´
o. ´
Es a di , s’ha pa i de les mos es o iginals i s’ha c ea
una pe o baci´
o alea `
o ia pe eu e quan obus e en els m`
e odes de classi icaci´
o.
A la aula 5.2 podem eu e els esul a s dels algo i mes es udia s amb el nou
conjun de mos es, en o al 25680. De cada expe imen s’ha ex e la in o maci´
o
del nomb e d’e o s en classi ica mi alls. El nom de les columnes i les en ades
de “Conjun Inicial” ´
es la ma eixa que s’ha u ili za en cap´
ı ols an e io s, pe `
o a a
no hi ha quan i a d’e o s si no el an pe cen d’aques s. A la Figu a 5.2 hi ha la
ep esen aci´
o g `
a ica d’aques a aula.
98

Taula 5.2: Resul a s dels algo i mes a la pe o baci´
o alea `
o ia
Conjun Inicial % E o s
Silenciosos So ollosos
C5 To es 4.17 95.27
C5 Co 5.24 94.41
C5 PCA 16.52 83.55
Ques To es 54.54 49.31
Ques Co 54.21 49.69
Ques PCA 0.45 99.61
Qmul i To es 9.03 90.23
Qmul i Co 46.46 49.66
Qmul i PCA 31.82 68.44
SenseAl Co 45.96 53.24
A bDec 40.87 53.12
s epAIC 47.53 46.57
PCA 57.61 47.19
PCANo m 74.64 25.72
PCANo mAIC 47.23 51.68
NN3 PCA 23.04 74.26
NN3 To es 23.80 73.60
NN3 Co 5.55 94.08
NN3 s epAIC 9.92 92.71
NN3 PCANo m 22.58 75.13
99
Figu a 5.2: Resul a s dels algo i mes a la pe o baci´
o alea `
o ia.
El p ime que eiem ´
es que enim dos ipus de classi icado s, els que uncionen
mol b´
e pels so ollosos i s’equi oquen mol en els silenciosos. I el cas con a i, que
de ec a mol b´
e els silenciosos pe `
o alla en els so ollosos.A a b´
e, els algo i mes es
compo en m´
es b´
e pe de ec a els silenciosos ( enen una mi jana de 31% d’e o )
que no pas els so ollosos (mi jana del 59%).
´
Es cu i´
os el e que els que e en e`
o icamen mol bons en les mos es d’en-
enamen , cauen es epi osamen amb aques es , pe exemple el e´
ı m´
es p ope
enia mol bons esul a s, pe `
o s’equi oca mol en classi ica els so ollosos. En
can i, els models lineals gene ali za s que e en els que enien un compo amen
m´
es dolen , aguan en b´
e el es .
El que millo de ec a els silenciosos ´
es el “Ques PCA” (Ques uni a ian a l’es-
pai de les componen s p incipals no mali zades), pe `
o sembla que classi iqui o s
els mi alls com a silenciosos, ja que de so ollosos no en de ec a gai eb´
e cap (99%
d’e o ). El seu hom`
oleg se ia el “PCANo m” (model lineal gene ali za (MLG)
a l’espai de les componen s p incipals no mali zades) que es `
a una mica m´
es ben
100
equilib a i nom´
es s’equi oca 1 de cada 4 de so ollosos i 3 de cada 4 de silenciosos.
A pa del “PCANo m”, els al es que es compo en millo de ec an so ollosos que
silenciosos s´
on: “PCA” (MLG eduin a iables segons el pes en les componen s
p incipals), “s epAIC” (MLG ob ingu amb l’s epAIC), “Ques Co ” (Ques uni-
a ian eliminan a iables al amen co elacionades) i “Ques To es” (Ques uni-
a ian pa in de o es les a iables). Nom´
es 5 de 20 algo i mes de ec en millo
els so ollosos que els silenciosos. Aques s se ien ´
u ils si os mol penali zable que
a ibessin al me ca mi alls so ollosos.
A a b´
e, mol s cops pe p end e una decisi´
o´
es millo consul a di e en s opini-
ons. Si aslladem aix`
o en el camp de la classi icaci´
o se ia combina els esul a s de
di e en s c i e is pe e ique a la no a mos a que a iba de e o iso com a so o-
llosa o silenciosa. En el nos e cas enim 20 c i e is, pe pode p end e una decisi´
o
el nomb e d’opinions que es ulguin consul a ha de se sena , aix´
ı podem ana
ag upan aques s 20 c i e is d’un en un, de es en es, e c., ins a iba a ag upa -
los de 19 en 19. En o al 10 o mes d’ag upacions. Si calculem dins de cada o ma
d’ag upa -los els elemen s que hi ha enim:
10
∑
k=120
2k−1=1048575 (5.1)
que a que sigui una quan i a mol di ´
ıcil d’examina . Pe an hem escolli 3
c i e is que enen el p omig m´
es baix d’e o pe eu e si combinan -los aconse-
guim millo s esul a s. Aques s s´
on pe o d e d’e o : “A bDec” (MLG a pa i
del conjun de a iables dels a b es de decisi´
o), “s epAIC” i “Qmul i Co ” (Ques
mul i a ian aien les a iables al amen co elacionades). Aques a combinaci´
o
ha dona un 0.52 d’e o en els so ollosos i un 0.41 en els so ollosos, una mica
millo que l”’A bDec” sol.
Un al e c i e i po se el de come e pocs e o s en la de ecci´
o de mi alls so-
ollosos man enin amb´
e un p omig baix en e els e o s del silenciosos i dels
so ollosos. Pe aix`
o s’ha aga a un c i e i que de ec a b´
e els so ollosos, “PCA-
No m” i s’ha complemen a amb els p omi jos baixos, “A bdec” i “Qmul i Co ”,
pe mi a de compensa all`
a a on s’equi oca aques c i e i sol. S’ha ob ingu un
36% en els so ollosos i un 54% en els silenciosos. Aconseguin aix´
ı pocs e o s en
els so ollosos, m´
es que no pas si “PCANo m” an´
es sol (26%), pe `
o millo an mol
el seu compo amen en els silenciosos, d’un 75% a un 54%.
Resumin , p ime s’ha mos a una aula amb els esul a s dels algo i mes apli-
ca s a la mos a d’en enamen . Desp ´
es s’ha comp o a la obus esa d’aques s
algo i mes c ean una pe u baci´
o gaussiana a la mos a o iginal. Aques a pe u -
baci´
o ha es a mol du a i ha can ia o almen la isi´
o que en´
ıem dels algo i mes.
Finalmen s’ha mos a una combinaci´
o d’aques s algo i mes pe dona un c i e i
m´
es bo que els indi iduals.
101
Cap´
ı ol 6
Fu u es l´
ınies d’ac uaci´
o
Aques eball a so gi pe soluciona un p oblema que hi ha ia a la ind´
us ia:
pode de e mina si un e o iso e a de ec u´
os al passa el es de quali a de la
l´
ınia de mun a ge. Pe aix`
o, la idea inal ´
es que aques s c i e is es iguin ins al·la s
en di e en s l´
ınies de p oducci´
o i que puguin se i pe di e en s models de e o-
iso s. Una soluci´
o senzilla se ia implemen a di ec amen aques s c i e is amb el
ha dwa e necessa i pe modi ica la m`
aquina de es ac ual. El p oblema que ´
e
aques a implemen aci´
o´
es que pe cada nou model de e o iso que su i, s’hau `
a
d’ana a cap u a les mos es, p ocessa -les i calcula de nou o s els c i e is pe al
nou model. Pe `
o no nom´
es aix`
o, po se que els apa ells de mesu a amb´
e es agin
desajus an , o que can i¨
ın el disseny d’alguna pec¸a i s’hagi de o na a ajus a o el
sis ema. ´
Es a di , la m`
aquina su de `
ab ica calib ada pe un ipus de mi all, i cada
cop que es desajus a (pe un can i de model de e o iso o degu al pas del emps),
s’han de o na a p ocessa les dades i calib a -la amb la in o maci´
o ob inguda.
Pe e de nou la calib aci´
o eque eix aga a les mos es a la m`
aquina de es ,
p ocessa -les i modi ica la m`
aquina de es amb les no es modi icacions. El p o-
cessamen d’aques es dades inclou o na a calcula els llinda s dels a b es de de-
cisi´
o i els models lineals gene ali za s. Aques s algo i mes que s’han u ili za pe
e o aques p ojec e, han es a implemen a s en C i en R, de o ma o almen
sepa ada de la m`
aquina de es . ´
Es a di , s’han aga a les dades de es i s’han
p ocessa en llengua ges o almen di e en s al que co e a la m`
aquina de es , que
´
es el Lab iew. Pe an , en aques s momen s, la m`
aquina de es no es po o na a
au ocalib a , ja que el p og ama p ocessa la no a mos a, aga an les a iables que
s’han is en aques p ojec e: F1 Co Ob THD, F2 AudTa FF, e c. i compa an -les
amb els llinda s ixa s pels a b es de decisi´
o, els pesos del MLGz o al pa ´
o que
m´
es s’acos i en el e´
ı m´
es p ope .
Pe aix`
o, els p ope s passos se ien e que aques a m`
aquina es pogu´
es au oca-
lib a , que ella ma eixa pogu´
es calcula els nous llinda s, pesos o pa ons pe al de
pode classi ica b´
e. Pe aconsegui -ho s’hau ia de:
1. Fe que el Lab iew, el p og ama que execu a la m`
aquina de es , pugui exe-
cu a els p og ames de C i de R. Hau ia d’execu a p og ames en C, ja que
102
Taula 1: Dades classi icaci´
o odes
M F
Mi ja Di`
ame e 5.855 5.4175
Va i`
ancia Di`
ame e 3.50E-002 9.72E-002
Mi ja Pes 176.25 132.5
Va i`
ancia Pes 1.23E+002 5.58E+002
Mi ja amplada 11.25 7.5
Va i`
ancia amplada 9.17E-001 1.67E+000
Segons aques es dades, si enim una mos a amb les ca ac e ´
ıs iques: di`
ame e
= 6, pes = 130 i amplada = 8, podem calcula :
P(Roda M|diam,pes,amp) =
=P(Roda M)
P(diam,pes,amp)P(diam|Roda M)P(pes|Roda M)P(amp|Roda M)
=P(Roda M)
P(diam,pes,amp)1.5789·5.9881E−6·1.3112E−3
=P(Roda M)
P(diam,pes,amp)6.1984E−9(8)
i em el ma eix pe la oda de ipus F:
P(Roda F|diam,pes,amp) =
=P(Roda F)
P(diam,pes,amp)P(diam|Roda F)P(pes|Roda F)P(amp|Roda F)
=P(Roda F)
P(diam,pes,amp)2.2346E−1·1.6789E−2·2.8669E−1
=P(Roda F)
P(diam,pes,amp)3.1493E−5(9)
Si suposem que P(Roda F)
P(diam,pes,amp)´
es la ma eixa pe les dues classes, podem conclou e
que la mos a co espon a una oda de classe F ja que 3.1493E−5>6.1984E−9.
109

D Lab iew
En aques a secci´
o a em una b eu desc ipci´
o de l’en o n de p og amaci´
o del Lab i-
ew. P ime a em una de inici´
o del que ´
es, desp ´
es eu em com eballa i inalmen
eu em un pe i exemple.
D.1 Qu`
e´
es el LabVIEW?
El LabVIEW ´
es un p og ama pe desen olupa aplicacions, com mol s llengua ges
de p og amaci´
o ipus C o JAVA. No obs an , el LabVIEW no ´
es un llengua ge
basa en ex com els an e io s, pe c ea codi el LabVIEW es basa en G, que ´
es un
llengua ge de p og amaci´
o g `
a ic.
No e cal sabe mol de p og amaci´
o pe eballa en LabVIEW, ja que u ili za
e minologia, icones, i idees mol amilia s als cien ´
ı ics i als enginye s i es basa
en s´
ımbols g `
a ics en comp es de llengua ge ex ual pe desc iu e les accions de
p og amaci´
o.
El LabVIEW ´
e unes ex ensi es llib e ies de uncions i sub u ines pe la ma-
jo ia de asques. Pe Windows, Macin osh i Sun, el LabVIEW con ´
e llib e ies pe
l’adquisici´
o de dades (mos eja un senyal que s’ha explica an e io men ) i pe
con ola ins umen s de mesu a i con ol. El LabVIEW inclou eines comunes de
desen olupamen , pe an es poden posa alls, anima el p og ama a poc a poc pe
eu e com les dades lueixen pas a pas pe al de pode debuga i e la p og amaci´
o
m´
es senzilla.
D.2 Com eballa el LabVIEW?
Els p og ames de LabVIEW s’anomenen i ual ins umen s (VIs) pe qu`
e la se-
a apa enc¸a i ope a i i a imi en als ins umen s de mesu a. Enca a que les se es
uncions s´
on an`
alogues a les uncions con encionals dels al es llengua ges de p o-
g amaci´
o. Els VIs enen una in e ´
ıcie d’usua i in e ac i a i un codi on equi alen ,
i accep a pa `
ame es de VIs de m´
es ni ell. Aques es ca ac e ´
ıs iques s’expliquen
en m´
es de all o segui :
•Els VIs con enen una in e ´
ıcie d’usua i in e ac i a, que s’anomena panell
on al, pe qu`
e simula el panell d’un ins umen ´
ısic. El panell on al po
con eni ode es, bo ons, g `
a iques, i al es ipus de con ols i indicado s.
Les dades s’in odueixen mi janc¸an un ecla o el a ol´
ı, i desp ´
es es eu el
esul a a la pan alla de l’o dinado .
•Els VIs eben ins uccions del diag ama de blocs, que es cons ueix en G. El
diag ama de blocs ´
es una soluci´
o g `
a ica a un p oblema de p og amaci´
o. El
diag ama de blocs ´
es el que con ´
e el codi del VI.
•Els VIs u ili zen una es uc u a modula i je `
a quica. Els po s u ili za com a
p og ames de m´
es al ni ell o com a subp og ames d’al es VIs. Un VI dins
110
un al e VI s’anomena subVI. La icona i el panell de connexions d’un VI
eballen com una llis a de pa `
ame es pe al que al es VIs puguin passa
les sa es dades al VI.
Amb aques es ca ac e ´
ıs iques, el LabVIEW p omou i s’a egeix al concep e de
p og amaci´
o modula . Les aplicacions es di ideixen en una s`
e ie de asques, que
es poden o na a di idi , de al mane a que una aplicaci´
o complicada es con e eix
en una s`
e ie de asques simples. Cons ueixes un VI pe aconsegui una sub asca
i desp ´
es combines els VIs en un al e diag ama de bloc pe aconsegui una asca
m´
es complexa.
Com que po s execu a cada subVI de o ma au `
onoma, el debugueig ´
es mol
m´
es senzill. A m´
es a m´
es, mol s subVIs de baix ni ell eali zen asques que se an
comunes pe di e en s aplicacions, e i an aix´
ı o na a p og ama la asca.
D.3 Exemple d’un VI senzill
A les igu es 2 i 3 es po eu e un VI senzill.
Figu a 2: Panell on al del VI d’exemple.
Tal i com es po eu e en el panell on al hi ha un bo ´
o que s’enca ega de
pa a el p og ama, “Enable”, una ode a que indica el e a d del bucle, el emps
que a da `
a en gene a un nou elemen del senyal que es ep esen a `
a a la g `
a ica
“Random Signal”.
El codi es oba en el dig ama de blocs, es `
a o ma pe un bucle, el equad e
g is, go e na pel bo ´
o “Enable”, uns daus que s´
on un VI que gene en un n´
ume o
alea o i i el seu esul a s’en ia a la g `
a ica “Random Signal”. A baix a l’esque a
podem obse a un VI iconog a ia amb un me `
onom que s’enca ega de con ola
111
Figu a 3: Diag ama de blocs del VI d’exemple.
la du ada del bucle, l’en ada d’aques VI ´
es el p oduc e en e 1000 i el n´
ume o que
hem posa en el panell on al com a “Loop Delay”.
Quan execu em aques VI, si es `
a el bo ´
o “Enable” ac i a , ani `
a gene an un
senyal alea o i que s’ani `
a pin an al panell on al a una eloci a con olada pe
“Loop Delay”.
112
Bibliog a ia
[1] G. W. Johnson and R. W. Jennings, LabVIEW g aphical p og amming :p ac-
ical applica ions in ins umen a ion and con ol. New Yo k e c.: McG aw-
Hill, 2006, ga y W. Johnson, Richa d Jennings; ;24 cm; Index. Bibliog a ia.
[2] J. L. Hin ze and R. D. Nelson, “Violin plo s: A box plo -densi y ace
syne gism,” The Ame ican S a is ician, ol. 52, no. 2, pp. 181–184, May
1998. [Online]. A ailable: h p://www.js o .o g/s able/2685478
[3] J. R. Quinlan, “Imp o ed use o con inuous a ibu es in c4.5,” Jou nal o A -
i icial In elligence Resea ch, ol. 4, pp. 77–90, 1996.
[4] W. yin Loh and Y. shan Shih, “Spli selec ion me hods o classi ica ion ees
published in s a is ica sinica, 1997, ol. 7, pp. 815-840.”
[5] C. E. B odley and P. E. U go , “Mul i a ia e decision ees,” 1992.
[6] “Demo glm.” [Online]. A ailable:
h p://www.ma hwo ks.com/p oduc s/demos/s a is ics/glmdemo.h ml
[7] A. J. Dobson, An In oduc ion o gene alized linea models. Boca Ra on:
Chapman & Hall/CRC, 2002, anne e J. Dobson; :il.;24 cm; Bibliog a ia. In-
dex; Tex s in s a is ical science.
[8] J. M. Chambe s and T. Has ie, S a is ical models in S. London: Chapman &
Hall, 1992, edi ed by John M. Chambe s, T e o J. Has ie; ;22 cm; Bibliog a-
ia. Index.
113