A Bradley-Terry modell elemzése

A Bradley-Terry modell elemzése Szakdolgozat Készítette: Témavezet : Bókkon Andrea Csszár Vll, adjunktus Matematka B.Sc., Matematka elemz szakrány Valószín ségelmélet és Statsztka Tanszék Eötvös Loránd Tudományegyetem Természettudomány Kar 2010

Tartalomjegyzék 1. A szakdolgozat témája és felépítése................... 1 1.1. Bevezetés................................. 1 1.2. A szakdolgozat felépítése......................... 1 2. Felhasznált eszközök............................. 2 2.1. Maxmum-lkelhood becslés (ML).................... 2 2.2. Az EM-algortmus............................ 4 2.3. Az MM-algortmus............................ 5 2.4. Az MM-algortmus az EM-algortmus vonatkozásában......... 6 3. Bevezetés a Bradley-Terry modellbe.................. 8 3.1. A modell.................................. 8 3.2. A modell alkalmazása........................... 9 4. Bradley-Terry modell általánosítása.................. 11 4.1. Haza pálya modell........................... 11 4.2. A Rao-Kupper-féle döntetlen esete................... 11 4.3. A Davdson-féle döntetlen esete..................... 12 4.4. A modell három személyre........................ 13 5. Mnorzáló függvény és az MM-algortmus............... 13 5.1. Iteratív algortmus a l(γ) maxmalzálására............... 14 5.2. MM-algortmus haza pályára...................... 15 5.3. MM-algortmus a Rao-Kupper-féle döntetlen esetére.......... 15 5.4. MM-algortmus a Davdson-féle döntetlen esetére........... 17 6. Az MM-algortmus konvergencájának tulajdonsága........ 19 7. Több versenyz összehasonlítása..................... 25 8. Bradley-Terry modell R-ben....................... 30 9. Összefoglalás................................. 39

10.Köszönetnylvánítás............................. 40

1 1. A szakdolgozat témája és felépítése 1.1. Bevezetés Hogy mr l s szól a szakdolgozatom? Mt takar a cím? Azt szeretném közelebbr l bemutatn. Sportrajongók és lelkes fogadók tudják, hogy a mérk zések el tt mndg megjósolják, hogy k az esélyesebb, egyk csapat, vagy versenyz mennyvel jobb a másknál, m az el zetesen várt eredmény, esetleg menny a gól, lletve pontkülönbség. Bonyolítja a helyzetünket, ha egyk csapat/versenyz haza pályán játszk. Lehet, hogy az ellenfelet káltják k el zetesen esélyesnek, ám az esélytelenebb versenyz haza pályán jobban teljesít. Ekkor a haza pálya el nyé r l beszélünk. De van, amkor hátránnyá s tud váln az otthon helyszín. Ekkor azt mondjuk, hogy a haza pálya hátrányáról van szó. De nem csak azt nézhetjük, hogy k nyer, vagy veszít, hanem a döntetlenekre s kterjesztjük a modellünket, akár a haza pályán, akár degenben. Hogy mndezt egy való életb l vett példára - matematka algortmusok felhasználásával, statsztka modellek llesztésével, továbbá az R programcsomag felhasználásával - hogyan határozhatjuk meg, arról szól a szakdolgozatom a továbbakban. 1.2. A szakdolgozat felépítése Ahhoz, hogy a modellt a kés bbekben bevezethessük és megérthessük, el zetesen smernünk kell pár statsztka becslést, lletve algortmust. A szakdolgozatom els felében vázolom a maxmum-lkelhood becslés t, majd bemutatom az EM- és az MM-algortmus t, melyek elengedhetetlenek a továbbakban. A szakdolgozatom f témájában részletesen leírom a modellt, majd ktérek a modell általánosításara, kterjesztésere s. Vzsgálom a haza pálya el nyé t, és a döntetlen esetet s; a modellt, és az algortmusok kapcsolatát. Majd valós sportesemények eredményet elemzem az R, statsztka program segítségével, a BradleyTerry modell nev nstallált programcsomag felhasználásával, s ebb l vonok le konklúzókat.

2 2. FELHASZNÁLT ESZKÖZÖK 2. Felhasznált eszközök 2.1. Maxmum-lkelhood becslés (ML) A momentumok módszerén kívül a pontbecslés másk módszere. A maxmáls valószín ség angolul: maxmum-lkelhood, tehát az L = L(k; λ) lkelhood függvény maxmumát keressük. Általánosítva : Ismerjük a sokaság eloszlását, de nem smerjük az eloszlást jelz paramétert vagy paramétereket. A paraméter vagy paraméterek értékét olyan értékkel vagy értékekkel becsüljük, amely vagy amelyek esetén az adott mnta bekövetkezése lenne a legnagyobb valószín ség. A maxmáls valószín séget az adott mnta valószín ségét megadó lkelhood-függvény maxmumával vagy a logartmusának a maxmumával keressük meg. 2.1. Denícó.. Legyen X 1,..., X n mnta F ϑ eloszlásból, ϑ θ. Ekkor a ϑ maxmum lkelhood (ML) becslése ˆϑ, ha L n (X; ˆϑ) = max {L n (X; ϑ) : ϑ θ}. Ha ez nem egyértelm, vagy nem létezk, de L n (X; ϑ) elég sma, akkor a ϑ lnl n(x; ϑ) = 0 lkelhood-egyenlet megoldására vagyunk kíváncsak. A maxmum-lkelhood becslés az egyk legelterjedtebb módszer a gyakorlatban. Bár, a becslés általában nem torzítatlan, bzonyos er s feltételek mellett jó aszmptotkus tulajdonsága vannak. 2.2. Tétel. Bzonyos (er s) regulartás feltételek mellett elég nagy n -re a ˆϑ n ML becslés létezk, és konzsztens. Egyes esetekben: Aszmptotkusan normáls eloszlású: n ( ˆϑ n ϑ) N(m(ϑ), σ(ϑ)), (n ) Aszmptotkusan torzítatlan: m(ϑ) = 0 Aszmptotkusan optmáls: σ 2 (ϑ) = 1 I 1 (ϑ). Példa maxmum-lkelhood becslésre Egy fonalgyárban a fonalak szakadását vzsgáljuk. A fonalak szakadása egymástól független. Kmutatható, hogy ebben az esetben egy adott d tartam alatt a fonalszakadások száma: X jó közelítésben Posson-eloszlású.

2.1. Maxmum-lkelhood becslés (ML) 3 Az smeretlen λ paraméterre célszer olyan értéket választan, amely esetén X = k esemény valószín sége maxmáls. (Ha az adott d tartamban a fonalszakadások száma X = k volt.) Tehát, mnt fent említettem, a L = L(k, λ) lkelhood-függvény maxmumát keressük. Vzsgáljuk, ha n mérés ntervallumban nézzük a fonalszakadások számát! X 1 = k 1, X 2 = k 2,..., X n = k n, Azt keressük, hogy mlyen λ paraméterérték esetén maxmáls mnta valószín sége. Mvel a fonalszakadások függetlenek, ezért: L = L(k 1, k 2,..., k n ; λ) = P (X 1 = k 1, X 2 = k 2,...X n = k n ) =. n λ k e λ = P (X 1 = k 1 )P (X 2 = k 2 )...P (X n = k n ) = k! =1 Egyszer bb, ha L helyett ln L maxmumát keressük. = e nλ n =1 λ k k! ln L = nλ + n (k ln λ ln k!) =1 d ln L dλ = n + n =1 k λ = 0 λ = n =1 k n = n =1 X n = x d 2 ln L dλ 2 = 1 λ 2 k < 0 Célszer a λ paramétert x-sal becsüln, mert λ = x esetén maxmáls annak a valószín sége, hogy az X 1 = k 1, X 2 = k 2,..., X n = k n mntát kapjuk. A λ paraméter maxmum-lkelhood becslése tehát a mntaátlag.

4 2. FELHASZNÁLT ESZKÖZÖK Megjegyzés. Egy T paraméter esetén a lkelhood-függvény a következ : I. Dszkrét eset: L(X 1, X 2,..., X n, T ) = P (X 1 = x 1, X 2 = x 2,..., X n = x n ) = = P (X 1 = x 1 )P (X 2 = x 2 )...P (X n = x n ). Szorzat helyett (néha) könnyebb összeget kezeln. Ekkor az ln L = n P (X = x ) =1 függvényt tekntjük a log-lkelhood függvénynek. II. Folytonos eset: egy pont felvételének valószín sége az n-dmenzós térben 0. Annak a valószín ségét kell maxmalzáln, hogy a pont az (x 1, x 2,..., x n ) pont közvetlen környezetébe, lletve pontosabban az x 1 X 1 x 1 + x 1,..., x n X n x n + x n n-dmenzós téglatestbe esk. Ennek valószín sége: f(x 1, T )f(x 2, T )...f(x n, T ) x 1 x 2... x n. Ez ott maxmáls, ahol L(x 1, x 2,..., x n ; T ) = f(x 1, T )f(x 2, T )...f(x n, T ) függvény maxmáls. Ezt, vagy ennek a logartmusát, vagys az ln L = n =1 ln f(x, T ) tekntjük lkelhood-függvénynek. Ennek megfelel en: dl d ln L = 0 vagy ha a logartmusát nézzük, akkor: dt dt = 0 A parcáls derváltak zérushelyet keressük. Itt lehet a maxmum. (Ha van.) Hogy van-e, vagy nncs, azt a Hesse-determnánssal tudjuk eldönten. 2.2. Az EM-algortmus Hányos meggyelések esetén alkalmazzuk ezt az algortmust. Tegyük fel, hogy a teljes meggyelésünk Z, és valamlyen β paramétervektor írja

2.3. Az MM-algortmus 5 le az eloszlását, de Z -nek csak valamlyen X függvényét tudjuk meggyeln. Ezt hányos meggyelésnek nevezzük. A β maxmum-lkelhood becslését keressük, teratív módszerrel, ahol az tererácó β (0) kezd értékb l ndul, és mnden terácó a következ két lépésb l áll: 1.lépés: E-lépés (expectaton) 2. lépés: M-lépés (maxmzaton) Így hajtjuk végre az algortmust: 1. E-lépés : Van egy X meggyelésünk, am hányos. A feltételes várható értéket keressük, a hányos meggyelés mellett. (Majd ezt a β (t) paraméterérték mellett maxmalzáljuk β-ban.) Q(β, β (t) ) = E(log L(Z, β) X, β (t) ) Ez a log-lkelhood függvény várható értéke. 2. M-lépés : Ha az el bb Q(β, β (t) ) függvényt maxmalzáljuk, úgy kapjuk az új paramétervektort, β (t+1) -et. Tudjuk, hogy L(X, β (t) ) lkelhood-függvény az algortmus során monoton növekszk, és konvergál az L értékhez, ha a lkelhood-függvény felülr l korlátos. De nem bztos, hogy ez az L a globáls maxmum s, ugyans a β (t) sorozat lkelhood-függvény nyeregpontjához s konvergálhat. A kovergenca sebessége a hányzó adat hányadosától függ. Az EM-algortmus el nye: monoton növekszk a lkelhood, könny beprogramozn, kcs a számításgénye, gyorsan fut. 2.3. Az MM-algortmus A β a paramétervektort szeretnénk becsüln maxmum-lkelhood becsléssel, X mntából. (Itt nncs teljes, és hányos mnta.) A β (0) kezd értékb l ndulva az algortmus egy mnorzáló, majd egy maxmalzáló lépést végez el. E két lépés szernt kell teráln. Ezért nevezzük MM-algortmusnak. Az alább két lépés tehát:

6 2. FELHASZNÁLT ESZKÖZÖK 1. M-lépés : Mnorzaton-lépés: el állít egy olyan Q t (β) függvényt, melyre Q t (β) log L(X, β) β és Q t (β (t) ) = log L(X, β (t) ) 2. M-lépés : Maxmzaton-lépés: Q t (β) függvényt kell a β-ban maxmalzáln, így megkapjuk az új β (t+1) ) paramétervektort. Az L(X, β (t) ) lkelhood monoton n. A Q t függvényt jól kell megválasztan. Az a jó, ha Q t függvény szétválasztja a β paramétervektor koordnátát. Ez azért kell, hogy a β-ban vett maxmalzálást koordnátánként tudjuk elvégezn. 2.4. Az MM-algortmus az EM-algortmus vonatkozásában Az EM-algortmusok valójában specáls MM-algortmusok, így vzsgálhatjuk a kett t egyszerre s. Az EM-algortmus (Dempster, Lard és Rubn, 1977), mnt már említettem, egy nagyon gyakran használt, általános statsztka módszer a hányos adatrendszereknél, a lkelhood maxmalzálására. Legyen tt a h a meggyelt, az y a hányzó adat. z = (h; y) Jelölje f(z x) a z teljes adathalmazból való mntavétel s r ségét, és x jelöljön egy smeretlen paramétervektort. A z = (h, y) vektor adatat kombnáljuk a ténylegesen meggyelt h hányzó adatokkal. (Itt most h a hányos adathalmaz, mert h-ból hányzk az y.) Legyen g(h x) a hányos adatok lkelhoodja, ezért ezt akarjuk maxmalzáln. Legyen k(z h, x) az f(z x)/g(h x) feltételes s r sége. Az alapelvünk az, hogy szétszedjük a célfüggvényt úgy, hogy: log g(h x) = E [log f(z x) h, x] E [log k(z h, x) h, x] (1) Ez az egyenlet következk a k(z h, x) átrendezéséb l, a logartmus denícójából, majd ha átrendeztük, tekntjük a várható értéket. Adottak a h meggyelt értékek, és az x becslések, és a másodk tagban az összes

2.4. Az MM-algortmus az EM-algortmus vonatkozásában 7 adat s r ségének feltételes várható értéke. Így a másodk tagot a következ képpen tudjuk mnorzáln: E [log k(z h, x) h, x] E [log k(z h, x) h, x] Így kaptunk egy egyenl tlenséget, a Jensen-egyenl tlenség felhasználásával, a feltételes várható értékre. Tekntsük úgy, mntha egyszer, véges eset lenne! Tegyük fel, hogy kfejezhetjük m elemmel a k(z h, x) feltételes s r séget, azaz mvel z dszkrét eloszlású, ezért fel tudjuk írn két feltételes, de egy-egy dszkrét eloszlással. Ekkor z felvehet m értéket. Az x paraméter mellett a megfelel valószín ségek így alakulnak: } {p 1,..., p j,..., p m }, és x paraméterek mellett a következ képpen: {p 1,..., p j,..., p m. Mvel ezek a feltételes valószín ségek, eleget tesznek annak, hogy j p j = j p j = 1. Tekntsünk egy olyan valószín ség változót, amely p j valószín séggel p j /p j értéket vesz fel, azaz valamely z valószín ség változó j-edk értékét p j /p j lehetséges értékkel vesz fel. A logartmus függvény konkáv, ezért p j /p j egyenl tlenség teljesül: konvex kombnácójára a következ log j p j (p j /p j ) j p j log(p j /p j ) am akkor és csak akkor egyel, ha p j = p j j-re. (Tehát, ha elvégezzük a legutóbb egyenl tlenségben a beszorzást, a baloldalon p j kesk, és csak p j marad. Ezeknek az összege 1. Egynek pedg a logartmusa 0, tehát pont akkor maxmáls p j szernt várható értéke log p j -nek, ha p j = p j.) p j log p j j j p j log p j Akkor és csak akkor tudunk egyenl séghez jutn, ha x = x. A maxmumot pedg akkor érjük el, ha p j pont p j, mert a logartmus várható értéke akkor lesz maxmáls, ha mndegyk p egyenl egymással. Az (1) jobboldalát tudtuk mnorzáln. Amvel mnorzálunk, már nem függ x-t l.

8 3. BEVEZETÉS A BRADLEY-TERRY MODELLBE Ezért lehet maxmalzáln a mnorzált E [log f(z x) h, x] -t, vagys a képletben az els tag maxmumát keressük a teljes adatokra, a várható értéknek megfelel en. Ez pont az EM-algortmus. Az E-lépés határozza meg az EM-algortmusban z várható értékét, és egy olyan becslést x -ra, amely egy megfelel választás a mnorzáló függvények családjából, és ez elegend a mnorzáló függvény maxmumának megtalálásához. 3. Bevezetés a Bradley-Terry modellbe Már a szakdolgozatom bevezetésében s említettem, hogy nagy általánosságokban mr l s van szó. Vzsgáljuk meg most matematkus szemmel! A Bradley-Terry modell párosított összehasonlításokon alapul. Ez egy olyan egyszer, és sokat, sokak által vzsgált eszköz, mely képes leírn a lehetséges eredmények valószín séget. Ha két dolgot hasonlítunk egymással össze - jelen esetben sportolókat, de akár pacvezet újságokra s felállíthatjuk a modellt - melyk jobb, melyk kevésbé, esetleg mndkett egyformán, stb. A modellnek számos többrányú általánosítása s született az elmúlt 75 évben, melyekben teratív algortmust használtak az általánosítás maxmum-lkelhood becslésének elérésére. Ilyen algortmus az EM- algortmus s, mely az MM- algortmusnak specáls esete. El bb mnorzálja, majd maxmalzálja a már mnorzált függvényünket. Egyszer feltételek mellett kjelenthetjük, hogy mnden algortmus garantáltan el állít egy olyan sorozatot, mely konvergál az egyetlen maxmum-lkelhood becsléshez. 3.1. A modell A következ modellt javasolta Bradley és Terry a fent problémára 1952-ben. P ( játékos megver a j játékost) = γ γ + γ j. (2) Párosított összehasonlításokat vzsgálunk. Az (2) képletben a γ egy poztív érték

3.2. A modell alkalmazása 9 paraméter, amely az játékos teljesítményének el zetesen becsült paramétere (az addg versenyek eredménye alapján), míg a γ j poztív érték paraméter, a j játékos teljesítményének el zetesen becsült paramétere. Ha csapatokra alkalmazzuk ezt a képletet, akkor a csapat átlagos képességét nézzük, akkor ezt jelölhetjük γ -val és γ j -val. Bradley-Terry problémája 1929-re nyúlk vssza, ugyans ezt Zermelo már széles körben alkalmazta, de nem általánosította különböz esetek problémakörére. A modellt felrajzolhatjuk rányított gráal s. Ekkor -k és j-k a csomópontok, és mnden és j között megy él, ha k játszottak egymással. Ha többször s, súlyozzuk az éleket nemmegatív számokkal. Az rányítás mndg a felé mutat egységesen, ak a párharcból nyertesen, vagy vesztesen került k. Ha például a vesztes felé mutatunk, akkor ráírjuk az rányított élre, hogy az játékos (ha gy zött) hányszor verte meg j játékost. Mnden és mnden j között mndg van él, ha k játszottak egymással. Zermelo, Bradley és Terry után Davdson, és még sokan mások s foglalkoztak a modellel, általánosították, lletve történetét s megírta Smons és Yao. Régóta smert egy egyszer, teratív algortmus a Bradley-Terry modellben a maxmum-lkelhood becslés megtalálására, de móta Lange, Hunter és Yang bzonyította, hogy ez az algortmus egy specáls esete az algortmusok általános osztályának, azóta említjük MM- algortmus néven. 30 év alatt sokat vzsgálták, különböz nevek alatt, de 2000-ben Hunter és Lange megadta a választ a problémára. Heser használja a a kezdet IM -et (teratív majorzácót) az algortmusok osztályának leírására, ahol IM ugyanaz, mnt az MM, de az MM elnevezés jobban hangsúlyozza az MMés az EM-algortmus között kapcsolatot, mnthogy smeretes, hogy az EM az MM specáls esete. Megvzsgáljuk, hogyan tudunk az általánosított Bradley-Terry modellekre MM-algortmusokat felépíten, elégséges feltételek mellett, melyek garantálják az egyetlen maxmum lkelhood becsléshez való konvergencát. 3.2. A modell alkalmazása Tegyük fel, hogy meggyelünk tetsz leges számú párosítást m egynén, csapat, vagy verenyz között, és becsüln szeretnénk a γ 1,..., γ m paramétereket a maxmumlkelhood becslés felhasználásával. Ha a különböz párosítások kmeneteler l azt

10 3. BEVEZETÉS A BRADLEY-TERRY MODELLBE feltételezzük, hogy függetlenek, a Bradley-Terry modellben a log-lkelhood a következ : l(γ) = m m [w j ln γ w j ln(γ + γ j )] (3) =1 j=1 Ahol w j azt fejez k, hogy hányszor ver meg a j játékost, ha például sporteseményeket nézünk. Értelemszer en w = 0, l(γ) = l(aγ), a > 0. A paraméterteret úgy kell tekntenünk, mnt R m + ekvvalenca-osztályanak halmazát. Két vektor egyenl, ha az egyk skalászorosa a másknak. Ez könnyedén teljesül, ha korlátossá tesszük a paraméterteret. Ezért feltehetjük, hogy γ = 1, és mnden ekvvalencaosztályból egy elemet kválasztunk. Szétbontjuk a versenyz k halamzát két dszjunkt részhalmazra. Valakk az A halmazba kerülnek, míg mások a B-be. Tegyük fel, hogy az A halmazbel elemeket csak az A halmazbel elemekkel, míg a B halmazbel elemeket csak a B halmazbel elemekkel hasonlítjuk össze. De így az a probléma, hogy az A halmazbel versenyz ket sehogy sem tudjuk összehasonlítan a B halmazbel versenyz kkel. Probléma még akkor adódhat, ha A és B elemet ugyan össze tudjuk hasonlítan egymással, de a versenyeket például mndg A halmazbel versenyz nyer meg. Ekkor az A-bel paramétereket megduplázzuk, és újra normalzálunk. Úgy, hogy γ = 1 lesz. A lkelhood n n fog, ezért nncs maxmum-lkelhood becslés. A következ feltételezéssel kküszöbölhetjük a problémák fennállásánal lehet ségét. Ford feltevése: A versenyz k mnden lehetséges felosztásában két nemüres részhalmazt nézünk. Valamelyk versenyz a másodk halmazból megver az els halmaz valamelyk tagját, legalább egyszer. Gráfelmélet értelmezés szempontjából az egyének (versenyz k) a gráf csomópontja (csúcsa), és rányított éllel (, j) jelöljük azt, ha gy zött j felett. Ez a feltételezés egyenérték azzal az állítással, hogy mnden - j párra van út -t l j -be. Ez azt jelent, hogy többek között létezk egyértelm maxmuma a log-lkelhood függvénynek.

11 4. Bradley-Terry modell általánosítása A Bradley-Terry modellre számos általánosítás született. Pl. Agrest (1990) feltesz, hogy a versenyz k bármely párosított összehasonlítása sorrendben történk, és megköveteljük, hogy annak valószín sége, hogy játékos megver j játékost, attól függ, hogy mlyen képességekkel rendelkezk a vesenyz k között az, ak az els helyen szerepel a lstán. Nem muszáj feltétlenül egyén játékosokat teknten. Csapatot s teknthetünk egynénnek, verenyz nek. Ekkor a csapat átlagos képességét mérjük. 4.1. Haza pálya modell Sportban nagyon gyakran el fordul, hogy egy csapat valam fontos mérk zésén, esetleg vlágversenyen haza pályán játszk. Ez vajon gátolja, vagy segít a gy zelemben? Erre írhatunk fel egy matematka modellt. P ( játékos megver a j játékost) = { θγ /(θγ + γ j ) γ /(γ + θγ j ) ha otthon van ha j játszk otthon (4) Ahol θ > 0 mér a haza pálya er sségét. Azt, hogy a haza pálya nkább el ny, vagy hátrány a versenyz k számára. Hogy a haza pálya egy versenyz nek el nyt vagy hátrányt jelent, attól függ, hogy a θ paraméter 1-nél ksebb, vagy nagyobb. Ha θ > 1 a haza pálya el ny t jelent az otthon játszó versenyz nek. Ha θ < 1 a haza pálya hátrány t jelent az otthon játszó versenyz nek. 4.2. A Rao-Kupper-féle döntetlen esete A modellt kterjeszthetjük több rányba úgy, hogy feltesszük, hogy a döntetlen s megengedett legyen a csapatok között.

12 4. BRADLEY-TERRY MODELL ÁLTALÁNOSíTÁSAI P ( játékos legy z a j játékost) = γ /(γ + θγ j ) P (j játékos legy z az játékost) = γ j /(θγ + γ j ) P ( és j játékosok döntetlent játszanak) = (θ 2 1)γ γ j [(γ + θγ j )/(γ j + θγ )] (5) A θ > 1 egy küszöbparaméter. Mnden párosításnál felmerülhet, hogy a bíró az ln γ ln γ j -t hbával becsl, és kjelent a döntetlent, ha ennek az értéke ksebb, mnt ln θ értéke abszolútértékben. Ez azt jelent, hogy a folyamatban lév mérk zés során a bíró meg tudja becsüln egyk, lletve másk versenyz er sségét. Nagyobb különbség esetén egyértem en k tudja hrdetn a gy ztest, míg ksebb, vagy alg eltér különbségnél nagyobb a valószín sége annak, hogy hbával becsl meg a játékosok képességét, így 9-10-nél nagyobb a valószín sége, hogy döntetlent jelent k, mnt például egy 20-10-es állásnál. 4.3. A Davdson-féle döntetlen esete Davdson (1970) különböz beállításokat ad meg a Bradley-Terry modellben a döntetlen esetére, melyben a valószín ségek egymással arányosak. P ( játékos legy z a j játékost) : P (j játékos legy z az játékost) : : P ( játékos döntetlent játszk a j játékossal) = γ : γ j : θ γ γ j. (6) A döntetlen valószín sége a két versenyz nyerés valószín ségének mértan közepével arányos. A poztív érték θ paraméter mutatja meg ezt az arányosság tényez t. Davdson(1970) a mértan közép használatát javasolja. Az egyén érdemeket logartmkus skálán képzeljük el, és log γ-kat hasonlítjuk össze.

4.4. A modell három személyre 13 4.4. A modell három személyre A Bradley-Terry modellt kterjeszthetjük úgy, hogy nem csak kett személyt, versenyz t, csapatot vzsgálunk, hanem mondjuk hármat, majd kés bb többet s egyszerre. Ha hármat nézünk, mndhárom versenyz eredményet rangsoroljuk a legjobbtól a legrosszabbg. Felírjuk, hogy k a legjobb, a közepes, és k a legrosszabb az adott játékosok, versenyz k között. Pendergrass és Bradley javasolta a következ modellt erre az esetre: P ( a legjobb,j a közepes,k a legrosszabb) = γ γ j (γ + γ j + γ k )(γ j + γ k ) Ez az általánosítás tetsz leges számú egyén összehasonlítására alkalmas. Ez az úgy nevezett Plackett-Luce modell. (7) 5. Mnorzáló függvény és az MM-algortmus hogy: A logarmus függvény szgorú konkáv voltából következk poztív x-re és y-ra, ahol egyenl ség akkor és csak akkor áll fenn, ha x = y. ln x 1 ln y (x/y) (8) Most nézzük a sma Bradley-Terry modellt, és a (3)-es képletre alkalmazzuk a fent egyenl tlenséget. ln γ ln(γ + γ j ), ahol (γ + γ j ) = x. Továbbá ln x 1 ln y (x/y). Ebbe vsszaírjuk a gammákat, akkor: ln(γ +γ j ) 1 ln(γ (k) +γ (k) j ) (x/y). x y = γ + γ j γ (k) + γ (k). Így kaphatjuk a következ t: j ] Q k (γ) = m =1 [ m w j ln γ j=1 γ + γ j γ (k) + γ (k) j ln(γ (k) + γ (k) j ) + 1 Majd ezt kell maxmalzáln. Ez az terácó növel a lkelhood-ot. Q k (γ) függvény mént meghatározása megkönnyít a maxmalzálást. Ekkor az eredet log-lkelhood ténylegesen elkülönít a γ paramétervektor összetev t, Q k (γ)- ban γ komponense szétválnak. Így a Q k (γ) maxmalzálása egyenl azzal, ha mnden (9)

14 5. MINORIZÁLÓ FÜGGVÉNY ÉS AZ MM-ALGORITMUS egyes komponenst külön-külön maxmalzálunk. γ (k+1) Ha cklkus esetre nézzük, a cklkus algortmus maga s egy MM-algortmus, mvel a maxmalzálója Q k (γ (k+1) l(γ) -át a γ = (γ (k+1) Cklkus esetben nem mndg egyértelm, hogy mt értük egy algortmus terácóján.,..., γ (k+1) 1,..., γ (k+1) 1, γ, γ (k) +1, γ, γ (k) +1,..., γ(k) m ) -nak, amely mnorzálja,..., γ(k) m ) pontokban. 5.1. Iteratív algortmus a l(γ) maxmalzálására Vezessünk be egy kezdet paramétervektort: γ (1) /Dykstra(1956) taglal néhány lehet séget/ Habár a kezd pont jó megválasztása csökkent az általános számítás gényt, m most feltesszük, hogy γ (1) megválasztás tetsz leges. Ha mnden egyes komponensre külön-külön elvégezzük a maxmalzálást, a következ höz jutunk. Tehát a maxmalzálásnak a megoldása: γ (k+1) = W [ j γ (k) N j + γ (k) j ] 1 (10) W jelöl az játékos nyerésenek számát. N j = w j + w j a párosítások száma és j között. Ha az ered γ (k+1) vektor nem felel meg a γ(k+1) = 1 korlátnak, egyszer en újra kell normalzáln. Amelyknek már megvan a (k + 1). értéke, azt használhatom, frssíthetek vele. Ez vezet a cklkus MM-algortmus el állításához, melyet ha maxmalzálunk, a következ höz jutunk: ] 1 (11) γ (k+1) = W [ j< γ (k) N j + γ (k+1) j + j> γ (k) N j + γ (k) j Mndkét algortmus el állít egy olyan γ (1),..., γ (n) sorozatot, amely garantálja a konvergencát az egyetlen maxmum lkelhood becsléshez. Emellett l(γ (1) ),..., l(γ (n) { ) monoton növeked. Az l(γ (k) ) } sorozat monotontása mnden MM algortmusnak karaktersztkus tulajdonsága. Az MM-algortmus cklkus változata s örökl a konvergenca tulajdonságokat.

5.2. MM-algortmus haza pályára 15 5.2. MM-algortmus haza pályára A már el z ekben smertetett Haza pálya modell- nél az egyenl tlenség felhasználásával felépíthetünk egy egy mnorzáló függvényt a log-lkelhood függvényre. l(γ, θ) = m =1 m [ ] θγ γ j a j ln + b j ln θγ + γ j θγ + γ j j=1 ahol a j jelöl, hogy hányszor verte meg haza pályán j-t, és b j jelöl azt, hogy hányszor kapott k haza pályán j-t l. Legyen H = j a j az haza pályán aratott gy zelmek száma és W az csapat összes gy zelmének száma. Ezeket gyelembe véve a következ t írhatjuk föl: Q k (γ, θ) = H ln θ + m W ln γ =1 m =1 [ ] m (a j + b j )(θγ + γ j ) j=1 θ (k) γ (k) + γ (k) j Ez l(γ, θ)-t egy addtív konstans erejég mnorzálja, így a következ höz jutunk: (12) Q k (γ, θ) + [ l(γ (k), θ (k) ) Q k (γ (k), θ (k) ) ] l(γ, θ) A θγ szorzat el fordulása azt jelent, hogy a paramétereket nem tudja teljesen elkülöníten a mnorzáló függvény, am a függvény közvetlen maxmalzálását némleg problematkussá tesz. Habár, könny maxmalzáln Q k (γ, θ (k) )-t, mnt a γ függvényét és Q k (γ (k+1), θ)-át, mnt θ függvényét. Így konstruálhatunk egy cklkus algortmust erre az esetre. 5.3. MM-algortmus a Rao-Kupper-féle döntetlen esetére Itt a log-lkelhood: l(γ, θ) = 1 2 m =1 m j=1 { ( ) ( )} γ (θ 2 1)γ γ j 2w j ln + t j ln γ + θγ j (θγ + γj)(γ + θγ j ) (13) ellen. Itt t j = t j az a szám, ahányszor az és j versenyz k döntetlent játszottak egymás

16 5. MINORIZÁLÓ FÜGGVÉNY ÉS AZ MM-ALGORITMUS Használjuk az el z fejezet legels egyenl tlenségét. Ebb l megkonstruálhatjuk a következ t: Q k (γ, θ) = m =1 { ( m (w j + t j ) ln γ j=1 γ (k) γ + θγ j + θ (k) γ (k) j ) + t j ln(θ 2 1) } Ez mnorzálja l(γ, θ)-t a (γ (k), θ (k) )-ban. A paraméterek nem teljesen szeparáltak, de felváltva maxmalzálhatjuk Q k (γ, θ (k) ) -t, mnt γ függvényét, és Q k (γ (k+1), θ)-t, mnt θ függvényét. Ezzel egy cklkus MMalgortmushoz jutunk. Q(γ, θ (k) ) maxmalzálása γ-ra vonatkozóan adja: γ (k+1) = [ ] [ ( s j =j j γ (k) s j + θ (k) γ (k) j + θ (k) s j θ (k) γ (k) + γ (k) j )] 1 (14) Ahol s j = w j +t j az a szám, ahányszor az versenyz megverte, vagy döntetlent játszott j versenyz vel. Másodfokú egyenlet megoldásával maxmalzálhatjuk Q k (γ (k+1), θ)-t, am θ-ra vonatkozólag adja: θ (k+1) = 1 + 1 + 1 2C k 4Ck 2 ahol C k = 2 T m =1 j γ (k+1) γ (k+1) j (s j ) + θ (k) γ (k+1) j T a döntetlenek teljes száma az összes meggyelt összehasonlítás között. Az el bb egyenletet Rao és Kupper javasolta, bár k nem tártak föl mnden ebb l származó konvergenca tulajdonságot. A fent egyenletet módosíthatjuk úgy, hogy γ paramétert állandóan frssítjük, így elkészíthetjük a cklkus változatát.

5.4. MM-algortmus a Davdson-féle döntetlen esetére 17 5.4. MM-algortmus a Davdson-féle döntetlen esetére Erre a modellre alkalmazva a log-lkelhood-ot, a következ t kapjuk: l(γ, θ) = 1 2 m =1 m [ γ 2w j ln γ + γ j + θ θ ] γ γ j + t j ln γ γ j γ + γ j + θ γ γ j j=1 (15) mnorzált az rreleváns konstansg az (8) egyenl tlenségen keresztül: Q k(γ, θ) = 1 2 m =1 m 2w j ln γ + t j ln(θ γ γ j ) (2w j + t j )(γ + γ j + θ γ γ j ) j=1 γ (k) + γ (k) j + θ (k) γ (k) γ (k) j által. Habár a másodk γ γ j matt Q k (γ, θ) maxmalzálása nem könny, még akkor sem, ha θ-t rögzítjük a θ (k) pontban, ezért a továbbakban egy jól smert egyenl tlenséget hívunk segítségül. A számtan-mértan közép egyenl tlenség által fel tudjuk építen Q k (γ, θ) egy mnorzácóját. Ebben az általános formában az a számtan-mértan közép egyenl tlenség b l következk, hogy xw w x 0 -ra és w > 0 -ra és w = 1, ahol egyenl séget akkor és csak akkor engedünk meg, ha mnden x egyenl. Ha w 1 = w 2 = 1 2 -del elérjük: γ γ j γ 2 γ(k) j γ (k) γ j 2 γ(k) γ (k) j (16) Egyenl ség akkor van, ha γ = γ (k). Ezért Q k (γ, θ) -t mnoralzálja Q k(γ, θ), a (γ (k), θ (k) ) -ban.

18 5. MINORIZÁLÓ FÜGGVÉNY ÉS AZ MM-ALGORITMUS Q k (γ, θ) = 1 2 m =1 m 2w j ln γ + t j ln(θ γ γ j ) j=1 γ (k) θ(2w j + t j ) + γ (k) j + θ (k) γ (k) γ (k) γ (k) j (2w j + t j )(γ + γ j ) + γ (k) j + θ (k) γ (k) γ γ(k) j + γ j 2 2 γ (k) γ (k) j γ(k) γ (k) j A mnorzácó egy tranztív relácó. Q k (γ, θ) mnorzálja Q k (γ, θ)-t (γ(k), θ (k) -banban, és Q k (γ, θ) mnorzálja l(γ, θ)-t (γ(k), θ (k) -ban. Ekkor Q k (γ, θ) s mnorzálja l(γ, θ)-t (γ (k), θ (k) ) -ban. γ összetev most szeparáltak, és Q k (γ, θ (k) ) maxmalzácója γ-ra nézve: γ (k+1) = 2W + T m j=1 g j(γ (k), θ (k) ) Itt W az versenyz összes nyerésének száma, T pedg az versenyz összes döntelen játékának száma, és g j (γ, θ) = (w j + w j + t j )(2 + θ γ j /γ ) γ + γ j + θ γ γ j (17) Természetesen γ komponense lehetnek cklkusan frssítettek, ha a γ (k+1) nevez jét j< g j(γ (k+1), θ (k) ) + <j g j(γ (k), θ (k) ). Végül maxmalzáljuk Q k (γ (k+1), θ) -át, mnt θ függvényét. m θ (k+1) = 4T =1 m j=1 γ (k+1) (2w j + t j )(γ (k+1) + γ (k+1) j + θ (k) Ebben a modellben T az összes döntetlen számát jelöl. + γ (k+1) j ) γ (k+1) γ (k+1) j Davdson (1970) közel azonos okoskodást használ, mnt Ford az els feltételezés alapján vett bzonyításnál, a cklkus verzónál, csak egy enyhe különbséggel frssít θ-t. Ez garantálja az egyetlen maxmum lkelhood becslést. Láttuk, hogyan tudjuk alkalmazn az MM-algortmust a Bradley-Terry modell

19 néhány általánosítására. Ugyanazt a technkát alkalmazhatjuk arra a modellre s, ahol három versenyz t hasonlítunk össze. (Ezt kés bb tárgyaljuk.) Ezek az MM-algortmusok, mnt mnden MM-algortmus, garantáltan növeln fogják a log-lkelhood-ot mnden egyes terácós lépésben, de az MM-algortmusnak ez a monotontás tulajdonsága nem garantálja még, hogy ez az algortmus elvezet mnket a maxmum-lkelhood becsléshez. A következ részben a konvergenca vzsgálatával foglalkozunk. 6. Az MM-algortmus konvergencájának tulajdonsága Van ném bzonytalanság azt llet en, hogy mt s értünk egy algortmus konvergencáján. M tt most azt mondjuk, hogy egy algortmus konvergens, ha: γ = lm k γ (k) Ez sokkal szgorúbb denícó a konvergencára nézve ahhoz képest, amt néha látunk az rodalomban. Például Haste és Tbshran (1998) csak azt jegyzk meg, hogy lm k γ (k) létezk, és véges, ebb l következk, hogy az algortmus konvergens. M tt most két okból s az er sebb denícót fogjuk használn. El ször s γ végs értéke sokkal érdekesebb, mnt l(γ) végs értéke; másodszor pedg lm k l(γ (k) ) határértéke véges, ha l(γ) felülr l korlátos. Ha γ egyértelm en létezk, az érdekel mnket, ez hogyan tudná maxmalzáln l(γ)-t. Általánosságban ezt nem mndg lehet bzonyítan, hogy egy MM-algortmus által meghatározott paraméterek sorozata konvergál. Nem s beszélve a globáls maxmumról. McLachlan és Krshnan(1997) példát mutat olyan EM-algortmusra, amely vagy a nyeregponthoz konvergál, vagy egyáltalán nem konvergál. Ford (1957) az els feltételezés alapján mutat (11) egy olyan algortmusát, am konvergál az egyetlen maxmum-lkelhood becsléshez, és korábban Zermelo (1929) származtatott már egy hasonló eredményt. Erre az eredményre úgy teknthetünk, mnt egy sokkal általános-

20 6. AZ MM-ALGORITMUS KONVERGENCIÁJÁNAK TULAJDONSÁGAI abb tétel következményére. [Lange(1995)]. Ljapunov tétele 6.1. Tétel. Tegyük fel, hogy M : Ω Ω folytonos és l : Ω R derencálható, és γ Ω -ra l[m(γ)] l(γ). Egyenl ség csak akkor áll fenn, ha γ egy staconárus pontja l-nek, azaz ha a gradens 0 a γ -ban. Ekkor tetsz leges γ (1) Ω-ra a { γ (k+1) = M(γ (k) ) } sorozat bármely torlódás pontja egy staconárus pontja k 1 l(γ)-nak. Bzonyítás. l(γ (kn) ) l(m(γ (kn) )) = l(γ (kn+1) )... l(γ (k n+1) ). Ha n esetén l(γ (kn) ) tart l(γ )-hoz, l(m(γ (kn) )) pedg l(m(γ ))-hoz, de l(γ (k n+1) ) s l(γ )-hoz tart, akkor l(γ ) = l(m(γ )), tehát ebb l következk, hogy γ staconárus pont. Egy MM-algortmusra, a tételben szerepl M(γ) leképezés adott az algortmus egy terácója által, amely garantálja, hogy l[m(γ)] l(γ) legyen. Mnden egyes MMalgortmusról azt állítjuk, hogy M(γ) folytonossága vlágos. Az l[m(γ)] = l(γ) azt jelent, hogy γ egy staconárus pont. Ez abból következk,hogy a mnorzáló függvény derencálható, és ez az érnt je a log-lkelhood függvénynek az aktuáls terácóban. Tehát a mnorzáló függvény derváltja/érnt je megegyezk a log-lkelhood függvény érnt jével a staconárus pontban. Ebben az esetben a cklkus MM-algortmusnál M(γ (k) ) = γ (k+1), ahol a parcáls dervált nulla, ha csak az aktuálsat változtatjuk. Mndazonáltal M folytonossága vlágos, és csak akkor lehet, hogy l[m(γ)] = l(γ) legyen, ha számos MM terácóban γ-t változatlanul hagyjuk, am azt jelent, hogy γ staconárus pontja l-nek. Ha egyk terácóban mndent változtatunk, akkor mnden parcáls dervált nulla lesz. Így a Ljapunov-tétel alapján a cklkus MM-algortmusra s az MM-algortmus konvergenca tulajdonsága vonatkoznak. A Bradley-Terry modell MM-algortmusának konvergenca gazolására a következ a stratégánk: El ször s, megadunk egy elégséges feltételt a log-lkelhood függvény fels kompaktságára. Az l felülr l kompakt, ha mnden konstans c-re a {γ Ω : l(γ) c} halmaz egy kompakt részhalmaza Ω paramétertérnek.

21 Másodszor, újra paraméterezzük a log-lkelhoodot, és megaduk egy elégséges feltételt a újra-paraméterezett log-lkelhood függvény szgorú konkávságára. Míg a fels kompaktság azt jelent, hogy legalább egy torlódás pont megléte szükséges, addg a szgorú konkávság azt jelent, hogy legfeljebb egy staconárus pont kell, hogy legyen. Nevezetesen a maxmumhely. Ljapunov tétel éb l arra következtethetünk, hogy az MM-algortmus konvergens, független a kezd ponttól, és konvergál az egyetlen maxmum-lkelhood becsléshez. Szemben más algortmusokkal (pl. Newton-Raphson algortmus), az MMalgortmusban az átparaméterezés után az terácók sorrendje nem változk. Az újra paraméterezés nem tesz tönkre a mnorzácós tulajdonságokat vagy nem változtat a maxmumon. Sznte mnden log-lkelhood függvény, mely az el z fejezetben adott, fels kompakt, ha az els feltételezés teljesül. Kvételt képez a Haza pálya modell, amre er sebb feltevést kell alkalmaznunk. Másodk feltevés (Az els feltevés Ford feltevése volt) Vesszük a csapatok két lehetséges partícóját A halmazba és B halmazba soroljuk ket. Van olyan csapat, amelyk A halmazból megver valamely B halmazbel csapatot. Méghozzá olyanokat, akk haza pályán jászanak, és néhány A-bel csapat megver néhány B-bel csapatot úgy, hogy ekkor A van otthon. A következ lemma elégséges, de akár néhány esetben szükséges s lehet. Feltételek a lkelhood függvény fels kompaktságára : Lemma 1. Legyen Ω = {γ R m : γ > 0 m =1 γ = 1} A paramétertér Ω a (3) és a (7) log-lklelhoodjára, Ω {θ R : θ > 0} a (15) és a (12) log-lkelhoodjára, és Ω {θ R : θ > 1} a (13) log-lkelhoodjára. Az els feltevés alapján azt mondjuk, hogy megver j-t egy hármas összehasonlításban, ha el rébb áll a rangsorban, mnt j. (a) (3) és (7) lkelhoodja felülr l kompakt akkor és csak akkor, ha az els feltevés teljesül. (b) (13) és (15) klelhoodja felülr l kompakt, ha teljesül az els feltevés, és

22 6. AZ MM-ALGORITMUS KONVERGENCIÁJÁNAK TULAJDONSÁGAI legalább egy döntetlen van. (c) (12) log-lkelhoodja felülr l kompakt, ha teljesül rá a másodk feltevés. Az elégséges feltétel a fels kompaktságra a Haza pálya modell ben, nevezetesen a másodk feltevés, amely szokatlanul er s. Ez azt jelent, hogy mnden csapat legalább négyszer játszk. Otthon és degenben. Otthon nyer és veszít, majd degenben nyer és veszít. Ez négy mérk zést jelent mnden egyes csapat számára. A (b) és a (c) részben arról nncsen tudomásunk, hogy az elégséges feltételek egyben szükséges feltételek s lennének. Mnt ahogy már korábban tettük, most s újra paraméterezzük a modellt adott feltételek mellett, úgy, hogy a log-lkelhood függvény szgorúan konkáv volta megmaradjon. között. Legyen β = ln γ ln γ 1, megy 1-t l m-g. Az nverz függvény: γ = e β m j=1 eβ j létrehoz egy egy-egy értelm megfeleltetést { γ R m + : γ = 1 } és {β R m : β 1 = 0} A modellek tovább paramétere θ. Legyen φ = ln θ Megjegyzés: Az els lemmában az újraparaméterezés után az állítások gazak maradnak (a)-tól (c)-g. Mvel a paramétervektorokból el állított mnden olyan sorozat, mely közelít az eredet paramétertér határához, az közelít az újra paraméterezett tér határához s. Újra paraméterezés után az eredet, azaz az (2) -es Bradley-Terry modell a következ vé válk: logt [P ( játékos megver a j játékost)] = β β j (18) A logt kfejezés p és 1 p hányadosának logartmusát jelent. Az (2)-re elvégezzük az ellen rzést: P j = γ és 1 P j = γ j γ + γ j γ + γ j Ha ennek a kett nek a hányadosát vesszük, γ -t kapjuk. Ha ennek a hányadosnak γ j

23 vesszük a logartmusát, az pont a logtp j -vel lesz egyenl. A (3)-as képlet, ha újraparaméterezzük, a következ vé válk: l(β) = m m [ wj β w j ln(e β + e β j ) ] (19) =1 j=1 Mnt, ahogy Bradley és Terry a (18) -ban javasolja, a modellre lletszthetünk logsztkus regresszót, am annyt jelent, hogy 0 1 meggyelésünk van, az alapján, hogy nyert, vagy nem nyert az általunk meggyelt egyén. 0, ha nem nyert, 1, ha nyert. Mndezek alapján a nyerés valószín ségét szeretnénk felírn úgy, hogy logt (p j ) = c + β β j. Agrest (1990)-ben leírja, hogyan s történk mndez. Ha konstans tagot s tartalmaz a modell, akkor a modell specáls esetét, nevezetesen a Haza pálya modell t kapjuk, melyben haza pálya paraméterét a következ képp írhatjuk fel: φ = log θ az (4) -es képletb l mndaddíg, amíg a kszámítása helyesen denált úgy, hogy: logt (p j ) = log θ + β β j. A regresszóban a független változók a β és a β j, melyek úgy nevezett predktorok. A logsztkus regresszó nem alkalmazható a Bradley-Terry modell bármelyk más általánosítására azok közül, melyeket most tt tárgyalunk. A (19) -es képlet log-lkelhood-jának konkáv volta azonnal következk, mert logkonvex függvények halmaza (azok a függvények, melyek logartmus függvénye konvex) zártak az összedaásra nézve. A konkávtást a Hölder-egyenl tlenség felhasználásával tudjuk bzonyítan. Ennek a megközelítésnek a tovább el nye az, hogy elégséges feltételeket szolgáltat a a szgorú konkávtásra. Hölder-egyenl tlenség: ahol 1 p + 1 q = 1 fg 1 f p g q, Tekntsük a logartmust a Hölder-egyenl tlenség egyk formájában, poztív számokra c 1,..., c N és d 1,..., d N és p (0, 1), ekkor ln N k=1 c p k d1 p k p ln N c k + (1 p) ln k=1 N d k (20) k=1

24 6. AZ MM-ALGORITMUS KONVERGENCIÁJÁNAK TULAJDONSÁGAI Bzonyítás. ck d k ( c p k ) 1 p ( d q k ) 1 q cd 1 c p d q log c k d k 1 p log c p k + 1 q log d q k c p k d1 p k 1 c p k p d 1 p q k log c p k d1 p k 1 p log (c p k )p + 1 q log (d 1 p k ) q p = 1 p és q = 1 1 p, 1 p + 1 q = 1, így a következ t kapjuk: log c p k d1 p k p log (c p k ) 1 p + (1 p) log (d 1 p k ) 1 1 p Egyenl ség akkor és csak akkor áll fenn, ha olyan ξ > 0, melyre c k = ξd k k -ra. Egy log-lkelhood függvény λ paraméterrel denícó szernt konkáv, ha mnden paramétervektorára teljesül az, hogy α, β és p (0, 1), l[pα + (1 p)β] pλ(α) + (1 p)λ(β) (21) Szgorú konkávtásról beszélünk, ha α β esetén, és ett l a feltételt l függ az s, hogy a (21) -es képletben szgorú egyenl tlenségünk van-e, vagy nem. A (20) pedg a következ t jelent: ln[e pα +(1 p)β + e pα j+(1 p)β j ] p ln(e α + e α j ) (1 p) ln(e β + e β j ) (22) Így megszorozzuk a (22) -es egyenl tlenséget w j -vel és -re és j-re összegzünk. Ez

25 bzonyítja (19) log-lkelhoodjának konkávtását. A (20)-as képletben a Hölder egyenl tlenségére s lehet használn az egyenl ség feltételet. Ezekb l a származtatott feltételekb l következtethetünk az újra paraméterezett függvény szgorú konkávságára. Harmadk feltevés legyen. Ez egy enyhébb feltétel, am garantálja, hogy a log-lkelhood függvényünk konkáv Két nemüres halmazaba soroljuk a versenyz ket. Valamely versenyz t a másodk halmazból összehaonslítjuk valamely els halmazbelvel legalább egyszer. 2. Lemma Az újra paraméterezésb l adódóan (γ, θ) (β, φ), melyben β = ln γ ln γ 1 és φ = ln θ, és legyen Ω = {β R m : β 1 = 0}, a következ ket kapjuk: (a) Az (3) és az (7) log-lkehoodjanak újra paraméterezett változata szgorúan konkáv az Ω paramétertéren akkor és csak akkor, ha a harmadk feltevés teljesül. (b) A (13) újra paraméterezett változata szgorúan konkáv a Ω R + -on, és a (15) újra paraméterezett változata szgorúan konkáv az Ω R -en akkor és csak akkor, ha a harmadk feltevés teljesül, és legalább egyszer volt döntetlen s. (c) A (12) -as újra paraméterezett változata s szgorúan konkáv az Ω R -en, ha a harmadk feltevés teljesül, és van benne egy olyan hurok, hogy ( 0, 1,..., s = 0 ), úgy, hogy j 1 otthon játszk, és legalább egy összehasonlítás van közötte, és j között úgy, hogy 1 j s. Mvel a feltételezés bztosítja az els lemmában adott fels kompaktságot, ezért ez er sebb, mnt azok a feltételek, melyek bztosítják a szgorú konkávságot. A Ljapunovtétel magában foglalja azt, hogy mnden MM-algortmus (cklkus, vagy nem) garantáltan el állítja a paraméter vektoroknak olyan sorozatát, mely konvergál a maxmum lkelhood becsléshez, az els feltételezése mellett. 7. Több versenyz összehasonlítása Nem csak kett, vagy három versenyz t hasonlíthatunk össze egymással, hanem egyszerre többet s.

26 7. TÖBB VERSENYZŽ ÖSSZEHASONLíTÁSA Tekntsünk a Bradley-Terry modellnek egy olyan kterjesztését, melyben k 3 versenyz t hasonlítunk össze. Majd az összehasonlításokat véve alapul, eredményként felállítunk egy rangsort, a legjobbtól egészen a legrosszabbg. Ez a sztuácó merülhet fel például akkor, mnden bíró csak néhány bejegyzést lát a versenyz kr l, majd rangsorolja a látott bejegyzéseket. Marden (1995) készített egy alapos felmérést az lyen típusú modellr l. Tegyük fel, hogy adott m versenyz, és ket címkézzük 1-t l m-g. A {1,..., m} és A = {1,..., k} k m. Tegyük fel, hogy a versenyz k ndexeltek az A halmazbel rangsorral. Jelölje a kapcsolatot két versenyz között. A nyíl a Jobb helyen áll a rangsorban, mnt... relácót jelent. Például, ha az egyes játékos jobb, mnt a kettes, az egyest l, a kettes felé mutat a nyíl. A rangsorban nylván mndg a ksebb sorszámútól mutat a nagyobb sorszámú felé, hszen az els mndg jobb, mnt a másodk, a másodk mndg jobb, mnt a harmadk, és így tovább. Jelölje k k versenyz permutácójának halmazát. Adott A és néhány π k. A valószín ség, amt pedg hozzárendelünk a π(1) π(2)... π(k) eseményhez, a következ : P A [π(1) π(2)... π(k)] = k =1 γ π () γ π () +... + γ π (k) (23) Ezt az általánosítását a Bradley-Terry modellnek Marden (1995) Plackett-Luce modellnek nevezte, mvel el ször Plackett vezette be, 1975-ben. Ha csak három versenyz re tekntjük az összehasonlítást, a (23)-as képletben, az pont a Pendergrass-Bradley (1960) modellhez, azaz esetünkben a (7)-es képlethez vezet. Az A mnden részhalmazára, például {1, 2}-re értelmezhetünk olyat, hogy P A (1 2) mnthogy P A [π(1)... π(k)] π k :π 1 (1)<π 1 (2) Az összeg az {1,..., k} halmazból kapott mnden rangsor valószín sége, melyben 1 2, vagys, az els versenyz legy z a másodkat, lletve jobb nála, tehát

27 a rangsorban el rébb szerepel. Ideálsan, ennek a modellnek koherensnek kellene lenne ebben az esetben, különösen, hogy a rangsorolás valószín sége nem függ attól, hogy a versenyz ket melyk részhalmazból vettük. Feltételezzük, hogy így s el tudjuk készíten a modellt. Más szóval, ha (23) koherens, akkor az A ndexelése P A [π(1)... π(k)]-ben nem szükséges. Tehát azt akarjuk, hogy A-tól ne függjön a valószín ség. Ekkor a (23) valószín sége k versenyz összes olyan permutácója, hogy ha k-adk versenyz bármelyk helyen állhat, akkor az els t l a (k 1)-edk versenyz g a több mlyen sorrendben állhat. (23) valószín ségét úgy kapjuk, ha k darab permutácót összeadunk. A számláló szorzata az összes γ szorzata, amt kemelhetünk, így marad a nevez k szorzata, összesen k darab, amt összeadunk. A koherenca bzonyítása: Legyen A = {1,..., k}, mnt korábban, és kértékelése a következ : [ 1 P A (1... k 1) = γ 1...γ k 1 γ k + (γ 1 +... + γ k )...(γ k 1 + γ k )γ k + 1 (γ 1 +... + γ k )...(γ k + γ k 1 )γ k 1 +... ] (24) ahol az összeg k szempontjából megfelel a k különböz permutácóra k -ban. Az (1,..., k 1) sorrend változatlan marad. A (24)-es képlet leegyszer sítve a következ lesz: P A (1... k 1) = γ 1...γ k 1 (γ 1...γ k 1 )...(γ k 2...γ k 1 )γ k 1 = P (1,...,k 1) (1... k 1). A P A (1... k 1) részhalmazt helyettesíthetjük A bármely részhalmazával, k 1 elemmel, így a (25) -ös képlet használatánál az smétl dés szükségszer. Mnden B = {b 1,..., b l } A -ra fennáll a következ : (25) P A (b 1... b l ) = P B (b 1... b l ). (26) Így a modell koherens, ezért felhagyhatunk az A és a B halmaz ndexelésével,

28 7. TÖBB VERSENYZŽ ÖSSZEHASONLíTÁSA és egyszer en csak P (b 1... b l ) -t, vagy a rövdség kedvéért P (b)-t írunk. A versenyz k számát tartalmazza egy adott rangsor, de nem mnden rangsorban kell az összes versenyz nek szerepelne. A találkozókon mndg más és más csapatokat, versenyz ket hasonlítunk össze, melyb l a teljes szezon eredményet össze tudjuk kombnáln, így mnden csapatra, versenyz re kapunk egy becslést, akárk nyer. Rövden megemlítjük a (23) és Luce választás axómája között kapcsolatot. Az axóma kmondja, hogy mnden modellre, melyben játékos poztív valószín séggel megver j játékost, és a páronként összehasonlításban j, akkor P B ( nyer ) = P A ( nyer )P B (A részhalmazból valak nyer ), A B. (27) Luce (1959) megmutatta, hogy a (27)-es axmóma egyenl a következ állítással: P B ( nyer ) = γ j B γ j poztív érték γ paraméterekre. Nem nehéz látn, hogy a (23)-as képlet egyeln a (28)-as állítással. Marden rámutat, hogy a (23)-as képlet gazából a (28)-as állításból ered. Ha elképzelünk egy rangsorolás folyamatot úgy, hogy els nek választjuk a gy ztest, aztán a másodk helyezettet úgy, hogy a megmaradt játékosok között nézzük a legjobbat, és így tovább. Az ellenkez je azért következk, mert (23) esetén: (28) P A ( nyer ) = = π:π(1)= π:π(1)= P A [π(1)... π(k)] = γ γ 1 +... + γ k k j=2 γ π(j) γ π(j) + γ π(j+1) +... + γ π(k) = γ γ 1 +... + γ k Így a (23)-as képlet ekvvalens Luce választás axómájával, am magában foglalja a koherencát, a fent meghatározott értelemben. A (23)-as modell llesztéséhez használjuk a maxmum-lkelhoodot, smét konst-

29 ruálhatunk egy mnorzáló függvényt a (8) egyenl tlenség felhasználásával. Tegyük fel, hogy N rangsorból állnak az adatok, ahol a j-edk rangsor magában foglalja m j -t, ahol m j -vel azt fejezzük k, hogy hány versenyz t hasonlítottunk össze. 1 j N. Rendeljünk a versenyz khöz ndexeket a j-edk rangsorolásban, melyeket a következ képpen jelöljünk: a(j, 1),..., a(j, m j ), úgy, hogy a(j, 1) a(j, 2) a(j, m j ), és e szernt építsük fel a j-edk rangsort. Feltesszük, hogy a rangsorolások függetlenek, a log-lkelhood a következ képp írható fel: l(γ) = A (8)-es egyenl tlenséggel: Q k (γ) = N j=1 N j=1 m j 1 =1 m j 1 =1 [ m j ] ln γ a(j,) ln γ a(j,s) [ ln γ a(j,) s= mj s= γ a(j,s) mj s= γ(k) a(j,s) mnorzálja a log-lkelhood l(γ)-t γ (k) -ban konstans együttható erejég. A paraméterek szétválasztásával, és ] γ (k+1) t = w t N [ mj 1 mj ] 1 (29) j=1 =1 δ jt s= γ(k) a(j,s) kfejezéssel érhetjük el Q k (γ) maxmalzálását. t = 1,..., m, ahol w t azoknak a rangsoroknak a száma, melyekben a t-edk versenyz el rébb áll a rangsorban, mnt az utolsó, és δ jt = { 1 ha t {a(j, ),..., a(j, m j )} 0 máskülönben Más szóval δ jt fejez k azt az lehet séget, hogy t versenyz jobb rangot kap-e, mnt a j-edk rangsorban. A (29)-es a (10), sma Bradley-Terry modell általánosítása. A γ összetev t lehet cklkusan frssíten. Ebben az összefüggésben az els feltételezésnek akkor van értelme, ha tudjuk értelmezn azt, hogy versenyz megver a j játékost, és így rangja magasabb, mnt j rangja egy olyan rangsorban, mely mndkét játékost tartalmazza. Az 1(a) és

30 8. BRADLEY-TERRY MODELL R-BEN a 2(a) lemmához az els feltételezés szükséges és elégséges, a log-lkelhood függvény fels kompaktságára nézve. Mvel a harmadk feltételezés szükséges és elégséges a log-lkelhood függvény szgorú konkávságságára nézve, így újra paraméterezhetünk. β = ln γ ln γ 1. Arra a következésre juthatunk, hogy az MM-algortmus garantálja a konvergencát az egyetlen maxmum-lkelhood becsléshez, ha az els feltételezés fennáll. A Plackett-Luce modell lkelhoodjának meghatározására nem smerünk más algortmust, Plackett szernt csak numerkus módszerekkel lehet meghatározn a lkelhood maxmumát. 8. Bradley-Terry modell R-ben Egy valós példát tekntek, és ezt elemzem az R, statsztka program segítségével. Az R-ben a Bradley-Terry modellt könnyen nstallálhatjuk, és akár beépített adatokra s m ködtethetjük. (Újságok összehasonlítása, baseball meccsek eredménye találhatók a beépített változatban, de most nem ezekre hagyatkozom.) Jelen esetben fér vízlabda mérk zéseket nézek, Európa köztudottan négy élvonalbel csapatára, azaz Magyarországra, Szerbára, Horvátországra és Montenegróra. Az utolsó húsz mérk zés eredménye szolgál alapul mndegyk csapatnak(2010. 09. 11- t l vsszamen en 2008. 08. 10-g), mvel például a 2010-es zágráb Európa Bajnokságon nem játszottak egymással olyan sokszor, hogy érdemleges modellt fel tudjunk állítan rájuk, így belekerült a 2009-es róma vlágbajnokság, és a 2008-as pekng olmpa s a meggyelések közé. A 2010-es Európa Bajnokságon Zágrábban Horvátország lett az aranyérmes csapat. Tehát a haza pálya mnden számolás nélkül s nagy valószín séggel el nyt jelentett az otthonaknak. De vzsgáljuk meg részletesebben a modellt! A program m ködtetése: A R programba úgy kell beírnunk az adatokat, lletve betöltetnünk a vzsgálandó txt vagy xls fájlt, hogy az els oszlpoba írjuk a nyertes nevét, a másodk oszlopba a vesztes nevét, a harmadk oszlopba pedg azt, hogy azokon a mérk zéseken, mkor az adott két versenyz játszott egymással, az, amelyk a nyertes oszlpoban van, hányszor nyert. Mvel az R program Bradley - Terry modelljébe nncs beépítve a döntetlen

31 lehet sége, ezért a döntetlent úgy adjuk meg, hogy 1/2 1/2 meccs megnyerését számítjuk azoknál a csapatoknál, melyek döntetlent játszottak egymással. Ha gyelembe vesszük, hogy Magyarország és Montenegró egyszer játszott döntetlent egymással, és Magyarország csapata egyszer legy zte Montenegró csapatát, akkor a következ képpen alakul a felírásunk, és a modellünk: > vl <- read.table("g:/vzlabda.txt") > vl wnner loser Freq 1. Hungary Serba 1.0 2. Serba Hungary 2.0 3. Hungary Croata 0.0 4. Croata Hungary 0.0 5. Hungary Montenegro 1.5 6. Montenegro Hungary 0.5 7. Serba Croata 1.0 8. Croata Serba 2.0 9. Serba Montenegro 2.0 10. Montenegro Serba 0.0 11. Croata Montenegro 1.0 12. Montenegro Croata 2.0 > > > lbrary(bradleyterry) > vlmodel <- BTm(vl ~..) > vlmodel Call: BTm(formula = vl ~..) Coeffcents: