13. fejezet Centrális határeloszlás-tétel A valószínűségszámítás legfontosabb állításai azok, amelyek független valószínűségi változók normalizált összegeire vonatkoznak. A legfontosabb ilyen tételek a nagy számok törvényei és a centrális határeloszlás-tétele. Az első szerint független, azonos eloszlású változók számtani átlaga egy konstanshoz tart. Mi történik azonban, ha az összeget nem a tagok számával osztjuk? Ez a kérdés a valószínűségszámítás talán legjelentősebb problémája, amelyre többször vissza fogunk térni. Ebben a fejezetben feltételezzük, hogy a közös eloszlásnak van szórása, az általános eset vizsgálatát a következő fejezetekre hagyjuk. Ha feltesszük, hogy van szórás, és az összeget standardizáljuk, akkor az így kapott változó a standard normális eloszláshoz tart. Mivel független változók varianciája összegződik, ilyenkor a normalizáló konstans Az, hogy az összeget éppen -nel kell normalizálni, igen fontos! A centrális határeloszlás tétele statisztikai tétel, vagyis bizonyos, célszerűen megadott formulák határeloszlását megadó matematikai állítás, és nem természeti törvény. Ez a megjegyzés azért is fontos, mivel ez alapján a tétel általánosításai, a stabil eloszlásokhoz való konvergenciát leíró tételek, jóval érthetőbbek és természetesebbek, hiszen csak annyit mondanak, hogy ha nincsen szórás, akkor más normalizáló konstanst kell alkalmazni, és ilyenkor nem a normális eloszlást, hanem egy rokon eloszlástípust fogunk kapni. Ugyancsak hangsúlyozni kell, hogy a tétel eloszlásokról, és nem változókról, szól. Mivel a valószínűségszámítást az eloszlásokról szóló matematikai területetként definiáltuk, bizonyos értelemben joggal mondhatjuk, hogy a centrális határeloszlás-tétele a leginkább valószínűségszámítási tétel. 13.1. Egydimenziós határeloszlás-tételek Először a legegyszerűbb esetet vizsgáljuk, megmutatjuk, hogy tetszőleges független, azonos eloszlású, szórással rendelkező valószínűségi változók standardizált összege gyengén tart a normális eloszláshoz. Alapvetően támaszkodni fogunk a korábbi fejezetek eredményeire, nevezetesen arra, hogy ha eloszlások sorozatának karakterisztikus függvénye pontonként az Ü függvényhez tart, akkor az eloszlások sorozata gyengén tart az Æ µ eloszláshoz. 577
578 º ÆÌÊýÄÁË ÀÌýÊÄÇËÄý˹ÌÌÄ 13.1.1. Karakterisztikus függvény sorbafejtése A normalizáló konstans szoros kapcsolatban van az összeadandó váltózók Πܵ È Üµ farokeloszlásának nagyságrendjével. Az, hogy a változónak van szórása, tulajdonképpen a Î nagyságrendjére vonatkozó megkötés. Mivel a tételekben a farokeloszlások játszák a meghatározó szerepet, nem véletlen, hogy a tételek legegyszerűbb bizonyítása a Fourier-transzformációra épül. Miként folyamatosan hangsúlyozzuk, a Fourier-transzformáció lényege, hogy a Î végtelenben való nagyságrendje szoros kapcsolatban van a karakterisztikus függvény origóban való simaságával. º ÄÑѺ Ha a változónak létezik az Ñ-edik momentuma, akkor a ³ karakterisztikus függvényére Ñ µ ³ µ Å µñ µ Ñ ahol az függvényre fennállnak a és az Å Ñ µ összefüggések, tehát ³ µ ÐÑ µ (13.1) Ñ ³ µ µ Ó Ñ µ (13.2) Speciálisan, ha az eloszlásnak van szórása, akkor a karakterisztikus függvénye másodrendben közelíthető a Taylor-polinomjával. Bizonyítás: Tekintsük az Ü Ùµ Ó Ù Ù Taylor-polinomját: Ó Ù Ù Ù Ù Ù ÙÑ Ñ Ó Ñµ Ùµ Ùµ Ù Ù ÙÑ Ñ Ñµ Ùµ Ùµ ahol Ùµ és Ùµ Ebből Ü Ùµ Ù Ùµ Ùµ Ùµ ÙµÑ Ó Ñµ Ùµ Ùµ ѵ Ùµ Ùµ Ñ Vegyük észre, hogy a második sorban szereplő Lagrange-féle maradék Ùµ Ñ Ó Ùµ Ùµ Ùµ Ùµ Ñ
ºº ÁÅÆÁË ÀÌýÊÄÇËÄý˹ÌÌÄà 579 alakú, ahol a Ùµ illetve a Ùµ a Ùµ illetve a Ùµ értékek valamelyike. Az Ù µ értéket véve, majd mind a két oldal várható értékét képezve: ahol ³ µ Ñ µ Å µñ µ Ñ µ Å Ñ Ó µ µ µ µ µ Ha akkor a várható értékben szereplő kifejezés nullához tart. Mivel a feltétel szerint a -nek létezik az Ñ-dik momentuma, és ezért a Ñ integrálható, így az Ñ Ó µ µ µ µ Ñ becslés alapján a várható érték alatti kifejezésnek van integrálható majoránsa, és így a határérték bevihető az integrál mögé, vagyis 1 ÐÑ µ Å ÐÑ Ñ Ó µ µ µ µ 13.1.2. Azonos eloszlású független valószínűségi változók Legyen tetszőleges olyan eloszlás, amelynek létezik szórása, és legyen µ eloszlású, független változók sorozata. Jelölje a közös szórást, a közös várható értéket, Ë az első változó összegét, vagyis Ë È és tekintsük a standardizált Ë µ változót. Ha ³ jelöli az karakterisztikus függvényét, akkor ³ µ ³ Ü Az egyszerűbb jelölés céljából felthető, hogy A 13.1. lemma alapján ³ µ µ Ó Ó amiből ³ µ Ó 1 Vegyük észre, hogy a bizonyítás során azt is igazoltuk, hogy ha létezik az Ñ-edik momentum, akkor a karakterisztikus függvény Ñ-szer deriválható. Ha ezt tudjuk, akkor a (13.2) már teljesül, ugyanis ez tetszőleges Ñ-szer deriválható függvényre érvényes. Az, hogy egy Ñ-szer deriválható Ê Ê függvényre teljesül a (13.2) a legegyszerűbben úgy igazolhatjuk, ha észrevesszük, hogy az Ö Ñ Üµ ܵ Ì Ñ Üµ maradék első Ñ deriváltja az Ü pontban és az Ö Ñ Üµ Ü Ñ hányadosra Ñ µ-szer alkalmazzuk a l Hôpital-szabályt, majd az Ñ-edik lépésben felhasználjuk, hogy az Ö Ñ µ Ñ függvény a pontban deriválható.
580 º ÆÌÊýÄÁË ÀÌýÊÄÇËÄý˹ÌÌÄ Ha és akkor µ következésképpen, ha akkor minden -re tehát minden -re ³ µ Ó Ó ³ µ Ü vagyis a folytonossági tétel alapján érvényes a következő: (13.3) º Ìк Ë Þ Ö Ð ÖÐÓ ÞÐ ¹Ðµ Ha µ szórással rendelkező, független, azonos eloszlású változók egy sorozata, akkor az standardizált változó eloszlása gyengén tart az Æ µ eloszláshoz. º Èк A eloszlás közelítése normális eloszlással. Ha Æ µ akkor Å Å ezért amiből az È változó eloszlása gyengén tart az Æ µ eloszláshoz. Ebből következően, ha À jelöli a eloszlásfüggvényét, akkor elég nagy -re À ܵ È Ü È Ü Ü ahol a standard normális eloszlás eloszlásfüggvénye. º Èк A eloszlás közelítése normális eloszlással. Tekintsük a ܵ Û Ü folytonos függvényt, és Æ µ legyen az előző példában szereplő standardizált sorozat. A deriválható az pontban, tehát az Ü µ µ ٠ܵ Ü ha Ü µ ha Ü függvény folytonos. A Cramér-lemma 2 elemi verziója szerint, ha akkor Û 2 V.ö.: 15.2. lemma, 677. oldal.
ºº ÁÅÆÁË ÀÌýÊÄÇËÄý˹ÌÌÄà 581 Az Ù folytonos, tehát 3 Ù µ Û Ù µ µ Ugyancsak a Cramér-lemma szerint Û Ù µ µ Æ µ vagyis Ö Ö Ö Æ µ Ö Ö µ Û µ Æ µ ami másképpen Ha a eloszlásfüggvénye, akkor ܵ È Üµ È Û Æ µ Ü Ü Ebből ugyanakkor a À eloszlásfüggvényére a À ܵ È Ü È Ü Ü becslést kapjuk. º Èк Diszkrét bolyongás origóba való visszatéréseinek átlagos száma. Legyen Û µ az origóból kiinduló valószínűséggel értékkel változó bolyongás. A diszkrét Tanaka-formula 4 szerint Û Û µ Û Û Î ahol Î az időpontig az origóba való visszatérések száma. Mivel a centrális határeloszlás-tétel szerint Û Û Æ µ ezért 5 Û Û Æ µ 3 V.ö.: 11.56. állítás, 511. oldal. 4 V.ö.: 9.150. példa, 405. oldal. 5 V.ö.: 11.56. állítás, 511. oldal.
582 º ÆÌÊýÄÁË ÀÌýÊÄÇËÄý˹ÌÌÄ Ugyanakkor Û Û tehát a sorozat egyenletesen integrálható. A Szkorohod-reprezentáció következménye 6 miatt Û Å Å Æ µµ Ü Ü Ü Ü Ö A Tanaka-formulában az első tag martingál, és ezért a várható értéke nulla, tehát következésképpen Å Û µ Å Î µ Å Î µ Ö Például ha, akkor Å Î µ vagyis az időpontok kevesebb mint ±-ban lesz a bolyongás az origóban. º Èк Standardizált Poisson-eloszlás határértéke. A paraméterű Poisson-eloszlás karakterisztikus függvénye Ü Ü µ µµ és mivel az eloszlás várható értéke a szórása, ezért a standardizált változó karakterisztikus függvénye ³ µ Ü Ü Ü Ü Ü Ü µ Ó Ü Ó tehát ÐÑ ³ µ Ü º Èк A függetlenség helyett nem írható korrelálatlanság. 6 V.ö.: 11.30. következmény, 491. oldal.
ºº ÁÅÆÁË ÀÌýÊÄÇËÄý˹ÌÌÄà 583 Ha Šȵ µ akkor a Ó Üµ sorozat ortogonális, vagyis ha Ñ akkor Å Ñ µ Å µ Å Ñ µ és a változók eloszlása azonos, ugyanis tetszőleges -ra Ó Ü Ü Ó Ù Ù Ó Ü Ü így Meyer tétele 7 alapján tetszőleges Borel-halmazra È µ Ó Ü Ü Ó Ü Ü È µ Az (1.4) miatt amiből Å µµ ÑÑ µ ܵ ܵ È Å µµ ÑÑ és mivel a pontonként konvergenciából következik a gyenge konvergencia, ezért az nem tart a normális eloszláshoz. Fontos hangsúlyozni, hogy az Æ µ csak a gyenge konvergencia szerint teljesül, vagyis csak a változók eloszlására érvényes, és nem magukra a változókra. º ýðð º Nincs olyan normális eloszlású változó, amely az µ standardizált sorozat sztochasztikus konvergenciában vett határértéke, vagyis nincs olyan hogy ha akkor 8 ÐÑ È µ Bizonyítás: Megjegyezzük, hogy a centrális határeloszlás-tétel bizonyítása szempontjából érdektelen, hogy az egy rögzített µ sorozat részletösszeg sorozata, vagy hogy minden -re különböző µ azonos eloszlású, független változók összege. A bizonyításban egyedül csak annak volt szerepe, hogy az karakterisztikus függvénye azonos eloszlású változók karakterisztikus függvényének szorzata. A jelen állítás igazolására rátérve, ha az állítással ellentétben található lenne egy 7 Felhasználva, hogy a µ család korlátos. V.ö.: 2.42. példa, 45. oldal. Természetesen közvetlenül a nívóhalmazok vizsgálatából is egyszerűen belátható, hogy az eloszlások azonosak. 8 Az állítás némiképpen meglepő, ugyanis ellentmondani látszik a Szkorohod-reprezentációnak. Ugyanakkor nincsen ellentmondás, ugyanis a Szkorohod-reprezentáció szerint létező sorozat nem lesz független, azonos eloszlású változók normalizált összege. Ennek oka, például, hogy az eloszlások összegére nem érvényes a törlési szabály, stb.
584 º ÆÌÊýÄÁË ÀÌýÊÄÇËÄý˹ÌÌÄ amelyre È akkor az È is teljesülne. A sztochasztikusan konvergens sorozatok lineáris teret alkotnak 9, így ahol È Ez alapján È Másrészt azonban A centrális határeloszlás-tétel alapján, felhasználva a jelen bizonyítás elején tett megjegyzést, az és az karakterisztikus függvénye a Æ µ karakterisztikus függvényéhez tart. Az és a változók függetlenek, hiszen nem tartalmaznak közös összeadandót, így 10 ³ µ Ü Ü Ü vagyis az nem tart gyengén a Æ eloszláshoz, ami ellentmondás, mivel a sztochasztikus konvergenciából következik a gyenge konvergencia. 13.1.3. Véletlen tagszámú összegek A centrális határeloszlás-tétel nagyszámú általánosítása szinte átláthatatlan, és vizsgálatuk önálló matematikai területnek tekinthető. Az általánosítások egyik iránya a véletlen tagszámú összegekre vonatkozik. Az ilyen kiterjesztések közül a legegyszerűbb a következő 11 : º ýðð º Tegyük fel, hogy a µ sorozatnak van határeloszlása, vagyis alkalmas eloszlásra Û Ha µ a µ sorozattól független, Æ értékű változókból álló sorozat, amelyre akkor µ µ µ Û 9 V.ö.: 3.14. következmény, 117. oldal. 10 V.ö.: 11.47. következmény, 503. oldal. 11 Az állításban a kulcs feltétel, hogy az összegzésben szereplő tagszámokat megadó változók függetlenek az eredeti sorozattól!
ºº ÁÅÆÁË ÀÌýÊÄÇËÄý˹ÌÌÄà 585 Speciálisan, ha µ független, azonos eloszlású, szórással és várható értékkel rendelkező változók sorozata, akkor µ È µ µ µ µ Û Æ µ ahol, miként az állítás első felében, a µ olyan Æ értékű, a µ sorozattól független sorozat, amelyre Bizonyítás: Vezessük be a È µ valószínűségeket. A bizonyítás érdemi részeként meg fogjuk mutatni, hogy ha konvergens számsorozat, akkor ÐÑ (13.4) Ez, valamint a µ és a µ függetlensége alapján, ha Ü az folytonossági pontja, akkor È Üµ È Ü µ È Ü µ È Üµ È µ È Üµ ÐÑ È Üµ ܵ A (13.4) igazolása a következő. A È µ sorozatokat tekinthetjük a Ã Æ pontokra koncentrálódott reguláris valószínűségi mértékeknek. A à kompakt metrikus tér, ezért a È µ rendelkezik gyenge konvergenciában konvergens részsoro- zattal. A miatt tetszőleges Æ pontra ÐÑ következésképpen 12 Û a sorozatnak egyetlen torlódási pontja van Æ és így È Æ Az µ tekinthető a à téren értelmezett folytonos, korlátos függvénynek, következésképpen 13.1.4. Lokális alak Ã È Ã Æ A centrális határeloszlás-tétele az eloszlásfüggvények konvergenciáját vizsgálja. Milyen további feltételek mellett konvergálnak a sűrűségfüggvények? 12 Minden zárt halmazra teljesül a ÐÑ Ù È µ Æ µ ugyanis ha akkor Æ µ ha akkor a zártsága miatt a véges számú elemet tartalmaz, ezért ÐÑ Ù È µ
586 º ÆÌÊýÄÁË ÀÌýÊÄÇËÄý˹ÌÌÄ º Èк A gyenge konvergenciából általában nem következik a sűrűségfüggvények konvergenciája. Emlékeztetünk, hogy még egyenletesen konvergens sorozatokat sem lehet feltétlenül tagonként differenciálni. Tekintsük az ܵ Ó Ü Ü µ sorozatot. Ekkor, ha Ü µ akkor Ü Üµ Ó µ Ü Ü Ü Evidens módon az eloszlásfüggvény, és egyenletesen tart a -en sűrűségfüggvényhez tartozó eloszláshoz, de az sorozat majdnem mindenhol divergál 13. Ha a ³ integrálható, akkor érvényes a karakterisztikus függvényt és a sűrűségfüggvényt összekötő ܵ ³ µ Ü Üµ Ê inverziós formula. Ilyenkor az korlátos, folytonos függvény. A sűrűségfüggvények konvergenciájának igazolása az alábbi észrevételre épül: º ýðð º Ha az µ eloszlások ³ µ karakterisztikus függvényei integrálhatóak, az eloszlás ³ karakterisztikus függvénye szintén integrálható és ³ ³ Ê ³ µ ³ µ (13.5) akkor az µ eloszlások µ sűrűségfüggvényei egyenletesen tartanak az eloszlás sűrűségfüggvényéhez. Bizonyítás: Az inverziós formula alapján ܵ ܵ Ê Ü Üµ ³ µ Ê ³ µ ³ µ Ê Ü Üµ ³ µ º Èк Ha a karakterisztikus függvények konvergálnak, de a (13.5) nem teljesül, akkor a sűrűségfüggvények nem feltétlenül konvergálnak. 13 V.ö.: 3.36. példa, 129. oldal.
ºº ÁÅÆÁË ÀÌýÊÄÇËÄý˹ÌÌÄà 587 Legyen olyan páros sűrűségfüggvény, amelynek a ³ karakterisztikus függvénye pozitív 14. Tekintsük az Ó Ü Üµ ³ µ ܵ képlettel definált függvényt. Az nem negatív, és Ê Ê Üµ Ü ÊÊ Üµ Ü Ê Üµ Ó ÜÜ ³ µ ³ µ ³ µ következésképpen az egy eloszlás sűrűségfüggvénye. Az szintén páros, a karakterisztikus függvénye Ê ³ Ùµ Ê Üµ Ó Üµ Ó ÙÜÜ ³ µ Ê ³ Ùµ Ê Üµ Ó Ü Ó ÙÜÜ ³ µ A Riemann Lebesgue-lemma alapján ³ Ùµ Ê Ê Üµ Ó Ù µ Ü Ó Ù µ Üܵ ³ µ ³ Ùµ ³ Ù µ ³ Ù µ ³ µ ÐÑ ³ Ù µ ܵ Ó Ù µ ÜÜ Ê tehát ÐÑ ³ Ùµ ³ Ùµ de a koszinuszos tag miatt a ÐÑ Üµ határérték nem létezik. º ýðð º Ha az eloszlás ³ karakterisztikus függvénye nem negatív, akkor a ³ integrálhatóságának szükséges és elégséges feltétele, hogy az eloszlásnak legyen korlátos sűrűségfüggvénye. Bizonyítás: Az egyik irány része az inverziós formulának. Miként beláttuk, ha a ³ integrálható, akkor az -nek van korlátos sűrűségfüggvénye 15. Tegyük fel, hogy ³ Ê és hogy az -nek van korlátos sűrűségfüggvénye. Induljunk ki az ³ µ Ê Ü Üµ ܵ Ü definícióból. Az Æ µ eloszlás sűrűségfüggvényével beszorozva és integrálva Á Ê ³ µ Ü Ê Ê Ü Üµ ܵ Ü 14 Ilyen például a normális eloszlás sűrűségfüggvénye. 15 Ilyenkor a ³ -ra nincs szükség. Ü