Információgeometria a kvantummechanikában
|
|
- Pál Pap
- 8 évvel ezelőtt
- Látták:
Átírás
1 BME Matematikai Intézet Analízis Tanszék Andai Attila: Információgeometria a kvantummechanikában doktori értekezés Témavezető: Petz Dénes tudományok doktora, egyetemi tanár 003
2
3 i Tartalomjegyzék Előszó iii Bevezetés. Statisztikai alapok 5.. Fisher-féle információ Eloszlások rendezetlensége Eloszlások távolsága Majorizáció diszkrét eloszlásoknál Fisher-metrika a klasszikus esetben 3.. A diszkrét eloszlások Riemann-geometriája Geodetikusok A térfogat Taylor-sora A Fisher-metrika egyértelműsége Részsokaság skalárgörbülete A normális eloszlások geometriája Az eloszlások geometriai távolsága Kvantum-információgeometria A kvantummechanikai modell A kvantummechanikai formalizmus Állapotok entrópiája és majorizációja A Fisher-információ általánosítása Kvantummechanikai Fisher-féle információ Relatív entrópia Az állapottér geometriája 4.. Az állapottér skalárgörbülete A skalárgörbület monotonitásáról Petz sejtésének átfogalmazása Skalárgörbület a Kubo-Mori metrikánál A Petz sejtésében elért eredmények Skalárgörbület monotonitása a valós esetben Az M + tér skalárgörbülete lokális minimummal Az állapottér skalárgörbületének numerikus vizsgálata A térfogat Taylor-sorfejtése Jelölésgyűjtemény 05
4 ii Tárgymutató 09 Hivatkozások 3
5 iii Előszó Köszönettel tartozom témavezetőmnek, Dr. Petz Dénes Professzornak a munkám során nyújtott segítségéért. A téma kiválasztásában, alapjainak és aktuális eredményeinek a megismerésében, a témán belüli célok kijelölésében fontos szerepe volt. A felmerülő problémák, nehézségek leküzdéséhez sok segítséget kaptam a vele folytatott beszélgetések során. Segítsége nem csak a jelen értekezés elkészítéséhez volt nélkülözhetetlen, hanem az elért új tudományos eredmények szakszerű leírásának a módját is tőle tanultam. Köszönettel tartozom Dr. Tóth Jánosnak a kézirat gondos átolvasásáért, melynek során számos hibára hívta fel a figyelmemet. Végül szeretnék köszönetet mondani feleségemnek és szüleimnek, akik támogatásukkal segítették ezen értekezés megírását. Budapest, Kijelentem, hogy ezt a doktori értekezést magam készítettem, és abban csak a megadott forrásokat használtam fel. Minden olyan részt, amelyet szó szerint, vagy azonos tartalommal, de átfogalmazva más forrásból átvettem, egyértelműen, a forrás megadásával megjelöltem. A jelen értekezés bírálatai és a védésről készült jegyzőkönyv a későbbiekben a Budapesti Műszaki és Gazdaságtudományi Egyetem Természettudományi Karának Dékáni Hivatalában elérhetők.
6 iv
7 Bevezetés Az információgeometria nemkommutatív általánosítását szórványos kezdeményezésektől eltekintve az 990-es években kezdték kidolgozni. Ez a tudományterület, mint ahogy a neve is sugallja, a matematika meglehetősen különböző ágait használja eszközként. Az elsődleges alapot a statisztika és az információelmélet szolgáltatja. Bizonyos statisztikai modellek olyan Riemann-sokaságnak tekinthetők, amelyben a modell differenciálgeometriai jellemzői statisztikai jelentést nyernek. A statisztika és a differenciálgeometria ezen ötvözetét nevezik információgeometriának. Az 90-as években körvonalazódó kvantummechanika matematikai eszköztárában jelent meg a valószínűségszámítás újfajta, általánosabb megközelítése, melyet ma nemkommutatív valószínűségszámításnak neveznek. A klasszikus statisztikai modell fogalma, mely szorosan kapcsolódik a Kolmogorov-féle valószínűségszámítás fogalmaihoz, általánosítható a nemkommutatív valószínűségszámítás esetére is. Ezt az általánosított statisztikai modellt szintén Riemann-sokasággá lehet tenni. Az így nyert matematikai objektumok képezik a nemkommutatív információgeometria vizsgálatának tárgyát. A nemkommutatív információgeometria bemutatásához elengedhetetlen a matematika néhány fejezetének a nagyon vázlatos, célorientált, áttekintése. Főként a statisztika, a valószínűségszámítás, a differenciálgeometria és a funkcionálanalízis eszközeit fogjuk alkalmazni speciális esetekben. Ezen eszközök bemutatása során nem célunk a szükséges matematikai fogalmak és tételek legáltalánosabb formájának az áttekintése, megelégszünk azzal a fogalmi kerettel, melyet a nemkommutatív információgeometria kíván. Egy-egy tudományterületen jól ismert tételekhez nem írunk külön-külön referenciát, hanem a fejezetek elején található bevezetőben utalunk az adott tudományterület néhány alapozó jellegű angol, illetve magyar nyelvű irodalmára, ahol a tételek bizonyításokkal és további referenciákkal együtt fellelhetők. A bevezetett alapfogalmakat illetve tételeket gyakran egymásra épülő példákon keresztül mutatjuk be. Az előforduló példák végét a szimbólum jelöli, a bizonyításokét pedig. Az ábrák elkészítése és a numerikus szimulációk elvégzése a Maple matematikai program segítségével történt. A nemkommutatív információgeometria bizonyos területein elért újabb eredmények bemutatását három, előkészítő jellegű fejezet előzi meg. Az első fejezetben a statisztika és a klasszikus valószínűségszámítás azon alapfogalmait és eredményeit tekintjük át, melyeket a későbbiekben jól tudunk használni a nemkommutatív esetre való általánosításkor. Először a statisztikai modell fogalmát értelmezzük, majd példákon keresztül mutatjuk be a két főbb modelltípust, az exponenciális, illetve a kevert családot. Majd a statisztikai modellhez rendelt Fisher-féle információt definiáljuk, és áttekintjük a főbb tulajdonságait, többek között a paraméterbecslésben központi szerepet játszó Cramer Rao-tételt. Az entrópia definiálása után röviden P
8 megemlítjük a fizikában sokat használt maximálisentrópia-elv eredetét, és bemutatjuk egy alkalmazását, eljutva így a Gibbs-állapotok fogalmához. Az eloszlások közötti távolság fogalmát, az általánosított divergenciát tisztázzuk ezután, és megmutatjuk, hogy ez szorosan kapcsolódik a Fisher-féle információhoz. Végül az eloszlások rendezetlenségére utaló majorizációs relációt mutatjuk be, és számos ekvivalens feltételt adunk a reláció fennállására. A második fejezet célja a klasszikus információgeometria alapvető eszközeinek a bemutatása. Néhány példától eltekintve a sokaság mindig valamilyen statisztikai modell lesz a fejezet folyamán. A differenciálgeometriai alapfogalmak áttekintése után közelebbről megvizsgáljuk, hogy milyen kapcsolat van a Riemann-sokaságban lévő gömb térfogatának a sugár szerinti Taylor-sorfejtése és a sokaság görbületét jellemző paraméterek között. Majd megemlítjük Cencov tételét, mely szerint a diszkrét eloszláson alapuló statisztikai modellt statisztikailag releváns módon lényegében csak egyféle képpen lehet Riemann-sokasággá tenni. A részsokaság és a sokaság görbülete között fennálló kapcsolat lehetőséget teremt arra, hogy a statisztikai modellek görbületét egy újabb módszerrel is meghatározhassuk. Ezt közelebbről is megvizsgáljuk a diszkrét- és a normális eloszlás családjának az esetében. Majd egy újabb, geometriai eredetű, távolságfogalmat vezetünk be. A harmadik fejezet az információgeometria nemkommutatív kvantummechanikai általánosításról szól. A kvantummechanika és a matematikai modellje közti kapcsolatot bemutató első rész után a klasszikus valószínűségi eloszlást általánosítjuk, eljutva így a kvantummechanikai állapot fogalmához. Ezen állapotokra is értelmezhető az entrópiafüggvény és a majorizációs reláció, valamint a kvantummechanikai maximálisentrópia-elvből származtathatók a klasszikus esethez hasonlóan a kvantummechanikai Gibbs-állapotok. A statisztikai modell fogalma is egyszerűen definiálható a nemkommutatív esetben, azonban a Fisher-féle információ általánosítása már messze nem egyértelmű. Bemutatjuk az általánosítás néhány változatát, valamint a Cencovtétel kvantummechanikai megfelelőjét, a Petz-féle osztályozási tételt, mely szerint az állapottéren értelmezett statisztikailag releváns Riemann-metrikák bizonyos operátormonoton függvényekkel indexelhetők. Tehát míg a klasszikus esetben egyértelmű a Fisher-féle információ, addig a nemkommutatív esetben sok ilyen Fisher-féle információs mennyiség létezik. Ezek közül az irodalomban leggyakrabban előfordulókat részletesen megvizsgáljuk; és példákon keresztül mutatjuk be, hogy a klasszikus Fisherféle információhoz kapcsolódó egységes kép, hogyan aprózódik fel a nemkommutatív esetben: például a klasszikus esetben az entrópiafüggvény második deriváltjából is és a megfelelő dimenziójú gömbön értelmezett euklideszi metrikából is egyazon Riemannmetrikát lehetett származtatni a diszkrét statisztikai modelleken, addig a nemkommutatív esetben az első módszer a Kubo Mori-féle Riemann-metrikát adja, a második pedig a Wigner Yanase-féle Riemann-metrikát generálja mely metrikák Petz-osztályozási tétele szerint a klasszikus Fisher-féle információ releváns általánosításai, azon-
9 3 ban nem azonosak. Megemlítjük továbbá a Cramer Rao-egyenlőtlenség egyik általánosítását. A relatív entrópiát szintén ki lehet terjeszteni a nemkommutatív esetre, és a klasszikus esethez hasonlóan igazolható, hogy a második deriváltja Fisher-féle információs mennyiséget generál. Ezen relatív entrópiák bizonyos operátorkonvex függvényekkel indexelhetők, és többek között kiderül, hogy kölcsönösen egyértelmű megfeleltetés létezik bizonyos operátorkonvex függvények ekvivalenciaosztályai és a relatív entrópiák által generált Riemann-metrikák között. Továbbá tisztázzuk a nemkommutatív Fisher-féle információ, nemkommutatív relatív entrópia, az operátorkonvex és az operátormonoton függvények egymással való kapcsolatát. A negyedik fejezetben részletesen megvizsgáljuk a kvantummechanikai állapotok terének néhány differenciálgeometriailag fontos tulajdonságát, abban az esetben, ha Fisher-féle információnak megfelelő Riemann-metrikával látjuk el az állapotteret. Először a sokaság görbületi tenzorát határozzuk meg, valamint a belőle számolható skalárgörbületet. Ezen számítás során segítséget jelent, hogy a második fejezetben már meghatároztuk a többdimenziós normális eloszlások családjának a görbületét. Majd a skalárgörbület kiszámítása után Petz-sejtését, illetve a sejtés bizonyításában eddig elért eredményeket mutatjuk be. A sejtés szerint a kevertebb vagy kaotikusabb állapotban nagyobb az állapottér skalárgörbülete, ha az állapotteret a Kubo Mori-féle Riemannmetrikával látjuk el. Ennek az igazolását nehezíti, hogy a skalárgörbület kifejezése meglehetősen bonyolult formula. Petz-sejtése azonban nem igaz, ha az állapotok terét tetszőleges Fisher-féle Riemann-metrikával láthatjuk el, erre nézünk példát a legegyszerűbb, de még nem triviális kvantumállapotok terén. Majd a bonyolultabb állapottereken numerikus szimulációk segítségével elemezzük a skalárgörbület-függvény viselkedését az irodalomban gyakran előforduló Riemann-metrikák esetében. Végül az állapottérben lévő gömb térfogatának a sugár szerinti Taylor-sorfejtését határozzuk meg bizonyos metrikák esetén.
10 4
11 5. Statisztikai alapok A fejezetben azon statisztikai fogalmakat és alapvető tételeket tekintjük át, melyeket a későbbiekben jól tudunk használni a nemkommutatív valószínűségszámítás területén. A statisztikai definíciókat és tételeket olykor egyszerűsített formában említjük. Ez természetesen megszorítása az általánosabb statisztikai formalizmusnak, azonban a kvantummechanikai nemkommutatív esetre való kiterjesztésnél az itt bemutatandó statisztikai fogalmak és tételek bőven elégségesek lesznek. A statisztikából bemutatandó részek megtalálhatóak a bevezető jellegű statisztika könyvek nagy részében, például a magyar nyelvű [6, 7] könyvekben, vagy a további fejezetek olvasásához is segítséget nyújtó [, 3] könyvekben. Előszőr a vizsgálódásunk tárgyát a statisztikai modellt, definiáljuk, majd a modell Fisher-féle információját vizsgáljuk meg részletesen. Tételeken keresztül megmutatjuk, hogy a Fisher-féle információs mennyiség miként méri az információt, és milyen szerepe van a statisztikai paraméterbecslésben. Ezt követően a statisztikus fizikában sokat használt maximálisentrópia-elv eredetét, jelentését és példákon keresztül a használatát mutatjuk be. Majd az eloszlások közötti távolságfogalmat tisztázzuk, valamint az ilyen távolságjellegű függvények példáján keresztül igazoljuk, hogy a Fisher-féle információ ezen a területen is központi szerepet játszik. Végül a diszkrét eloszlásokon értelmezett majorizációs relációt mutatjuk be, és ekvivalens feltételeket adunk a reláció fennállására... Fisher-féle információ A statisztika és a valószínűségszámítás hatékony eszköz összetett, sokparaméteres rendszerek vizsgálatára. Az elméleti módszer egyik alapfogalma az eloszlásfüggvény. Az adott tudományterület elméleti háttere szolgáltatja a lehetséges eloszlásfüggvények halmazát. A rendszerből vett minták mérésével kiválasztható a vizsgálat szempontjából legmegfelelőbb eloszlásfüggvény az elméletileg adott halmazból. Különböző tudományterületekről származó lehetséges eloszlások halmazának az összefoglaló matematikai általánosítása a statisztikai modell... Definíció. Az S = X, BX, S, Ξ négyest statisztikai modellnek hívjuk, ha. X tetszőleges nem üres halmaz, és BX az X halmaz részhalmazainak valamely σ-algebrája,. S elemei valószínűségi mértékek a BX σ-algebrán, 3. létezik egy bijekció. i : Ξ S ϑ µ ϑ.
12 6. STATISZTIKAI ALAPOK A továbbiakban csak speciális statisztikai modellekkel foglalkozunk. Az alábbiakat követeljük meg a statisztikai modelltől.. Valamilyen pozitív egész m-re Ξ R m teljesül, továbbá Ξ összefüggő nyílt halmaz. Ekkor azt mondjuk, hogy S m-dimenziós statisztikai modell.. Ha az X alaphalmaz véges, akkor azonosítható valamilyen n természetes szám esetén az X n = {0,,..., n} halmazzal. Ekkor BX az X hatványhalmaza. Minden ϑ Ξ esetén µ ϑ S valószínűségi mérték az X n halmazon, melyet azonosítunk a p ϑ sűrűségfüggvényével. 3. Ha az X alaphalmaz végtelen, akkor azonosítható valamilyen n természetes szám esetén R n valamely összefüggő, nyílt részhalmazával. Ekkor BX a tér Borel-féle σ-algebrája. Továbbá minden ϑ Ξ esetén µ ϑ S olyan valószínűségi mérték az X halmazon, melynek létezik p ϑ sűrűségfüggvénye. 4. Az. leképezés indukál egy topológiát az S halmazon, ezért S-et topologikus térnek tekintjük. 5. A. és 3. pont miatt az S halmaz elemeire mint X-en értelmezett p ϑ ϑ Ξ sűrűségfüggvényekre hivatkozunk. Adott x X esetén a px, ϑ = p ϑ x jelölést használjuk. 6. Minden p ϑ S sűrűségfüggvénynek létezik az.,., és 3. momentuma. 7. Minden x X esetén Ξ R ϑ px, ϑ végtelen sokszor deriválható leképezés. A Ξ R m esetben, a i px, ϑ = px, ϑ ϑ i i =,..., m. rövidítést használjuk a ϑ i szerinti parciális deriváltakra. 8. Feltesszük, hogy a ϑ szerinti parciális deriválások, és az x szerinti integrálás sorrendje felcserélhető: i... ik px, ϑ d x = i... ik px, ϑ d x = i... ik = 0,.3 X ahol 0 < i,..., i k m a Ξ R m esetben. 9. Az S halmaz elemei szigorúan pozitív függvények, vagyis minden ϑ Ξ és minden x X esetén px, ϑ > 0 teljesül. X
13 .. FISHER-FÉLE INFORMÁCIÓ 7 A fentiek alapján X egyértelműen meghatározza a BX halmazrendszert, ezért csak X, S, Ξ-vel jelöljük a statisztikai modellt. Ezen megszorítások nagy mértékben megkönnyítik a statisztikai modellek differenciálgeometriai analízisét, azonban még mindig elég tág keretet jelentenek a gyakorlatban előforduló főbb modellek számára. Az eloszlások egy részét az alábbi két család valamelyikébe lehet sorolni... Definíció. Az mondjuk, hogy az X, S, Ξ n-dimenziós statisztikai modell exponenciális család, ha léteznek C, F,..., F n X-en értelmezett valós értékű függvények, τ : Ξ R n ξ τξ.4 leképezés és a Ranτ halmazon értelmezett ψ függvény, hogy minden p S felírható px, ξ = exp Cx + τ i ξf i x ψτξ.5 i= alakban. Ekkor a τ függvényt exponenciális- vagy kanonikus-, természetes- paraméterezésnek nevezzük. Ha bevezetjük a ϑ i = τ i ξ és az M = τξ jelölést, akkor mondhatjuk, hogy az S statisztikai modell a px, ϑ = exp Cx + ϑ i F i x ψϑ.6 i= alakú sűrűségfüggvények {px, ϑ ϑ M} halmaza. A definíció alapján és a px, ϑ d x = feltétel miatt X ψϑ = log exp Cx + ϑ i F i x X i= d x.7 teljesül, valamint {, F,..., F n } lineárisan független függvényhalmaz..3. Definíció. Az mondjuk, hogy az X, S, Ξ n-dimenziós statisztikai modell kevert család, ha léteznek C, F,..., F n X-en értelmezett valós értékű függvények, hogy minden p S felírható px, ϑ = Cx + ϑ i F i x.8 alakban. Ekkor a ϑ Ξ paraméterezést kevert paraméterezésnek nevezzük. i=
14 8. STATISZTIKAI ALAPOK.. Példa. Diszkrét eloszlás: Az alaphalmaz X = {0,,..., n}, a paramétertér { } Ξ = η,..., η n R n i {,..., n} : 0 < η i <, η i <..9 Legyen S az X halmazon értelmezett minden x X elemen szigorúan pozitív értéket felvevő sűrűségfüggvények halmaza. Ekkor X, S, Ξ statisztikai modell. Bevezetve a { ha x = 0 ha x = 0 C η x = i {,..., n} : F η i x = ha x = i 0 ha x 0, 0 egyébként.0 a függvényeket, látható, hogy a diszkrét eloszlások a kevert családba tartoznak, mivel az S halmaz a sűrűségfüggvények halmazával egyezik meg. px, η = C η x + i= {px, η η Ξ} Vezessük be a η i ϑ i η = log n k= η k mennyiségeket. Ekkor minden i X és η Ξ esetén i= η i F η i x.. teljesül. Bevezetve a C ϑ x = 0, ψϑ = log pi, η = + i= e ϑ i + n k= eϑ k e ϑ i, F ϑ i x = { ha x = i 0 ha x i függvényeket minden px, η S felírható px, η = exp C ϑ x + ϑ i ηf ϑ i x ψϑη i= alakban. Ezek szerint az X, S, Ξ statisztikai modell az exponenciális családba tartozik a ϑ kanonikus paraméterekkel. P
15 .. FISHER-FÉLE INFORMÁCIÓ 9.. Példa. Normális eloszlás: Az alaphalmaz X = R, a paramétertér Ξ = R R +. Az S halmaz elemei a px, µ, σ = x µ exp.6 πσ σ sűrűségfüggvények. Legyen τ : Ξ R R µ, σ ϑ, ϑ = leképezés, valamint Cx = 0, F x = x és F x = x. A ψϑ, ϑ = ϑ + 4ϑ log πϑ µ σ, σ.7.8 függvénnyel a normális eloszlás az exponenciális családba tartozik a ϑ, ϑ kanonikus paraméterekkel. Hasonló paraméterezéssel igazolható, hogy a többdimenziós normális eloszlás is az exponenciális családba tartozik. Egy X, S, Ξ n-dimenziós statisztikai modell esetén a Fisher-féle információ minden ϑ Ξ paraméternél egy n n-es mátrixot ad értékül..4. Definíció. Legyen X, S, Ξ n-dimenziós statisztikai modell. Adott ϑ Ξ pont esetén a Fisher-féle információs mátrix az az n n-es mátrix, melynek i, k-adik eleme g F ϑ ik = px, ϑ ipx, ϑ k px, ϑ d x..9 X P A későbbiekben g F ϑ jelöli a Fisher-féle információs mátrixot. A definíció alapján közel sem nyilvánvaló, hogy miért és miként mér információt a g F ϑ mátrix. Ennek egyik oka a formula nehezen értelmezhető szerkezete, a másik pedig, hogy az információ adott tudományterülethez tartozó mértékegységét, mérésének a módját nem egyszerű meghatározni. A g F ϑ mátrix tulajdonságai és a rá vonatkozó tételek viszont alapot adnak arra, hogy egyfajta információs mennyiségként értelmezzük. A Fisher-féle információs mátrixra az alábbi reprezentációkat fogjuk még használni: g F ϑ ik = px, ϑ i log px, ϑ k log px, ϑ d x.0 X g F ϑ ik = 4 i px, ϑ k px, ϑ d x.. X
16 0. STATISZTIKAI ALAPOK.. Tétel. Legyen X, S, Ξ n-dimenziós statisztikai modell. Azokban a ϑ Ξ pontokban, ahol a i p, ϑ i=,...,n függvények lineárisan függetlenek, a Fisher-féle g F ϑ információs mátrix pozitív definit. Bizonyítás. Legyen c,..., c n R n tetszőleges vektor. Ekkor c,..., c n, g F ϑc,..., c n = X px, ϑ c i i log px, ϑ d x 0.. A fenti egyenlőtlenség alapján g F ϑ pozitív szemidefinit. A tételben szereplő feltétel pedig garantálja, hogy a fenti egyenlőtlenségben az integrál után szereplő négyzet legalább egy x helyen pozitív legyen. A folytonossági feltételek miatt az integrál határozottan pozitív. Egy mérésekben rejlő információ mértékére természetes feltétel annak a megkövetelése, hogy ugyanazt a jelenséget mérve jobb, illetve rosszabb felbontású műszerrel, a rosszabb műszerrel való mérés esetén ne lehessen több információhoz jutni, mint a jobb műszerrel. Például, ha egy dobókockát vizsgálunk, akkor több információhoz jutunk, ha látjuk a dobott számot, mint ha csak azt tudjuk, hogy párosat vagy páratlant dobtunk. Ennek a természetes feltételnek a Fisher-féle információ eleget tesz. Legyen X, S, Ξ statisztikai modell és i= f : X Y x fx.3 szürjektív leképezés. Az f mérhető függvénnyel minden p S függvényt áttranszformálhatunk egy p : Y R y py, ϑ.4 függvénybe a A BX : A px, ϑ d x = összefüggés segítségével. Véges X halmaz esetén py, ϑ = x f y fa py, ϑ d y.5 px, ϑ.6 a transzformációs képlet. Jelölje f a p p leképezést. A Q = fs jelöléssel a Y, Q, Ξ hármas statisztikai modell, ez az X, S, Ξ modell f általi képe.
17 .. FISHER-FÉLE INFORMÁCIÓ.5. Definíció. Legyen X, S, Ξ statisztikai modell és f : X Y szürjektív leképezés. Tekintsük az r, : X Ξ R x, ϑ rx, ϑ = px, ϑ pfx, ϑ.7 függvényt. Az mondjuk, hogy f elégséges statisztikája az S modellnek, ha minden x X esetén az rx, : Ξ R ϑ rx, ϑ függvény állandó. Ha a definícióban szereplő f függvény bijekció, akkor f elégséges statisztikája az S modellnek... Tétel. Legyen X, S, Ξ statisztikai modell, f : X Y szürjektív leképezés és Y, Q, Ξ az f által indukált modell. A Fisher-féle információs mátrix ϑ Ξ paraméter esetén legyen az S modellen g F S ϑ és a Q modellen gf Q ϑ. Ekkor minden ϑ Ξ esetén g F ϑ gf ϑ.8 Q S teljesül. A gϑ = g F S ϑ gf Q ϑ információs veszteség log rx, ϑ log rx, ϑ g ik ϑ = px, ϑ ϑ i ϑ k d x..9 X Az egyenlőség a.8 pontban pontosan akkor teljesül, ha f elégséges statisztikája az S modellnek. g F Q A tételben szereplő g F Q ϑ gf S ϑ egyenlőtlenség jelentése, hogy a gf S ϑ ϑ mátrix pozitív szemidefinit. A tételt gyakran a Fisher-féle információ monotonitásaként említik. A fenti tétel kvantummechanikai esetre való általánosításánál nehézséget jelent, hogy a kvantumos esetben nincs jól értelmezhető X alaphalmaz. Ezért szükség lesz a fenti tétel átmenetvalószínűségekre vonatkozó megfogalmazására..6. Definíció. Legyen X R n és Y R m nyílt halmaz. Azt mondjuk, hogy a κ : Y X R x, y κy x.30 függvény az X halmazon értelmezett Markov-féle magfüggvény vagy átmenetvalószínűség, ha minden x X és y Y esetén κy x 0, továbbá minden x X esetén κy x d y =.3 Y
18 . STATISZTIKAI ALAPOK teljesül. Az X és Y véges halmazok esetén κ akkor átmenetvalószínűség, ha minden x X esetén κy x dy =.3 teljesül. y Y.3. Tétel. Legyen X, S, Ξ statisztikai modell, Y tetszőleges halmaz és κ : Y X R y, x κy x.33 átmenetvalószínűség. A py, ϑ = κy xpx, ϑ d x alakú sűrűségfüggvényekből álló X statisztikai modell legyen Y, Q, Ξ. Ekkor minden ϑ Ξ esetén g F Q ϑ gf ϑ..34 A gϑ = g F S ϑ gf Q ϑ információs veszteség pedig log rx, ϑ log rx, ϑ g ik ϑ = px, ϑ d x..35 ϑ i ϑ k X Az.. tétel egyszerű következménye a Fisher-féle információ additivitása. Ennek intuitív jelentése az, hogy ha két egymással nem kölcsönható részből álló rendszer tagjain végzünk független méréseket, akkor az összetett rendszerről nyert információ megegyezik a részekből nyert információk összegével..7. Definíció. Legyen X, S, Ξ és Y, Q, Ξ statisztikai modell. Jelölje S Q a S p : X Y Ξ R x, y, ϑ px, y, ϑ = p x, ϑp y, ϑ.36 alakú paraméteres sűrűségfüggvények halmazát, ahol p x, ϑ S és p y, ϑ Q. Ekkor az X Y, S Q, Ξ hármast az eredeti statisztikus modellek független szorzatának nevezzük. Az X, S, Ξ statisztikai modell önmagával vett n-szeres független szorzatát X n, S n, Ξ-vel jelöljük. Adott px, ϑ S esetén a p n : X n Ξ R x,..., x n, ϑ p n x,..., x n, ϑ = px, ϑ px n, ϑ.37 jelölést használjuk..4. Tétel. Legyen X, S, Ξ és Y, Q, Ξ statisztikai modell a g F S ϑ és a gf Q ϑ Fisher-féle információs mátrixszal. Jelölje g F SQ ϑ a X Y, S Q, Ξ statisztikai modell Fisher-féle információs mátrixát. Ekkor teljesül minden ϑ Ξ elemre. g F SQ ϑ = gf ϑ + gf ϑ.38 S Q
19 .. FISHER-FÉLE INFORMÁCIÓ 3 A Fisher-féle információ központi szerepet játszik a statisztikai paraméterbecslésben. Tegyük fel, hogy valamilyen rendszert a X, S, Ξ statisztikai modell jellemez. A rendszeren végzett mérések alapján szeretnénk megbecsülni a rendszer állapotát jellemző p S sűrűségfüggvényben szereplő ϑ paramétert. A rendszeren végzett mérést leíró X : X R m.39 függvényt mintának nevezzük. Az m = esetben számértékű a mérés végeredménye, egyébként vektorértékű. A rendszeren végzett k számú mérés alapján a rendszer állapotát meghatározó ϑ paraméter becslését egy ϑ : R m k Ξ x,..., x k ϑx,..., x k.40 függvény, a statisztika adja meg. A ϑ függvényt gyakran becslésnek vagy paraméterbecslésnek is nevezzük. Ha feltesszük, hogy a mérések egymástól függetlenek, akkor az x i mennyiségek független azonos eloszlású valószínűségi változók lesznek. Jelölje E ϑ ϑ a ϑ várható értékét a p k x, ϑ eloszlásra nézve, vagyis E ϑ ϑ = p k x, ϑ ϑx d x..4 X k A ϑ statisztikáról azt mondjuk, hogy torzítatlan, ha minden ϑ Ξ esetén teljesül. A E ϑ ϑ = ϑ.4 V ϑ ϑ ij = E ϑ ϑ Eϑ ϑ i ϑ E ϑ ϑ j =.43 = p k x, ϑ ϑx E ϑ ϑ i ϑx E ϑ ϑ j X k d x k k mátrixot a statisztika varianciájának nevezzük. A torzítatlan becslés varianciájára létezik egy alsó küszöb, mely a Fisher-féle információval fejezhető ki, ezt fogalmazza meg az alábbi tétel..5. Tétel. Cramer Rao: Legyen X, S, Ξ statisztikai modell, k tetszőleges természetes szám, jelölje g F a X k, S k, Ξ statisztikai modell Fisher-féle információját, legyen ϑ torzítatlan becslése a ϑ paraméternek, és jelölje V ϑ ϑ a becslés varianciáját. Ekkor minden ϑ Ξ esetén V ϑ ϑ g F ϑ.44 teljesül.
20 P 4. STATISZTIKAI ALAPOK.. Eloszlások rendezetlensége Egy f : R n R sűrűségfüggvénynek is értelmezhető a Fisher-féle információja természetes módon. Definiáljuk a f : R n R n R x, y fx, y = fx + y.45 paraméteres sűrűségfüggvényt. Ennek a Fisher-féle információja g ik y = R n fx, y fx, y y i fx, y y k d x..46 Ez a mennyiség független y-tól, tehát a Fisher-féle információ ekkor a g ik = R n px px px d x.47 x i x k mátrix. Az információnak, illetve a bizonytalanságnak másik fontos jellemzője a Boltzmannféle entrópia..8. Definíció. Adott f : X R sűrűségfüggvény entrópiája Sf = fx log fx d x,.48 X ha az integrál létezik és véges. használandó. Az fx = 0 esetben a 0 log 0 = 0 konvenció.3. Példa. Normális eloszlás: Az fx = σ x µ π e σ.49 sűrűségfüggvényű normális eloszlás Fisher-féle információja g F = R fx d fx d x d x = σ,.50 entrópiája pedig Sf = log σ + log πe..5
21 .. ELOSZLÁSOK RENDEZETLENSÉGE 5 Mivel az entrópia és az abból származtatott mennyiségek központi szerepet fognak játszani a későbbiekben, érdemes röviden megemlíteni, hogy milyen fizikai kontextusban vezették be az entrópia fogalmát. A fizikában jóval Shannon előtt Boltzmann vezetett be egy H funkcionált, melyet entrópiának nevezett, és amelynek képlete formálisan megegyezik a Shannon-entrópiával. Miután az információ mérésében Shannon hasznosnak találta a i p i log p i mennyiséget, Neumann tanácsára adta neki szintén az entrópia nevet. Precízen külön kellene Boltzmann- illetve Shannon-entrópiáról beszélni. 87-ben Boltzmann levezette a róla elnevezett transzportegyenletet, mely a gázban lévő molekulák eloszlására vonatkozik. Nemrelativisztikus kinetikával mozgó és azonos molekulákból álló gázra vonatkozik, ahol elhanyagolható a molekulák között ható erő. Az fr, v, t N függvény az N molekulából álló gázban a molekulák számának r helytől, v sebességtől és t időtől függő eloszlásának a sűrűségfüggvénye. Adott u, v R 3 vektorok esetén jelölje αu, v a vektorok által bezárt szöget, σα a molekulák ütközésénél fellépő differenciális hatáskeresztmetszetet, F a molekulákra ható külső erőt, m egy molekula tömegét és N a molekulák számát. Ekkor fr, v, t + v t grad fr, v, t + F m grad v fr, v, t.5 = N... σαv v, v v v v fr, v, tfr, v, t fr, v, tfr, v, t d α d v a Boltzmann-féle transzportegyenlet, ahol a v, v sebességgel teljesen rugalmasan ütköző molekulák sebessége v illetve v az ütközés után. Tegyük fel, hogy a gázra külső erő nem hat F = 0. Ebben az esetben az f eloszlásfüggvény független a helytől és az fv, t = N... σαv t v, v v v v.53 fv, tfv, t fv, tfv, t d α d v egyenleteknek tesz eleget. A gáz állapota az egyensúlyi esetben nem változik. Az egyensúlyt jellemző f 0 eloszlás az 0 =... σαv v, v v v v f 0 v f 0 v f 0 v f 0 v d α d v.54 egyenletből határozható meg. Vezessük be a H f t = fv, t log fv, t d v.55
22 6. STATISZTIKAI ALAPOK funkcionált. Ekkor az alábbiakat állíthatjuk.. A ekvivalencia teljesül. d H f t d t = 0 f = f Minden f eloszlás esetén d H f t d t Fennáll a reláció. lim t fv, t = f 0v.58 A fenti állításokat összefoglalóan Boltzmann-féle H-tételként említik. Az. és a. pont adja az alapját a termodinamika második főtételének, melynek egyik megfogalmazása szerint a magára hagyott rendszer entrópiája nem csökken. A 3. pont megegyezik azon fizikai tapasztalattal, mely szerint a kezdetben rendezetlen gázban idővel kialakul az egyensúlyi maximális entrópiájú helyzet. Ezek az észrevételek adják az alapját a maximális entrópia elvének, mely szerint ha egy rendszer bizonyos mérhető paraméterei többféle eloszlásfüggvényből származhatnak, akkor a rendszer már kialakult egyensúlyi állapotát az az eloszlásfüggvény írja le, amelynek az entrópiája maximális..4. Példa. Gibbs-eloszlás: Tegyük fel, hogy egy rendszerben n-féle energiaállapot van E i i n pozitív energiaszintekkel, és léteznek különböző nagyságú energiaszintek. Tegyük fel továbbá, hogy a rendszerben lévő részecskék átlagos energiája E, és ez az érték a legnagyobb, illetve a legkisebb energiaszint között van, vagyis min E i < E < max E i.59 i n i n teljesül. Kérdés a részecske energiaszintenkénti eloszlása, vagyis a p i i n értékek, ahol p i jelöli a részecske E i energiaszinten való tartózkodásának a valószínűségét. A maximális entrópia elve szerint az S : R n R p,..., p n p i log p i.60 i= függvény maximumát keressük az n i= p i = és a n i= E ip i = E feltételek mellett.
23 .. ELOSZLÁSOK RENDEZETLENSÉGE 7 A feltételes szélsőérték tétele kimondja, hogy ha f : R n R folytonosan differenciálható függvény, g 0,..., g l : R n R folytonosan differenciálható függvények, és az f függvénynek lokális szélsőértéke van a G = l i=0 g i 0.6 halmaz a G pontjában, továbbá, ha a g ia i=0,...,l vektorok lineárisan függetlenek, akkor léteznek egyértelműen olyan λ i i=0,...,l számok, hogy teljesül. Az S entrópiára, valamint a g 0 : R n R g : R n R f a = l λ i g ia.6 i=0 p,..., p n p,..., p n p i.63 i= E i p i E függvényekre alkalmazva a feltételes szélsőérték tételét, azt mondhatjuk, hogy a p,..., p n pontban, akkor lehet feltételes szélsőértéke S-nek, ha léteznek olyan λ 0, β számok, hogy log p,..., log p n = λ 0,..., + βe,..., E n.64 teljesül. A g 0 p,..., p n = 0 feltétel alapján a λ 0 = log k= e βe k egyenletet kapjuk. Vagyis minden i =,..., n esetén i=.65 p i = e βe i n k= e βe k.66 alakba írható. A g p,..., p n = 0 feltételből határozható meg β értéke. Ehhez pozitív k értékekre definiáljuk az Ei k e βe i ME k : R R β i= i= e βe i.67
24 8. STATISZTIKAI ALAPOK függvényt, mely az energia p 0,..., p n eloszláshoz tartozó k-adik momentuma. Ekkor ME az energia várható értéke. A lim MEβ = max E i β i n lim MEβ = min E i.68 β i n határértékek és a ME függvény monoton fogyását igazoló d MEβ d β = MEβ ME β 0.69 egyenlőtlenség alapján pontosan egy olyan β paraméter lesz, mely kielégíti a g feltételt. Hátra van még annak igazolása, hogy az.66 képlettel értelmezett valószínűségek esetén az entrópiának maximuma van. Legyen q,..., q n olyan eloszlás, mely teljesíti a g 0 és g feltételt. Ekkor bevezetve az r i = q i p i mennyiségeket az Sp,..., p n Sq,..., q n = p i r i log r i r i +.70 i= összefüggés, valamint a pozitív számokon értelmezett x x log x x + függvény pozitivitása miatt kapjuk, hogy a.66 képlettel megadott p i i n eloszlás esetén lesz az entrópiának maximuma. Fizikai alkalmazásokban β =, ahol k jelöli a Boltzmann állandót és T az abszolút kt hőmérsékletet. Az.67-ban definiált ME függvény monotonitása és β = 0 helyen felvett értéke alapján a következőt érdemes megfigyelni. A T hőmérséklet pontosan akkor pozitív, ha E i < E,.7 n pontosan akkor negatív, ha n i= E i > E,.7 i= és pontosan akkor nem értelmezhető végtelen, ha n E i = E.73 i= teljesül. Ezen megfigyelés alapján egy rendszernek lehet negatív hőmérséklete, melyet nem az elérhetetlen abszolút zérus ponton való túlhűtéssel, hanem a végtelen nagy hőmérsékleten keresztül lehet elérni. Ezt igazolja, hogy T < 0, T > 0 hőmérsékletű rendszerek kölcsönhatása esetén a kialakult közös T hőmérsékletre T < T vagy T > T
25 .. ELOSZLÁSOK RENDEZETLENSÉGE 9 teljesül. Ilyen negatív hőmérsékletű rendszereket fizikailag elő lehet állítani, bővebben lásd a [6] könyv 73. fejezetét. Érdemes megemlíteni, hogy a p,..., p n eloszlás entrópiájára Sβ β = βme β MEβ.74 teljesül, vagyis pozitív hőmérsékleti tartományon a rendszer rendezetlensége entrópiája nő a hőmérséklet emelkedésével. P Adott E i i n energiaszintekhez és β paraméterhez definiáljuk a R β e βe E i i n =,..., e βe n n i= e βe i n i= e βe i.75 Gibbs-féle valószínűségi eloszlást. A fenti példa gondolatmenete általánosabb esetben is végigkövethető. Tekintsük az X n = {0,..., n} véges halmazt, és legyen X n, M, Ξ az X n alaphalmazú diszkrét eloszlásból álló statisztikai modell. Lásd az.. példát. Legyenek továbbá k n esetén F,..., F k : X n R tetszőleges függvények. Az F i függvények az adott x X n állapotok különböző fizikai paramétereit írják le. Jelölje S az k px, ϑ = exp ϑ i F i x ψϑ.76 i= alakú eloszlások halmazát. Ekkor S M teljesül. Adott a R k vektorra legyen M a azon M-beli eloszlások halmaza, melyre az F i mennyiségek várható értéke a i, vagyis { } M a = q M i {0,..., k} : qx, ηf i x = a i..77 x X n Tegyük fel továbbá, hogy az S M a halmaz nem üres és p S M a. Ekkor max Sq = Sp.78 q M a teljesül, vagyis adott várható értékű eloszlások közül az exponenciális családban lévőnek lesz maximális az entrópiája. A maximálisentrópia-elv értelmében ez azt jelenti, hogy a fizikai rendszer legvalószínűbb egyensúlyi állapota az S exponenciális családban van. További, maximális entrópia elvének megfelelő példákat lehet hozni a fizikában szereplő X, S, Ξ statisztikai modellekre. Diszkrét eloszlások esetén, az entrópia függényből is származtatható a Fisher-féle információ.
26 0. STATISZTIKAI ALAPOK.5. Példa. Tekintsük az.. példában bevezetett diszkrét eloszlást. Az entrópia függvény ekkor S : Ξ R p 0, p,..., p n = p i log p i..79 i=0 Használjuk ki, hogy az entrópia csak a p,..., p n értékektől függ, hiszen ekkor p 0 = p p n..80 Az R n+ azon elemeit, melyre x 0 + x + + x n = 0 teljesül jelölje X n+. Az x X n+ vektornál szintén csak az x,..., x n paraméterekkel foglalkozunk. Az entrópia k-adik parciális deriváltja k =,..., n k Sp,..., p n = k p + + p n log p p n = log p p n log p k. p i log p i i=.8 Ez alapján az entrópia deriváltjára ds : Ξ LinX n+, R p x dspx.8 dsp,..., p n x 0,..., x n = i= x i log p p n log p i teljesül. Az entrópia másodrendű parciális deriváltja k, l =,..., n l k Sp,..., p n = l log p p n log p k = δ kl +. p k p p n Ezek alapján az entrópia második deriváltját az d S : Ξ LinX n+ X n+, R p x, y d Spx, y d Sp,..., p n x 0,..., x n, y 0,..., y n = i,j= x i y j δ ij + p i p p n alakban lehet felírni. Vagyis az x i y j tag együtthatója éppen a Fisher-féle információs mátrix i, j-edik tagjának a -szerese. Tehát az entrópia második deriváltja minden p Ξ pontban azonosítható a Fisher-féle információs mátrix -szeresével. P
27 .. ELOSZLÁSOK RENDEZETLENSÉGE A továbbiakban néhány általános megjegyzést teszünk egy eloszlás Fisher-féle információjának és Shannon-entrópiájának a kapcsolatáról. Fontos azonban kiemelni a leglényegesebb különbséget, hogy a Fisher-féle információt statisztikai modellekre is értelmeztük, míg az entrópiát eloszlásokra.. Egy eloszlás Fisher-féle információja szigorúan pozitív mennyiség, míg entrópiája tetszőleges valós szám lehet. Az információ mértékéül szolgáló pozitív menynyiséget könnyebb értelmezni, mint a rendezetlenséget meghatározó entrópiát. Diszkrét eloszlások esetén az entrópia is szigorúan pozitív mennyiség.. A p egyváltozós sűrűségfüggvény esetén a Fisher-féle információ a d px g = 4 d x.85 R d x alakot ölti. A qx = px mennyiséget Fisher valószínűségi amplitúdófüggvénynek nevezte el, és fontos szerepet tulajdonított neki. Az L = 4 qx.86 mennyiséget Lagrange-sűrűségként értelmezte, majd az elméleti fizikában megszokott Lagrange-formalizmust általánosította a fizikai információelméletre, bevezetve a potenciális energia információelméleti megfelelőjét. Érdemes megemlíteni, hogy Fisher komplex valószínűségi amplitúdó függvényeket vizsgálva írta fel a L m = C ψ ψ.87 típusú mozgási energiát tartalmazó Lagrange-sűrűséget, melyet vele egy évben, 96-ban, Schrödinger a kvantummechanikai állapotot jellemző ψ függvényre vezetett be. 3. A maximális entrópia elvének megvan a Fisher-féle információval leírható megfelelője. Ezek szerint magárahagyott rendszernek csökken az információtartalma. Vagyis ha egy rendszer állapotának t időbeli változását valamilyen f t sűrűségfüggvény írja le, és minden t időpillanatban gf t jelöli az f t sűrűségfüggvény Fisher-féle információját, akkor d gf t d t 0.88 teljesül [33].
28 . STATISZTIKAI ALAPOK A Fisher-információ további és mélyebb fizikai alkalmazásait mutatja be a [34] könyv. Végül említsük meg, hogy Fisher információelmélethez szorosan kapcsolódó statisztikai vizsgálódásai [30, 3, 3] évtizedekkel Shannon első munkái előtt kezdődtek..3. Eloszlások távolsága A statisztika és a valószínűségszámítás különböző tudományterületeken való alkalmazása során komoly problémát jelent a megfigyelt eloszlások közötti eltérés vagy másképp fogalmazva, távolság fogalmának a tisztázása. A távolságnak a releváns értelmezése függ a tudományterülettől. Például az antropológiában [9], a genetikában [7], a ökológiában [90] és a mintázatfelismerésben [] más-más távolságfogalmakat értelmeznek az eloszlások között. Az eloszlások közötti távolság általában nem szimmetrikus függvény. Gyakorlati alkalmazások esetén ez érthető, hiszen egy rendszer állapotának a megváltoztatása lehet, hogy kevesebb vagy több fáradságba kerül, mint a visszaállítása. A matematikai megfelelője ezen távolságfogalmaknak a divergencia..9. Definíció. Legyen X, S, Ξ statisztikai modell. A D : S S R p, q Dp, q.89 leképezést általánosított kontrasztfüggvénynek vagy általánosított divergenciának nevezünk, ha minden p, q S esetén Dp, q 0, valamint Dp, q = 0 pontosan akkor teljesül, ha p = q. A D általánosított divergencia távolságjellegű függvény, azonban nem követeljük meg tőle a szimmetrikusságot és a háromszög-egyenlőtlenség teljesülését. Az információelméletben és a statisztikában többféle általánosított divergenciát alkalmaznak.
29 .3. ELOSZLÁSOK TÁVOLSÁGA 3 Kullback Liebler-féle [59]: D KL p, q = Hellinger-féle [50]: D H p, q = X X px log px qx d x.90 px qx d x.9 px χ : D χ p, q = px d x.9 X qx α ], [ számra: D α p, q = 4 [ ] px α +α α qx d x.93 X Bhattacharyya-féle [5]: D B p, q = pxqx d x.94 Harmonikus: X D Ha p, q = Jeffreys-féle [54]: D J p, q = Háromszög [03]: D p, q = Lin Wong-féle [65]: D LW p, q = X X X pxqx px + qx d x.95 px qx log px qx d x.96 X px qx px + qx px log d x.97 px px + qx d x.98 Ezek a mennyiségek, az eloszlások közötti távolság fogalmának a különböző megközelítéseiből származtathatók. Például a D KL p, q mennyiség azt fejezi ki, hogy mennyi információt nyerhetünk a p eloszlásból származó megfigyelésből ahhoz, hogy úgy döntsünk, hogy megfigyeléseink a p eloszlásból származnak és nem a q eloszlásból; azaz mennyi információ különbözteti meg a p eloszlást q-tól [60]. Az eloszlások között bevezetett eltérések nagy részét egy alkalmas függvény segítségével általánosan lehet kezelni. Legyen az f : R R függvény szigorúan konvex a pozitív számok halmazán és legyen f = 0. Az X, S, Ξ statisztikai modellen a qx D f p, q = pxf d x.99 px X függvényt Csiszár-féle f-divergenciának [, 3] nevezzük. Minden c R paraméterre D fu = D fu+cu teljesül, továbbá bevezetve az f \ u = ufu függvényt D f p, q = D f \q, p..00
30 4. STATISZTIKAI ALAPOK Legyen α R és f α : R R x 4 α x +α ha α ± x log x ha α = log x ha α =.0 függvény. Ekkor D f = D KL, D f0 = D H, továbbá α ± esetén D fα = D α teljesül. Az f x = x és az f x = x esetben D f = D χ és D f = D H teljesül. Az fent definiált divergenciák között számos egyenlőtlenség írható fel, például [0] D Ha p, q exp D Jp, q.0 D Ha p, q 4 D Jp, q.03 D p, q D J p, q D χ p, q + D χq, p.04 A D f Csiszár-féle f divergenciának hasonló monotonitási tulajdonsága van, mint a Fisher-féle információnak, és a két változójában együttesen konvex..6. Tétel. Legyen p, q : X R két sűrűségfüggvény, Y halmaz és κ : X Y R átmenetvalószínűség. Legyen py = κy xpx d x, qy = κy xqx d x és X X D f Csiszár-féle f-divergencia. Ekkor teljesül. D f p, q D f p, q Tétel. Legyen p, p, q, q : X R sűrűségfüggvény, 0 λ paraméter és D f Csiszár-féle f-divergencia. Ekkor teljesül. D f λp + λp, λq + λq λd f p, q + λd f p, q.06 Az általánosított divergencia fogalma túl tág keretet jelent a differenciálgeometriai analízishez. Legyen D olyan általánosított divergencia, hogy minden p S esetén az y Dpx, ϑ + y, px, ϑ függvény sorbafejthető y-szerint. Az általánosított divergencia definíciója alapján a sorfejtésében az első nullától különböző elem a négyzetes tag lesz Dpx, ϑ + y, px, ϑ = g D ik py iy k + h D ijk 6 y iy j y k + o y i,k= i,j,k=
31 .3. ELOSZLÁSOK TÁVOLSÁGA 5.0. Definíció. Azt mondjuk, hogy az X, S, Ξ statisztikai modellen a D általánosított divergencia divergencia vagy kontrasztfüggvény, ha minden p S esetén a Dpx, ϑ + y, px, ϑ függvény sorbafejthető y-szerint minden ϑ Ξ paraméter mellett, és a sorfejtésben megjelenő g D ik mátrix pozitív definit. A D p, q = Dq, p képlettel értelmezett D függvényt a D általánosított divergencia duális általánosított divergenciájának nevezzük. A duális divergencia sorfejtése D px, ϑ + y, px, ϑ = i,k= g D ik py iy k + 6 i,j,k= h D ijk y iy j y k + o y A másodrendű tagok tehát azonosak a divergenciánál és a duálisánál, ezért általánosan igaz, hogy egy divergencia duálisa divergencia. Tekintsük a D f Csiszár-féle f-divergenciát. Ha a g szigorúan konvex, g = 0 feltételt teljesítő függvényre gx + xgx = fx + xfx.09 teljesül, akkor az.07 és.08 egyenlet alapján, a D g Csiszár-féle divergencia ugyan azt a másodrendű tagot adja, mint a D f divergencia, vagyis g D g ik = gd f ik..6. Példa. A.. példában bemutatott diszkrét eloszlások esetén a Csiszár-féle f-divergenciák sorfejtésében megjelenő g D f másodrendű tagot többféle képpen lehet jellemezni. Jelölje p i illetve q i a D f : S S R p, q D f p, q.0 függvény p i és q i változó szerinti parciális deriváltját i=0,...,n. Rövid számolással ellenőrízhetők az alábbi azonosságok i, j =,..., n esetén. p i p j D f p, p = f δ ij p i + p 0 p i q j D f p, p = f δ ij + p i p 0 q i q j D f p, p = f δ ij + p i p 0.
32 P 6. STATISZTIKAI ALAPOK Ezek alapján minden x, y X n+ vektorra minden p S pontban x, g D f py = x i y j g D f ij p = t s D fp + tx + sy, p =. t,s=0 i,j= = t s D fp + tx, p + sy = t,s=0 = t s D fp, p + tx + sy t,s=0 teljesül. A divergenciákból származó g D ik Fisher-információs mátrixszal..8. Tétel. Legyen X, S, Ξ statisztikai modell. Ekkor mátrix általában számszorzó erejéig megegyezik a g D KL = g F g D H = gf g D χ = g F.3 g D α = g F g D B = 4 gf g D Ha = gf teljesül. g D J = g F g D = g F g D LW = 4 gf g D f = f g F Ezek alapján az általánosított divergenciára adott példák egyúttal divergenciák is. Bizonyos esetekben az eloszlások között a mérhetőség segítségével definiálhatunk távolságfogalmat..7. Példa. Wooters-példája [3]: Tegyük fel, hogy van két valószínűségi eloszlásunk: p, p és p, p, ahol p < p. Ha n mérési lehetőségünk van, akkor a mérés bizonytalanságát jól jellemzi a p p p =.4 n paraméter, mely a tipikus fluktuációk nagysága. Ezek alapján azt mondjuk, hogy a p, p és p, p eloszlások n-méréssel megkülönböztethetőek, ha a tipikus fluktuációk között nincs átfedés, vagyis ha p p p + p.5
33 .4. MAJORIZÁCIÓ DISZKRÉT ELOSZLÁSOKNÁL 7 teljesül. Jelölje kn, p, p azon p i, p i valószínűségi eloszlások számát, amelyekre p < p i < p, p i < p i+ teljesül és p i, p i n-méréssel megkülönböztethető a p i+, p i+ eloszlástól. Ekkor a p, p és a p, p eloszlások között a statisztikai távolság legyen p kn, p, p dp, p = lim..6 n n Az előző egyenlet alapján a távolság p p dp, p = d p = arccos p + p p..7 p p P.4. Majorizáció diszkrét eloszlásoknál Hardy, Littlewood és Pólya 934-ben megjelent könyve az elsők között tárgyalja alaposan a majorizációt és a hozzá kapcsolódó egyenlőtlenségeket [43]. Részletesebb és általánosabb leírás található a majorizációról Marshall és Olkin 979-ben megjelent könyvében [70]. A téma rövid, de átfogó tárgyalása megtalálható még Bhatia [4] könyvében és Ando [7] cikkében. Ebben a fejezetben a véges halmazon értelmezett valószínűségi mértékekkel foglalkozunk. Tehát olyan X, S, Ξ statisztikai modelleket vizsgálunk, ahol X véges halmaz. Adott a,..., a n R n vektor esetén jelölje a,..., a n az {a,..., a n } számok nagyság szerinti csökkenő sorrendjét... Definíció. Legyen p, q S, és legyenek p,..., p n, q,..., qn a p és q csökkenő sorrendbe rendezett értékei. Azt mondjuk, hogy p majorálja q-t vagy q kevertebb p-nél, ha minden k =,..., n esetén k q i i= teljesül. Ezen reláció fennállását q p a jelöli. k p i.8 A q p majorizációs reláció egyik fizikai interpretálása az, hogy q rendezetlenebb, kaotikusabb állapotot ír le mint p. A definícióból következik, hogy minden p S eloszlásra n,..., p,..., p n, 0,..., 0.9 n i=
34 8. STATISZTIKAI ALAPOK teljesül. Adott p S eloszlásból kevertebbet kapunk, ha az elemeiket közelítjük egymáshoz. Ha p,..., p n jelöli p elemeit csökkenő sorrendben, akkor minden i < j n és t [0, ] esetén p,..., tp i + tp j,..., tp i +tp j,..., p n p,..., p i,..., p j,..., p n.0 teljesül. A valószínűségek fenti keverését leíró T t ij p = p,..., tp i + tp j,..., tp i + tp j,..., p n. leképezést T -transzformációnak nevezzük. Ha egy rendszert Gibbs-eloszlás jellemez, akkor a hőmérséklet emelkedésével kaotikusabb állapotot kapunk, ezt fogalmazza meg Wehrl tétele [] bizonyos kvantumállapotokra, melyből azonnal adódik az alábbi egyszerűbb tétel..9. Tétel. Adott E i i n pozitív energiaszintek és β < β paraméterek esetén teljesül, ahol R β E i R β E i Rβ E i. az.75 képlettel értelmezett Gibbs-féle eloszlás... Definíció. Egy n n-es A mátrixot kétszeresen sztochasztikusnak nevezünk, ha minden eleme nemnegatív, továbbá teljesül. a ij = i= a ij =.3 j= Minden n n-es kétszeresen sztochasztikus mátrix egyben véges halmazokon értelmezett átmenetvalószínűség is. Adott p S eloszlás kétszeresen sztochasztikus mátrix általi képe szintén eloszlás lesz, és kevertebb lesz az eredetinél. Ennél azonban több is igaz..0. Tétel. Legyen p, q S. Ekkor az alábbiak ekvivalensek.. A p q reláció teljesül.. Léteznek olyan p 0,..., p k S eloszlások, melyekre p 0 = p, p k = q, továbbá p 0 p k.4 teljesül, valamint minden i = 0,..., k esetén p i a p i+ eloszlás T - transzformációjával kapható meg.
35 .4. MAJORIZÁCIÓ DISZKRÉT ELOSZLÁSOKNÁL 9 3. Léteznek olyan p 0,..., p m S eloszlások, melyekre p 0 = p, p m = q, továbbá p 0 p m.5 teljesül, valamint minden i = 0,..., m esetén léteznek E i,j j n energiaszintek, β,i és β,i paraméterek, hogy p i = R β,i E i,j és p i+ = R β,i E i,j teljesül. 4. Van olyan A duplán sztochasztikus mátrix, hogy Aq = p. Az x x log x entrópia-függvény konkavitásából és a Jensen-egyenlőtlenségből adódik, hogy p q esetén Sq Sp teljesül. Tehát a kevertebb állapotnak nagyobb a rendezetlensége.
36 30. STATISZTIKAI ALAPOK
37 3. Fisher-metrika a klasszikus esetben A fejezet célja a statisztikában alkalmazott differenciálgeometriai módszerek alapjainak a bemutatása. Az előző fejezet elején tett megkötések a vizsgálandó X, S, Ξ statisztikai modellre továbbra is érvényben maradnak, azonban a Ξ paramétertér újabb struktúrával bővül. Az alapvető újdonság a differenciálgeometriai megközelítésben, hogy a Ξ paraméterteret geometriai objektumnak például differenciálgeometriának vagy Riemann-sokaságnak tekinti, és mint a tapasztalat mutatja, a Ξ tér geometriai jellemzői görbület, párhuzamos eltolás statisztikai jelentéssel ruházhatók fel. Vagyis a differenciálgeometria mint hatékony eszköz szerepel ebben a megközelítésben. A fejezetben főleg a diszkrét eloszlások geometriai tulajdonságait elemezzük, ugyanis ezt az elemzést lehet jól kiterjeszteni a nemkommutatív esetre. Az ehhez szükséges differenciálgeometriai fogalmakat vázlatosan áttekintjük. Azonban a fogalmakat nem a legáltalánosabb esetre definiáljuk, hanem megelégszünk azzal, hogy az általunk vizsgált esetekre alkalmazhatóak. Továbbá, ha a megszokott differenciálgeometriai definíciók több előkészítést igényelnek, akkor megelégszünk egy, az általunk vizsgált esetekben jól műkődő, a megszokottal ekvivalens definícióval. A differenciálgeometriai tételeket nem bizonyítjuk, és külön referenciát sem jelölünk meg, ha azok a bevezető jellegű differenciálgeometriai könyvekben megtalálhatóak. A számtalan általános differenciálgeometriai témájú könyv közül megemlítjük a magyar nyelvű [99, 00] valamint az angol nyelvű [49, 56, 63, 96] könyveket. A differenciálgeometria statisztikai alkalmazásainak néhány fejezete megtalálható a [, 3, 0, 75] könyvekben. Előszőr a diszkrét eloszlások példáján mutatjuk be a differenciálgeometria fogalmait, majd az euklideszi terekben megszokott egyenes fogalmának az általánosítását, a geodetikust definiáljuk és elemezzük. Görbült térben egy pont körüli gömb térfogata általában különbözik a megszokott euklideszi térben számolt térfogattól. Ez az eltérés annál nagyobb, minél nagyobb a gömb sugara. Megvizsgáljuk, hogy a térfogat sugár szerinti sorfejtéséből hogyan nyerhetünk információt a térnek a középpontban való görbületéről és a görbülethez kapcsolódó egyéb mérőszámokról. Majd Cencov egyik tételét mutatjuk be, mely szerint létezik kitüntetett geometriai struktúra a diszkrét eloszlások terén. A nemkommutatív esetre előretekintve új módszerrel határozzuk meg a diszkrét eloszlások terének a görbületét. Az eddigiek alkalmazásaként megmutatjuk, hogy a normális eloszlások családja esetén hogyan használhatók ki és számolhatók a fejezetben definiált mennyiségek. Ennek az alkalmazásnak a szerepe a diszkrét eloszlások nemkommutatív általánosításánál derül ki. Majd megvizsgáljuk, hogy a paramétertér két pontját összekötő általánosított egyenes geodetikus mentén mért távolság milyen távolságfogalmat jelent a főbb eloszláscsaládok esetén.
Az Információgeometria a kvantummechanikában
BME Matematikai Intézet Analízis Tanszék Andai Attila: Az Információgeometria a kvantummechanikában című doktori értekezés tézisei Témavezető: Petz Dénes matematikai tudományok doktora, egyetemi tanár
Valószínűségi változók. Várható érték és szórás
Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :
Mérhetőség, σ-algebrák, Lebesgue Stieltjes-integrál, véletlen változók és eloszlásfüggvényeik
Mérhetőség, σ-algebrák, Lebesgue Stieltjes-integrál, véletlen változók és eloszlásfüggvényeik Az A halmazrendszer σ-algebra az Ω alaphalmazon, ha Ω A; A A A c A; A i A, i N, i N A i A. Az A halmazrendszer
Analízis II. Analízis II. Beugrók. Készítette: Szánthó József. kiezafiu kukac gmail.com. 2009/ félév
Analízis II. Analízis II. Beugrók Készítette: Szánthó József kiezafiu kukac gmail.com 2009/20 10 1.félév Analízis II. Beugrók Függvények folytonossága: 1. Mikor nevez egy függvényt egyenletesen folytonosnak?
A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.
Poisson folyamatok, exponenciális eloszlások Azt mondjuk, hogy a ξ valószínűségi változó Poisson eloszlású λ, 0 < λ
ANALÍZIS III. ELMÉLETI KÉRDÉSEK
ANALÍZIS III. ELMÉLETI KÉRDÉSEK Szerkesztette: Balogh Tamás 2014. május 15. Ha hibát találsz, kérlek jelezd a info@baloghtamas.hu e-mail címen! Ez a Mű a Creative Commons Nevezd meg! - Ne add el! - Így
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:
4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O
1. Mit nevezünk elemi eseménynek és eseménytérnek? A kísérlet lehetséges kimeneteleit elemi eseményeknek nevezzük. Az adott kísélethez tartozó elemi események halmazát eseménytérnek nevezzük, jele: X 2.
1. Példa. A gamma függvény és a Fubini-tétel.
. Példa. A gamma függvény és a Fubini-tétel.. Az x exp x + t )) függvény az x, t tartományon folytonos, és nem negatív, ezért alkalmazható rá a Fubini-tétel. I x exp x + t )) dxdt + t dt π 4. [ exp x +
Azonos és egymással nem kölcsönható részecskékből álló kvantumos rendszer makrókanónikus sokaságban.
Kvantum statisztika A kvantummechanika előadások során már megtanultuk, hogy az anyagot felépítő részecskék nemklasszikus, hullámtulajdonságokkal is rendelkeznek aminek következtében viselkedésük sok szempontból
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
Készítette: Fegyverneki Sándor
VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y
Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek
Az november 23-i szeminárium témája Rövid összefoglaló Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek felfrissítése? Tekintsünk ξ 1,..., ξ k valószínűségi változókat,
Boros Zoltán február
Többváltozós függvények differenciál- és integrálszámítása (2 3. előadás) Boros Zoltán 209. február 9 26.. Vektorváltozós függvények differenciálhatósága és iránymenti deriváltjai A továbbiakban D R n
Gazdasági matematika II. vizsgadolgozat, megoldással,
Gazdasági matematika II. vizsgadolgozat, megoldással, levelező képzés Definiálja az alábbi fogalmakat! 1. Kvadratikus mátrix invertálhatósága és inverze. (4 pont) Egy A kvadratikus mátrixot invertálhatónak
Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ
Megoldások Harmadik fejezet gyakorlatai 3.. gyakorlat megoldása ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4;, 3 normális eloszlású P (ξ 8 ξ 5 feltételes valószínűségét (.3. alapján számoljuk.
Lagrange és Hamilton mechanika
Lagrange és 2010. október 17. Lagrange és Tartalom 1 Variáció Lagrange egyenlet Legendre transzformáció Hamilton egyenletek 2 3 Szimplektikus sokaság Hamilton mez Hamilton és Lagrange egyenletek ekvivalenciája
A fontosabb definíciók
A legfontosabb definíciókat jelöli. A fontosabb definíciók [Descartes szorzat] Az A és B halmazok Descartes szorzatán az A és B elemeiből képezett összes (a, b) a A, b B rendezett párok halmazát értjük,
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
Optimalizálási eljárások GYAKORLAT, MSc hallgatók számára. Analízis R d -ben
Optimalizálási eljárások GYAKORLAT, MSc hallgatók számára Analízis R d -ben Gyakorlatvezetõ: Hajnal Péter 2012. február 8 1. Konvex függvények Definíció. f : D R konvex, ha dom(f) := D R n konvex és tetszőleges
A Matematika I. előadás részletes tematikája
A Matematika I. előadás részletes tematikája 2005/6, I. félév 1. Halmazok és relációk 1.1 Műveletek halmazokkal Definíciók, fogalmak: halmaz, elem, üres halmaz, halmazok egyenlősége, részhalmaz, halmazok
0-49 pont: elégtelen, pont: elégséges, pont: közepes, pont: jó, pont: jeles
Matematika szigorlat, Mérnök informatikus szak I. 2013. jan. 10. Név: Neptun kód: Idő: 180 perc Elm.: 1. f. 2. f. 3. f. 4. f. 5. f. Fel. össz.: Össz.: Oszt.: Az elérhető pontszám 40 (elmélet) + 60 (feladatok)
Gazdasági matematika II. vizsgadolgozat megoldása, június 10
Gazdasági matematika II. vizsgadolgozat megoldása, 204. június 0 A dolgozatírásnál íróeszközön kívül más segédeszköz nem használható. A dolgozat időtartama: 90 perc. Ha a dolgozat első részéből szerzett
(Diszkrét idejű Markov-láncok állapotainak
(Diszkrét idejű Markov-láncok állapotainak osztályozása) March 21, 2019 Markov-láncok A Markov-láncok anaĺızise főként a folyamat lehetséges realizációi valószínűségeinek kiszámolásával foglalkozik. Ezekben
Markov-láncok stacionárius eloszlása
Markov-láncok stacionárius eloszlása Adatbányászat és Keresés Csoport, MTA SZTAKI dms.sztaki.hu Kiss Tamás 2013. április 11. Tartalom Markov láncok definíciója, jellemzése Visszatérési idők Stacionárius
6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének
6. Függvények I. Elméleti összefoglaló A függvény fogalma, értelmezési tartomány, képhalmaz, értékkészlet Legyen az A és B halmaz egyike sem üreshalmaz. Ha az A halmaz minden egyes eleméhez hozzárendeljük
1. Házi feladat. Határidő: I. Legyen f : R R, f(x) = x 2, valamint. d : R + 0 R+ 0
I. Legyen f : R R, f(x) = 1 1 + x 2, valamint 1. Házi feladat d : R + 0 R+ 0 R (x, y) f(x) f(y). 1. Igazoljuk, hogy (R + 0, d) metrikus tér. 2. Adjuk meg az x {0, 3} pontok és r {1, 2} esetén a B r (x)
Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
MATEMATIKA EMELT SZINTŰ SZÓBELI VIZSGA TÉMAKÖREI (TÉTELEK) 2005
2005 1. * Halmazok, halmazműveletek, nevezetes ponthalmazok 2. Számhalmazok, halmazok számossága 3. Hatványozás, hatványfüggvény 4. Gyökvonás, gyökfüggvény 5. A logaritmus. Az exponenciális és a logaritmus
Numerikus módszerek 1.
Numerikus módszerek 1. 6. előadás: Vektor- és mátrixnormák Lócsi Levente ELTE IK 2013. október 14. Tartalomjegyzék 1 Vektornormák 2 Mátrixnormák 3 Természetes mátrixnormák, avagy indukált normák 4 Mátrixnormák
3. Fuzzy aritmetika. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI
3. Fuzzy aritmetika Gépi intelligencia I. Fodor János BMF NIK IMRI NIMGI1MIEM Tartalomjegyzék I 1 Intervallum-aritmetika 2 Fuzzy intervallumok és fuzzy számok Fuzzy intervallumok LR fuzzy intervallumok
Határozatlansági relációk származtatása az
az állapottér BME TTK Matematikus MSc. 1. évf. 2012. november 14. Vázlat: Történeti áttekintés Nemkommutatív (kvantum) valószín ségelmélet Az állapottér geometriája: Az állapottér mint Riemann-sokaság
minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.
Függvények határértéke és folytonossága Egy f: D R R függvényt korlátosnak nevezünk, ha a függvényértékek halmaza korlátos. Ha f(x) f(x 0 ) teljesül minden x D esetén, akkor x 0 -at a függvény maximumhelyének
A maximum likelihood becslésről
A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának
KOVÁCS BÉLA, MATEMATIKA I.
KOVÁCS BÉLA, MATEmATIkA I. 4 IV. FÜGGVÉNYEk 1. LEkÉPEZÉSEk, függvények Definíció Legyen és két halmaz. Egy függvény -ből -ba egy olyan szabály, amely minden elemhez pontosan egy elemet rendel hozzá. Az
Norma Determináns, inverz Kondíciószám Direkt és inverz hibák Lin. egyenletrendszerek A Gauss-módszer. Lineáris algebra numerikus módszerei
Indukált mátrixnorma Definíció A. M : R n n R mátrixnormát a. V : R n R vektornorma által indukált mátrixnormának nevezzük, ha A M = max { Ax V : x V = 1}. Az indukált mátrixnorma geometriai jelentése:
Matematika (mesterképzés)
Matematika (mesterképzés) Környezet- és Településmérnököknek Debreceni Egyetem Műszaki Kar, Műszaki Alaptárgyi Tanszék Vinczéné Varga A. Környezet- és Településmérnököknek 2016/2017/I 1 / 29 Lineáris tér,
f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva
6. FÜGGVÉNYEK HATÁRÉRTÉKE ÉS FOLYTONOSSÁGA 6.1 Függvény határértéke Egy D R halmaz torlódási pontjainak halmazát D -vel fogjuk jelölni. Definíció. Legyen f : D R R és legyen x 0 D (a D halmaz torlódási
Az egyenlőtlenség mindkét oldalát szorozzuk meg 4 16-al:
Bevezető matematika kémikusoknak., 04. ősz. feladatlap. Ábrázoljuk számegyenesen a következő egyenlőtlenségek megoldáshalmazát! (a) x 5 < 3 5 x < 3 x 5 < (d) 5 x
Feladatsor A differenciálgeometria alapja c. kurzus gyakorlatához
Feladatsor A differenciálgeometria alapja c. kurzus gyakorlatához Dr. Nagy Gábor, Geometria Tanszék 2010. szeptember 16. Görbék paraméterezése 1. feladat. (A) Bizonyítsuk be a vektoriális szorzatra vonatkozó
LNM folytonos Az interpoláció Lagrange interpoláció. Lineáris algebra numerikus módszerei
Legkisebb négyzetek módszere, folytonos eset Folytonos eset Legyen f C[a, b]és h(x) = a 1 φ 1 (x) + a 2 φ 2 (x) +... + a n φ n (x). Ekkor tehát az n 2 F (a 1,..., a n ) = f a i φ i = = b a i=1 f (x) 2
Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján
Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján Számsorozatok, vektorsorozatok konvergenciája Def.: Számsorozatok értelmezése:
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
Felügyelt önálló tanulás - Analízis III.
Felügyelt önálló tanulás - Analízis III Kormos Máté Differenciálható sokaságok Sokaságok Röviden, sokaságoknak nevezzük azokat az objektumokat, amelyek egy n dimenziós térben lokálisan k dimenziósak Definíció:
Hadamard-mátrixok Előadó: Hajnal Péter február 23.
Szimmetrikus kombinatorikus struktúrák MSc hallgatók számára Hadamard-mátrixok Előadó: Hajnal Péter 2012. február 23. 1. Hadamard-mátrixok Ezen az előadáson látásra a blokkrendszerektől független kombinatorikus
12. Mikor nevezünk egy részhalmazt nyíltnak, illetve zártnak a valós számok körében?
Ellenörző Kérdések 1. Mit jelent az, hogy egy f : A B függvény injektív, szürjektív, illetve bijektív? 2. Mikor nevezünk egy függvényt invertálhatónak? 3. Definiálja a komplex szám és műveleteinek fogalmát!
Vektorterek. Több esetben találkozhattunk olyan struktúrával, ahol az. szabadvektorok esetében, vagy a függvények körében, vagy a. vektortér fogalma.
Vektorterek Több esetben találkozhattunk olyan struktúrával, ahol az összeadás és a (valós) számmal való szorzás értelmezett, pl. a szabadvektorok esetében, vagy a függvények körében, vagy a mátrixok esetében.
A TERMODINAMIKA II., III. ÉS IV. AXIÓMÁJA. A termodinamika alapproblémája
A TERMODINAMIKA II., III. ÉS IV. AXIÓMÁJA A termodinamika alapproblémája Első észrevétel: U, V és n meghatározza a rendszer egyensúlyi állapotát. Mi történik, ha változás történik a rendszerben? Mi lesz
A mérési eredmény megadása
A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű
A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a
a Matematika mérnököknek I. című tárgyhoz Függvények. Függvények A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a szabadon eső test sebessége az idő függvénye. Konstans hőmérsékleten
x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:
Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.
A L Hospital-szabály, elaszticitás, monotonitás, konvexitás
A L Hospital-szabály, elaszticitás, monotonitás, konvexitás 9. előadás Farkas István DE ATC Gazdaságelemzési és Statisztikai Tanszék A L Hospital-szabály, elaszticitás, monotonitás, konvexitás p. / A L
2012. október 2 és 4. Dr. Vincze Szilvia
2012. október 2 és 4. Dr. Vincze Szilvia Tartalomjegyzék 1.) Az egyváltozós valós függvény fogalma, műveletek 2.) Zérushely, polinomok zérushelye 3.) Korlátosság 4.) Monotonitás 5.) Szélsőérték 6.) Konvex
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Analízis I. beugró vizsgakérdések
Analízis I. beugró vizsgakérdések Programtervező Informatikus szak 2008-2009. 2. félév Készítette: Szabó Zoltán SZZNACI.ELTE zotyo@bolyaimk.hu v1.7 Forrás: Dr. Weisz Ferenc: Prog. Mat. 2006-2007 definíciók
Lagrange egyenletek. Úgy a virtuális munka mint a D Alembert-elv gyakorlati alkalmazását
Lagrange egyenletek Úgy a virtuális munka mint a D Alembert-elv gyakorlati alkalmazását megnehezíti a δr i virtuális elmozdulások egymástól való függősége. (F i ṗ i )δx i = 0, i = 1, 3N. (1) i 3N infinitezimális
Függvények vizsgálata
Függvények vizsgálata ) Végezzük el az f ) = + polinomfüggvény vizsgálatát! Értelmezési tartomány: D f = R. Zérushelyek: Próbálgatással könnyen adódik, hogy f ) = 0. Ezután polinomosztással: + ) / ) =
First Prev Next Last Go Back Full Screen Close Quit
Többváltozós függvények (2) First Prev Next Last Go Back Full Screen Close Quit 1. Egyváltozós függvények esetén a differenciálhatóságból következett a folytonosság. Fontos tudni, hogy abból, hogy egy
valós számot tartalmaz, mert az ilyen részhalmazon nem azonosság.
2. Közönséges differenciálegyenlet megoldása, megoldhatósága Definíció: Az y függvényt a valós számok H halmazán a közönséges differenciálegyenlet megoldásának nevezzük, ha az y = y(x) helyettesítést elvégezve
17. előadás: Vektorok a térben
17. előadás: Vektorok a térben Szabó Szilárd A vektor fogalma A mai előadásban n 1 tetszőleges egész szám lehet, de az egyszerűség kedvéért a képletek az n = 2 esetben szerepelnek. Vektorok: rendezett
Matematika alapjai; Feladatok
Matematika alapjai; Feladatok 1. Hét 1. Tekintsük a,, \ műveleteket. Melyek lesznek a.) kommutativok b.) asszociativak c.) disztributívak-e a, műveletek? Melyik melyikre? 2. Fejezzük ki a műveletet a \
Nagy Gábor compalg.inf.elte.hu/ nagy
Diszkrét matematika 3. estis képzés 2018. ősz 1. Diszkrét matematika 3. estis képzés 9. előadás Nagy Gábor nagygabr@gmail.com nagy@compalg.inf.elte.hu compalg.inf.elte.hu/ nagy Komputeralgebra Tanszék
Diszkrét Matematika. zöld könyv ): XIII. fejezet: 1583, 1587, 1588, 1590, Matematikai feladatgyűjtemény II. (
FELADATOK A LEKÉPEZÉSEK, PERMUTÁCIÓK TÉMAKÖRHÖZ Diszkrét Matematika 4. LEKÉPEZÉSEK Értelmezési tartomány és értékkészlet meghatározása : Összefoglaló feladatgyűjtemény matematikából ( zöld könyv ): XIII.
1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)
Matematika A2c gyakorlat Vegyészmérnöki, Biomérnöki, Környezetmérnöki szakok, 2017/18 ősz 1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás) 1. Valós vektorterek-e a következő
Matematika III előadás
Matematika III. - 3. előadás Vinczéné Varga Adrienn Debreceni Egyetem Műszaki Kar, Műszaki Alaptárgyi Tanszék Előadáskövető fóliák Vinczéné Varga Adrienn (DE-MK) Matematika III. 2016/2017/I 1 / 19 Skalármezők
előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás
13-14. előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás 2016. november 28. és december 5. 13-14. előadás 1 / 35 Bevezetés A diszkrét
Gyakorló feladatok I.
Gyakorló feladatok I. a Matematika Aa Vektorüggvények tárgyhoz (D D5 kurzusok) Összeállította: Szili László Ajánlott irodalmak:. G.B. Thomas, M.D. Weir, J. Hass, F.R. Giordano: Thomas-féle KALKULUS I.,
Fermi Dirac statisztika elemei
Fermi Dirac statisztika elemei A Fermi Dirac statisztika alapjai Nagy részecskeszámú rendszerek fizikai jellemzéséhez statisztikai leírást kell alkalmazni. (Pl. gázokra érvényes klasszikus statisztika
Egyváltozós függvények 1.
Egyváltozós függvények 1. Filip Ferdinánd filip.ferdinand@bgk.uni-obuda.hu siva.banki.hu/jegyzetek 015 szeptember 1. Filip Ferdinánd 015 szeptember 1. Egyváltozós függvények 1. 1 / 5 Az el adás vázlata
Lineáris algebra numerikus módszerei
Hermite interpoláció Tegyük fel, hogy az x 0, x 1,..., x k [a, b] különböző alappontok (k n), továbbá m 0, m 1,..., m k N multiplicitások úgy, hogy Legyenek adottak k m i = n + 1. i=0 f (j) (x i ) = y
Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
Bevezetés a görbe vonalú geometriába
Bevezetés a görbe vonalú geometriába Metrikus tenzor, Christoffel-szimbólum, kovariáns derivált, párhuzamos eltolás, geodetikus Pr hle Zsóa A klasszikus térelmélet elemei (szeminárium) 2012. október 1.
GPK M1 (BME) Interpoláció / 16
Interpoláció Matematika M1 gépészmérnököknek 2017. március 13. GPK M1 (BME) Interpoláció 2017 1 / 16 Az interpoláció alapfeladata - Példa Tegyük fel, hogy egy ipari termék - pl. autó - előzetes konstrukciójának
azonosságot minden 1 i, l n, 1 j k, indexre teljesítő együtthatókkal, amelyekre érvényes a = c (j) i,l l,i
A Cochran Fisher tételről A matematikai statisztika egyik fontos eredménye a Cochran Fisher tétel, amely a variancia analízisben játszik fontos szerepet. Ugyanakkor ez a tétel lényegét tekintve valójában
MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Függvények
MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Függvények A szürkített hátterű feladatrészek nem tartoznak az érintett témakörhöz, azonban szolgálhatnak fontos információval az érintett feladatrészek
Komplex számok. A komplex számok algebrai alakja
Komple számok A komple számok algebrai alakja 1. Ábrázolja a következő komple számokat a Gauss-féle számsíkon! Adja meg a számok valós részét, képzetes részét és számítsa ki az abszolút értéküket! a) 3+5j
Kalkulus S af ar Orsolya F uggv enyek S af ar Orsolya Kalkulus
Függvények Mi a függvény? A függvény egy hozzárendelési szabály. Egy valós függvény a valós számokhoz, esetleg egy részükhöz rendel hozzá pontosan egy valós számot valamilyen szabály (nem feltétlen képlet)
1. Generátorrendszer. Házi feladat (fizikából tudjuk) Ha v és w nem párhuzamos síkvektorok, akkor generátorrendszert alkotnak a sík vektorainak
1. Generátorrendszer Generátorrendszer. Tétel (Freud, 4.3.4. Tétel) Legyen V vektortér a T test fölött és v 1,v 2,...,v m V. Ekkor a λ 1 v 1 + λ 2 v 2 +... + λ m v m alakú vektorok, ahol λ 1,λ 2,...,λ
A brachistochron probléma megoldása
A brachistochron probléma megoldása Adott a függőleges síkban két nem egy függőleges egyenesen fekvő P 0 és P 1 pont, amelyek közül a P 1 fekszik alacsonyabban. Azt a kérdést fogjuk vizsgálni. hogy van-e
1/1. Házi feladat. 1. Legyen p és q igaz vagy hamis matematikai kifejezés. Mutassuk meg, hogy
/. Házi feladat. Legyen p és q igaz vagy hamis matematikai kifejezés. Mutassuk meg, hogy mindig igaz. (p (( p) q)) (( p) ( q)). Igazoljuk, hogy minden A, B és C halmazra A \ (B C) = (A \ B) (A \ C) teljesül.
Matematika A1a Analízis
B U D A P E S T I M Ű S Z A K I M A T E M A T I K A É S G A Z D A S Á G T U D O M Á N Y I I N T É Z E T E G Y E T E M Matematika A1a Analízis BMETE90AX00 Vektorok StKis, EIC 2019-02-12 Wettl Ferenc ALGEBRA
Matematika A2 vizsga mgeoldása június 4.
Matematika A vizsga mgeoldása 03. június.. (a (3 pont Definiálja az f(x, y függvény határértékét az (x 0, y 0 helyen! Megoldás: Legyen D R, f : D R. Legyen az f(x, y függvény értelmezve az (x 0, y 0 pont
A valószínűségszámítás elemei
A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:
15. LINEÁRIS EGYENLETRENDSZEREK
15 LINEÁRIS EGYENLETRENDSZEREK 151 Lineáris egyenletrendszer, Gauss elimináció 1 Definíció Lineáris egyenletrendszernek nevezzük az (1) a 11 x 1 + a 12 x 2 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + + a
Elméleti összefoglaló a Valószín ségszámítás kurzushoz
Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek
Analízis előadás és gyakorlat vázlat
Analízis előadás és gyakorlat vázlat Készült a PTE TTK GI szakos hallgatóinak Király Balázs 2010-11. I. Félév 2 1. fejezet Számhalmazok és tulajdonságaik 1.1. Nevezetes számhalmazok ➀ a) jelölése: N b)
biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
Leképezések. Leképezések tulajdonságai. Számosságok.
Leképezések Leképezések tulajdonságai. Számosságok. 1. Leképezések tulajdonságai A továbbiakban legyen A és B két tetszőleges halmaz. Idézzünk fel néhány definíciót. 1. Definíció (Emlékeztető). Relációknak
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
Fraktálok. Kontrakciók Affin leképezések. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék. TARTALOMJEGYZÉK Kontrakciók Affin transzformációk
Fraktálok Kontrakciók Affin leképezések Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék TARTALOMJEGYZÉK 1 of 71 A Lipschitz tulajdonság ÁTMÉRŐ, PONT ÉS HALMAZ TÁVOLSÁGA Definíció Az (S, ρ) metrikus tér
Nagy András. Feladatok a logaritmus témaköréhez 11. osztály 2010.
Nagy András Feladatok a logaritmus témaköréhez. osztály 00. Feladatok a logaritmus témaköréhez. osztály ) Írd fel a következő egyenlőségeket hatványalakban! a) log 9 = b) log 4 = - c) log 7 = d) lg 0 =
10. Előadás. 1. Feltétel nélküli optimalizálás: Az eljárás alapjai
Optimalizálási eljárások MSc hallgatók számára 10. Előadás Előadó: Hajnal Péter Jegyzetelő: T. Szabó Tamás 2011. április 20. 1. Feltétel nélküli optimalizálás: Az eljárás alapjai A feltétel nélküli optimalizálásnál
Matematika III előadás
Matematika III. - 2. előadás Vinczéné Varga Adrienn Debreceni Egyetem Műszaki Kar, Műszaki Alaptárgyi Tanszék Előadáskövető fóliák Vinczéné Varga Adrienn (DE-MK) Matematika III. 2016/2017/I 1 / 30 Egy
e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:
Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:
Függvények Megoldások
Függvények Megoldások ) Az ábrán egy ; intervallumon értelmezett függvény grafikonja látható. Válassza ki a felsoroltakból a függvény hozzárendelési szabályát! a) x x b) x x + c) x ( x + ) b) Az x függvény
Az impulzusnyomatékok általános elmélete
Az impulzusnyomatékok általános elmélete November 27, 2006 Az elemi kvantummechanika keretében tárgyaltuk már az impulzusnyomatékot. A továbbiakban általánosítjuk az impulzusnyomaték fogalmát a kvantummechanikában
Determinánsok. A determináns fogalma olyan algebrai segédeszköz, amellyel. szolgáltat az előbbi kérdésekre, bár ez nem mindig hatékony.
Determinánsok A determináns fogalma olyan algebrai segédeszköz, amellyel jól jellemezhető a mátrixok invertálhatósága, a mátrix rangja. Segítségével lineáris egyenletrendszerek megoldhatósága dönthető
2. SZÉLSŽÉRTÉKSZÁMÍTÁS. 2.1 A széls érték fogalma, létezése
2 SZÉLSŽÉRTÉKSZÁMÍTÁS DEFINÍCIÓ 21 A széls érték fogalma, létezése Azt mondjuk, hogy az f : D R k R függvénynek lokális (helyi) maximuma (minimuma) van az x 0 D pontban, ha van olyan ε > 0 hogy f(x 0 )
Matematika A1a Analízis
B U D A P E S T I M Ű S Z A K I M A T E M A T I K A É S G A Z D A S Á G T U D O M Á N Y I I N T É Z E T E G Y E T E M Matematika A1a Analízis BMETE90AX00 A derivált alkalmazásai H607, EIC 2019-04-03 Wettl