Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Hasonló dokumentumok
Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

AliROOT szimulációk GPU alapokon

Alapja a véletlen minták kiértékelése. Sok szabadság fokú csatolt rendszerek

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Véletlenszám generátorok

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Véletlen szám generálás

XIII. Bolyai Konferencia Bodnár József Eötvös József Collegium, ELTE TTK, III. matematikus. A véletlen nyomában

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Többváltozós lineáris regressziós modell feltételeinek

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

[Biomatematika 2] Orvosi biometria

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

GPU alkalmazása az ALICE eseménygenerátorában

Nemparaméteres próbák

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Monte Carlo módszerek a statisztikus fizikában. Az Ising modell. 8. előadás

Biomatematika 2 Orvosi biometria

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Hipotézis vizsgálatok

Adatok statisztikai értékelésének főbb lehetőségei

[Biomatematika 2] Orvosi biometria

Gyarmati Katalin, Sárközy András

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

[Biomatematika 2] Orvosi biometria

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Matematikai statisztika c. tárgy oktatásának célja és tematikája

KÖZELÍTŐ INFERENCIA II.

Diszkrét idejű felújítási paradoxon

Szám. szim. labor ea. Tőke Csaba U(0,1) GSL. Adott eloszlás. Brown-mozgás. Hivatkozások. BME Fizika Intézet október 7.

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

A konfidencia intervallum képlete: x± t( α /2, df )

Diagnosztika és előrejelzés

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Segítség az outputok értelmezéséhez

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Korreláció és lineáris regresszió

Biostatisztika Összefoglalás

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Gazdasági matematika II. tanmenet

A valószínűségszámítás elemei

Algoritmuselmélet 18. előadás

Valószínűségszámítás összefoglaló

Biostatisztika VIII. Mátyus László. 19 October

i p i p 0 p 1 p 2... i p i

Biostatisztika Összefoglalás

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Utolsó módosítás: Véletlenszámok

Készítette: Fegyverneki Sándor

egyetemi jegyzet Meskó Balázs

Véletlenszám generátorok. 6. előadás

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Statisztika Elıadások letölthetık a címrıl

RSA algoritmus. P(M) = M e mod n. S(C) = C d mod n. A helyesség igazoláshoz szükséges számelméleti háttér. a φ(n) = 1 mod n, a (a 1,a 2,...

Hatékonyság 1. előadás

Markov-láncok stacionárius eloszlása

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Statisztikai módszerek 7. gyakorlat

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

KÖZELÍTŐ INFERENCIA II.

Az első számjegyek Benford törvénye

Valószínűségi változók. Várható érték és szórás

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Normális eloszlás tesztje

Függetlenségvizsgálat, Illeszkedésvizsgálat

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Loss Distribution Approach

Mesterséges Intelligencia MI

TANTÁRGYI PROGRAM Matematikai alapok II. útmutató

Megerősítéses tanulás 7. előadás

Bevezetés a hipotézisvizsgálatokba

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

CHT& NSZT Hoeffding NET mom. stabilis november 9.

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Asszociációs szabályok

Statisztika elméleti összefoglaló

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Átírás:

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT Mi a véletlen? Determinisztikus vs. Véletlen esemény? Véletlenszám: számok sorozata, ahol véletlenszerűen követik egymást az elemek Pszeudo-véletlenszám (több def. is) Determinisztikus algoritmussal generált látszólag véletlen, kaotikus számsorozat Determinisztikus algoritmus számára véletlen (Kolmogorov) Egy sorozat pszeudovéletlen, ha a lehető legrövidebb leírása maga a sorozat (Kriptográfiai) Egy sorozat pszeudovéletlen, ha a következő elem polinomiális időben generálható, de jósolni nem lehet polinomiális időben Elnevezéseik RNG = Random Number Generator PRNG = Pseudo Random Number Generator CSPRNG = Cryptographically Secure Pseudo Random Number Generator Elvárások Nagy periódus (ha van, PRNG-knél általában van) Egyenletes eloszlás, (0,1) intervallumon (esetenként zárt intervallumot akarunk) Függetlenül követik egymást a sorozat elemei Ezekből következő egyéb egyenletességi és függetlenségi tulajdonságok (később próbáknál) Miért pont egyenletes eloszlás? Mert átvihető másik eloszlásokba Ha F(x) az eloszlásfüggvény egy Q eloszlásból és X ~ U(0,1) val.vált., akkor F -1 (X) ~Q eloszlásfüggvénye Biz.: P(F -1 (X) < x) = P(X < F(x)) = F(x) Box-Müller módszer U,V független egyenletes eloszlású val.vált.-k. Ekkor T = 2 log(v) sin(2π U) és S = 2 log(v) cos(2π U) független standard normális eloszlásúak lesznek Alkalmazásuk Monte-Carlo integrál Véletlen pontokat dobál a könnyen kiszámítható területen egyenletesen A belül lévő pontok számával becsülhető a területek aránya Fizikai szimulációk 1

Néhány generátor Middle-square (Neumann János-féle) LCG (Linear Congruential Generator) GFSR (Generalized Feedback Shift Register) Mersenne Twister Blum-Blum-Shub Random.org Middle-square Véletlenszerűnek gondoljuk Rövid ciklusokhoz konvergál Legfeljebb 8 n hosszúak Linear Congruential Generator (LCG) x n+1 ax n + c mod M Legnagyobb lehetséges periódus M Tétel: generátor periódusa pontosan akkor M, ha c és M relatív prímek b a 1 osztható M minden prímosztójával M 4-gyel osztható, akkor b is Előnyei Gyors Minimális memória igény Hátrányai Előre jelezhető Monte-Carlo módszerhez nem elég véletlenszerű Ábrák (n 1000) Felső: M 2 8 ; a 213; c 1 Alsó: M 2 32 ; a 22695477; c 1 Borland C/C++ beállítása GFSR (Generalized Feedback Shift Register) x n+k x n+m x n ahol a bitenkénti kizáró-vagy művelet Ha k > m > 0 olyan, hogy x k + x m + 1 primitív polinom Z 2 felett, akkor a periódus eléri a 2 k 1-et Van próba, amelyen megbukik a generátor A kizáró vagy tulajdonságából adódóan, ha sok azonos jegy követi egymást, a következő nagyobb valószínűséggel lesz 0 Mersenne Twister A működési alapelve a GFSR-é, egy csavarással x n+k x n+m x n A Ahol A egy bitkeverő mátrix Gyengeségei kezdőérték választás Sok 0 esetén a sorozatban is inkább 0-k lesznek Kellően sok adatból jósolható (nem CSPRNG) Egyik legjobb generátor 2

Blum-Blum-Shub x n+1 x n 2 mod M Ahol M pq két nagy prím szorzata Kezdőérték relatív prím M-hez Kimenet: x n egyik vagy néhány bitje (általában a paritás) Belátható, hogy ha polinomiális időben jósolható, akkor polinomiális időben lehet prímfaktorizálni CSPRNG valóban Random.org Valódi RNG Atmoszférikus zajból generál számokat De lassú Vizsgálatok Egyszerűbb vizsgálatok Hisztogram, periódusvizsgálat, autókorreláció D.E.Knuth (1981) által javasol χ 2 alapú próbák Illetve a Kolmogorov-Smirnov próba Diehard nevű próbacsomag Egyszerűbb vizsgálatok Hisztogram Pozitívan vagy negatívan kiugró érték Rövid periódus Autókorreláció A sorozat önmaga eltoltjával vett korreláció Jól kimutatja a korábbi elemektől való egyszerű függést Tapasztalati eloszlásfüggvény A χ 2 próba Diszkrét eloszlások vizsgálatára alkalmas d a lehetséges események száma, n minta mérete T vektor megfigyelt események számai, P vektor az elméleti valószínűségeik d (T Legyen V i np i ) 2 i=1 statisztika np i V ekkor d 1 szabadságfokú χ 2 eloszlású, α legyen az a valószínűség, ahol az eloszlás V (kvartilis fv-ből, táblázattal) 3

Préselés próba Gyakoriság próba Knuth próbái Gyakoriság próba Egyenletes csoportokra osztja a [0,1] intervallumot Sorozat próba Egymás utáni elemeket párokba, stb. állítja: ezeken gyakoriság próba Hézag próba Futásokat néz, amelyek benne vannak adott hézagban Póker próba 5-ösökben keres a póker szabályai szerinti nyerő kombinációkat (pár, drill, ) Permutáció próba Adott hosszú részsorozatokban nézi az elemek sorrendjét Van még több is Knuth által meghatározott határok α p-értékre Elvetjük, ha <1% vagy >99% Gyanús, ha <5% vagy >95% Majdnem gyanús, ha <10% vagy >90% Érdemes több futtatást csinálni Egy próba még nem bizonyíték Hézag próba Mersenne Twister, n=25 minta Hézag: [1/3,2/3] P-érték: 0,57 Jó, de rendkívül pici a minta Hossz Megfigyelt Várt 1 6 3,7 2 1 1,23 3 0 0,41 4 0 0,14 Kolmogorov-Smirnov próba Kétmintás próba A minta tapasztalati eloszlás függvény és a null hipotézis szerinti elméleti eloszlásfüggvény különbségét hasonlítja össze Ezek maximuma egy adott eloszlás függvényt követ Hasonlóan kvartilis táblázattal mondjuk meg az eredményt Diehard próbacsomag Inkább Kolmogorov-Smirnov alapú tesztek leginkább Születésnap próba Sorba állított elemek különbsége exponenciális eloszlást követ Parkoló próba Préselés próba (squeeze-test) 4

Exponenciális eloszlás (szülinap próba) Egyenletes eloszlás KÖSZÖNÖM A FIGYELMET! 5