AZ ELSÔ SZÁMJEGYEK BENFORD-TÖRVÉNYE ÉS A RADIOAKTÍV IZOTÓPOK FELEZÉSI IDEJE Gyürky Györy, Farkas János MTA Atommakutató Intézet, Debrecen Mindennapi életünkben körülvesznek minket a számok és e számoknak olykor érdekes és melepô tulajdonsáaik vannak. Az eyik ilyen melepô tulajdonsáot Benford-törvénynek nevezzük. Bármilyen furcsa és szinte hihetetlen is a törvény által leírt jelensé, annak iazsááról bárki könnyedén meyôzôdhet. Méis kevéssé ismert mé a tudomány mûvelôi körében is. Pedi a törvénynek már különbözô yakorlati felhasználásai is vannak. E cikk apropóját ey olyan alkalmazás adja, amely mint memutatjuk teljesen hibásan használja a törvényt. Ey kis történelem A 19. század véén Simon Newcomb, ey kanadai amerikai matematikus és csillaász érdekes felfedezést tett loaritmustáblázatok tanulmányozása közben. A Fizikai Szemle olvasóinak jó része talán már nem is tudja, mi az, hoy loaritmustáblázat. Az elektronikus számolóépek elterjedése elôtt ilyen táblázatok könnyítették me különbözô matematikai mûveletek elvézését, tehát például a tudósok yakran foratták a könyvekbe rendezett táblázatokat. Newcomb azt találta, hoy a könyvek elsô oldalai sokkal inkább kopottak voltak, mint a hátrébb található oldalak. Mivel a könyvekben a listák az eyes számtól kezdôdnek és a kilences számjeyel kezdôdô számokkal vézôdnek, íy a könyvek kopása alapján úy tûnt, a felhasználók yakrabban keresnek alacsony számjeyel kezdôdô számokat, mint maas kezdôszámjeyûeket. Newcomb melepô felfedezése hosszú idôre feledésbe merült, mínem 1938-ban a General Electric fizikusa, Frank Benford újra rábukkant a jelensére. Az ebbôl a felfedezésbôl születô törvény ezért az ô nevét viseli: az elsô számjeyek Benford-törvénye, vay eyszerûen csak Benford-törvény [1]. A táblázatok kopását úy értelmezte, hoy a természetben vay a mindennapi életünkben yakrabban fordulnak elô kis számjeyel kezdôdô számok. Ezt a melepô lehetôséet Benford ien alapos ellenôrzésnek vetette alá. A tudomány és a mindennapok számos különbözô területérôl vett adatokat, számsorokat, és az elsô számjeyek eloszlását vizsálta bennük. Adatbázisában metalálhatók voltak fizikai és matematikai állandók, molekulatömeek, földrajzi adatok, mint például folyók hossza és tavak területe, amerikai települések lélekszáma, híres emberek utcaházszáma, vay akár halálozási statisztikák is. Azt találta, hoy az adatsorok nay többséére valóban iaz, hoy az elsô számjeyek eloszlása nem eyenletes, hanem a kis számok irányába torzult. Például az eyessel kezdôdô számok több mint hatszor yakoribbak, mint a kilencessel kezdôdôek. Aki hitetlenkedve foadja ezeket az eredményeket, annak javaslunk ey próbát. Listázza ki az összes szá- GYÜRKY GYÖRGY, FARKAS JÁNOS: AZ ELSŐ SZÁMJEGYEK BENFORD-TÖRVÉNYE ÉS A RADIOAKTÍV IZOTÓPOK FELEZÉSI IDEJE 297
mot a Fizikai Szemle azon példányából, amit éppen a kezében tart és vizsálja me az elsô számjeyek eloszlását! Álljuk a foadást, hoy az adatok hibahatáron belül követni foják a Benford-törvény alább ismertetett matematikai alakját. A Benford-törvény matematikai jellezetesséei és alkalmazási lehetôséei A Benford által vizsált adatok eloszlása jól leírható ey eyszerû képlettel. Annak a valószínûsée, hoy ey szám elsô számjeye d a következôképpen adható me: P(d) = lo 1 1 Ezen valószínûséeket mutatja az 1. ábra. Például annak a valószínûsée, hoy ey szám eyessel kezdôdik, 3,1% (majdnem minden harmadik szám eyessel kezdôdik!), mí annak, hoy kilencessel, 4,6%. Veyük észre, hoy a valószínûséek meeyeznek annak esélyével, hoy ey loaritmikus skálán ábrázolt számeyenesen az 1 és 1 között véletlenszerûen kiválasztott pontnak mi az elsô számjeye. Ennek illusztrálása szintén szerepel az 1. ábrán. Cikkünk további mondanivalója szempontjából lényetelen, de a teljessé kedvéért meemlítjük, hoy a nem eyenletes eloszlás nemcsak a számok elsô, hanem késôbbi számjeyeire is érvényes. Ám ez már messze nem olyan szembeszökô, mint az elsô számjeyek esetén. A második számjeyben például a nulla yakorisáa 12%, a kilencesé pedi 8,5%. Ez már csak eleendôen nay adathalmaz esetén mutatható ki. Természetesen a tízes számrendszer kiválasztásának nincs kitüntetett szerepe. Ha a Benford-törvénynek eleet tevô adatsort átszámítjuk ey tetszôlees (nem túl nay) alapú számrendszerbe, akkor az íy nyert új adatsor szintén teljesíti a törvényt az adott számrendszerben kifejezve. Az (1) képlettel adott valószínûsé általános alakja n alapú számrendszerben adott számok esetén tehát: P(d) = lo n 1 1 d, d =1,2, 9. 1, d =1,2, n 1. d (1) (2) A Benford-törvény elsô látásra melepô tulajdonsáa a skálafüetlensé. Nem számított, hoy Frank Benford például a vizsált folyók hosszát kilométerben, mérföldben vay akár lábban adta me, az adatok minden esetben követték a törvényt. Ha tehát ey adatsorunk követi a törvényt, akkor ha minden adatot meszorzunk ey tetszôlees nemnulla állandóval, akkor az íy elôállt adatsor is követni foja a törvényt. Ez a jellezetessé jó lehetôséet teremt annak ellenôrzésére, hoy ey adatsor tényleesen követi-e a törvényt, mint ezt a késôbbiekben láthatjuk. A Benford-törvény yakorlati felhasználása is létezik, méhozzá melepô területeken. Az alkalmazás relatív elõfordulás,35,3,25,2,15,1,5 1 2 3 4 5 6 7 8 9 elsõ számjey 1. ábra Az elsô számjeyek eloszlása a Benford-törvény szerint. fôképpen azon alapul, hoy az emberek nem ismerik a törvényt. Ha ey adatsornak valamilyen okból követnie kell a törvényt, de ezt mésem teszi, az yanús. Tehát könnyen leleplezhetôvé válik az adatsort létrehozó olyan ember, aki nem ismeri a törvényt. Ezért leyakrabban csalások leleplezésére használják a Benford-törvényt. Az elsô számjeyek eloszlását vizsálva derítettek már fel adócsalásokat, választási visszaéléseket, lepleztek le hamisított adatsort használó eyetemi szakdolozót. Sôt, a Benfordtörvény alapján vézett ellenôrzés mé azt is memutatta, hoy Göröorszá kozmetikázta államháztartási adatait [2]. Csalások leleplezésén kívül is van példa a törvény használatára. Mevizsálták például földrenés-érzékelô szeizmométerek adatait és más eloszlást találtak az elsô számjeyekben ey adott földrenést meelôzô adatokban és a renés során [3]. Szintén próbálták alkalmazni radioaktív izotópok felezési idejét szoláltató elméletek tesztelésére. Mint memutatjuk, hibásan. Errôl szól cikkünk hátralévô része. Radioaktív izotópok bomlásának felezési ideje A 21. század elejére fôként a radioaktív ionnyalábokkal vézett kutatásoknak köszönhetôen több mint 35 különbözô (eltérô proton- vay neutronszámú) izotópot ismerünk. Ezen izotópok döntô többsée radioaktív és általában ismerjük bomlásuk felezési idejét is. Mit mutat az ismert izotópok felezési idôibôl képzett adatsor, ha mevizsáljuk a Benfordtörvény szempontjából? 28-ban Dondon Ni és Zhonzhou Ren ey ranos folyóiratban publikálták cikküket, amelyben mevizsáltak mintey 3 radioaktív izotópot és azt találták, hoy felezési idôik jól követik a Benford-törvényt [4]. A tapasztalaton felbuzdulva a szerzôk a háttérben rejlô fizikai okokat boncolatták, és odái jutottak, hoy a Benford-törvénnyel való öszszevetés alkalmas lehet olyan elméleti modellek ellenôrzésére, amelyekbôl bomlások felezési ideje 1 8 9 7 6 5 4 3 2 1 298 FIZIKAI SZEMLE 215 / 9
relatív elõfordulás,35,3,25,2,15,1,5 1 2 3 4 5 6 7 8 9 elsõ számjey 2. ábra. A NUBASE23 adatbázisban található felezési idôk elsô számjeyeinek eloszlása. származtatható. Mint alább memutatjuk, ez az elképzelés a törvény teljesen hibás értelmezésébôl fakad és a leírt formában nem alkalmas elméleti modellek tesztelésére. Elôtte azonban véezzük el saját vizsálatunkat a felezési idôk adatbázisán! Ehhez a vizsálathoz az adatokat a NUBASE23 adatbázisból vettük [5]. Nem vettük fiyelembe azokat az izotópokat, ahol nem konkrét érték, hanem csak alsó vay felsô határ volt meadva. Íy összesen 2298 adatból indultunk ki. Az analízis eredménye látható a 2. ábrán, illetve a számszerû értékeket az 1. táblázat tartalmazza. Mint láthatjuk, a felezési idôkben az elsô számjeyek eloszlása valóban jól követi a Benford-törvény által diktált elvárásokat az adott mintanaysára jellemzô hibahatáron belül. A Benford-törvény várható hibáját a binomiális eloszlás standard bizonytalansáa alapján adtuk me. A Benford-törvény skálainvarianciáját kihasználva adatsorunkat mé alaposabb tesztnek vethetjük alá, hoy a törvénynek való enedelmesséet mé erô- 3. ábra. Skálázási teszt: az eyesek elsô számjeyként való relatív elôfordulása a felezési idôk többszöri, 1,1-dal való meszorzása után.,32 relatív elõfordulás,31,3,29,28 1 2 3 4 5 6 skálázások száma 1. táblázat A felezési idôk adatbázisában az adott elsô számjeyek elôfordulásának száma, illetve a Benford-törvény által jósolt értékek elsô számjey elôfordulások tapasztalt száma az adatbázisban Benford-törvény alapján várt elôfordulásszám 1 71 692 ± 22 2 45 45 ± 18 3 281 287 ± 16 4 21 223 ± 14 5 29 182 ± 13 6 149 154 ± 12 7 112 133 ± 11 8 119 118 ± 11 9 112 15 ± 1 sebben bizonyíthassuk. Az adatbázisban található minden eyes értéket ey tetszôlees állandóval szorozva mevizsálhatjuk, hoy például az adatok hány százaléka kezdôdik eyes számjeyel. Ennek a százaléknak mindi az elvárt 3,1% közelében kell lennie, akárhányszor vézünk is új skálázást. Tesztünkhöz az 1,1 értéket választottuk skálázási tényezôként. Ezzel a számmal szoroztuk me a teljes adatbázist eymás után több száz alkalommal és minden lépésben vizsáltuk az eyes, mint elsô számjey yakorisáát. E skálázási teszt eredménye található a 3. ábrán. Jól látható, a yakorisá a Benford-törvény várhatóértéke, 3,1% körül inadozik, nayjából a hibatartományon belül. Tehát a skálázási teszt is eyértelmûen bizonyítja, hoy a felezési idôk valóban követik a Benford-törvényt. Ha a felezési idôk ilyen kiválóan követik a törvényt, miért állítjuk azt, hoy mésem alkalmas a törvény elméleti modellek tesztelésére? Az indokoláshoz elôször lássuk, hoy mi van a törvény möött! Ez azért fontos, mert bár nem túlsáosan bonyolult doloról van szó, méis érdekes és olykor hajmeresztô mayarázatok láttak napviláot arra, hoy a törvény miért ír le jól oly sok, mindennapi életünkben felbukkanó adatsort. Például mé maa Benford is olyan mayarázattal próbált szolálni, hoy mí mi emberek úy számolunk, hoy 1, 2, 3,, addi a természet úy számol, hoy e 1, e 2, e 3,. Ilyen misztikus mayarázatokra természetesen nincs szüksé. Olyannyira nincs, hoy memutatható, ha ey adatsorban az elsô számjeyek eloszlása skálainvariáns, akkor az adatoknak szükséképpen követniük kell a Benford-törvényt. Mikor teljesül ey adatsorra a Benford-törvény? Az a feltétel, hoy ey szám ey adott számjeyel kezdôdik, könnyebben kifejezhetô a szám loaritmusának használatával. Valóban, ey x szám akkor és GYÜRKY GYÖRGY, FARKAS JÁNOS: AZ ELSŐ SZÁMJEGYEK BENFORD-TÖRVÉNYE ÉS A RADIOAKTÍV IZOTÓPOK FELEZÉSI IDEJE 299
csak akkor kezdôdik például eyes számjeyel, ha loaritmusára iaz, hoy ahol n ey tetszôlees eész szám. Hasonló összefü- és írható fel bármely más kezdôszámjey esetén is. Mit jelent a skálainvariancia a loaritmus használata esetén? Az adatok konstanssal való szorzása a loaritmusnál ey konstans hozzáadását jelenti: n lo(x) <n,31, ahol a = lo(a). Ey a konstanssal való szorzás után tehát annak valószínûsée, hoy az elsô számjey eyes újra a következô: tehát lo(a x) = lo(x) a, n lo(a x) <n,31, Ez mindössze ey lo(a) konstanssal való eltolást je- lent. A skálainvariancia meköveteli, hoy a két valószínûsé meeyezzen. Ez csak akkor teljesülhet, ha a számsor számainak loaritmusa (pontosabban annak tizedesvesszô utáni része) eyenletes eloszlást követ a [,1) intervallumon! A fenti okfejtést iyekszik szemléltetni a 4. ábra, ahol ey vizsálandó adatsorban lévô számok eloszlásfüvénye látható loaritmikus skálán. A szürkével fedett terület mutatja azokat a számokat, amelyek elsô számjeye eyes. A fekete terület pedi azt mutatja, melyek azok a számok, amelyek a szürke területre kerülnek ey bizonyos skálázás során, tehát az eész adatsor adott konstanssal való meszorzása után. A szürke csíkos területre esô értékek a skálázás elôtt eyessel kezdôdnek, de a skálázás után már nem. Az adatsorunkban akkor teljesül a skálainvariancia, azaz akkor nem változik az adott számjeyyel való kezdôdés valószínûsée, ha a fekete és a szürke csíkos terület eymással eyenlô, tehát a skálázás során annyit veszítünk az eyik oldalon, amenynyit nyerünk a másikon. Ezek alapján kvalitatív kritériumot adhatunk arra nézve, hoy milyen eloszlást kell követnie ey adathalmaznak, hoy a Benford-törvény iaz leyen rá. Triviálisan iaz lenne a törvény, ha az adatok például sziorúan 1 és 1 közé esnének és a loaritmusuk ezen az intervallumon eyenletes eloszlású lenne. Ilyen eloszlás a természetben vay a mindennapi életben azonban ritkán fordul elô. Sokkal fontosabb a másik eset (4. ábra), amikor az eloszlás olyan, hoy sok naysárendet átívelôen nayjából eyenletes a loaritmikus skálán. Ekkor a szürke területek eltolása összesséében nem változtatja me az összterületüket, mert az esetlees kis eltérések kiátlaolódnak. Kimondható tehát, hoy amennyiben ey adatsorban sok naysárendet átfoóan találhatók értékek, mépedi loaritmikusan nayjából eyenletes eloszlásban, akkor az adatsor jól foja követni a Benford-törvényt. A fent elmondottak persze nem tekinthetôk matematikai iényesséû bizonyításnak, az túlmutatna n lo(a) lo(x) <n lo(a),31. f() f() f() P 1 2 1 1 2 3 4 5 + + 1-yel kezdõdik 1-yel fo kezdõdni,5 1 1,5 2 4. ábra. A skálázás hatása az 1-ek eloszlására. A szürke csíkos részre esô számok a skálázás után már nem fonak 1-yel kezdôdni, mí a fekete részek a skálázás elôtt nem kezdôdtek 1-yel, de utána már ien. A szürke részre esô számok a skálázás elôtt és után is 1-yel kezdôdnek. cikkünk keretein. Bizonyítás nélkül közöljük csak az ezakt kritériumot, az érdeklôdôk metalálhatják a részleteket a [6] vay [7] dokumentumban. Tehát ey adatsor akkor és csak akkor teljesíti a Benford-törvényt, ha az adatok eloszlásfüvényének Fouriertranszformáltja eltûnik minden eész értéknél (frekvenciánál). Gyakorlatban eleendô a törvény jó közelítéssel való teljesüléséhez, ha az említett Fouriertranszformáltak elé kis értéket vesznek fel eész frekvenciáknál. Mit mondhatunk el a felezési idôkrôl? Az 5. ábra a felezési idôk eloszlását mutatja loaritmikus skálán. A teljes adatbázis mintey 5 naysárendet ölel fel, tehát ien széles eloszlásról van szó. Uyan messze elõfordulás 16 14 12 1 8 6 4 2 D 5. ábra. Felezési idôk elôfordulása. 16 12 2 1 1 2 3 l /s t 1/2 8 4 a) b) 4 2 2 4 6 8 2,5 3 FIZIKAI SZEMLE 215 / 9
nem loaritmikusan eyenletes, de a középsô kiemelkedô része (lásd a kis ábrán) mé mindi sok naysárendet fo át melehetôsen sima eloszlással. Íy nem melepô, hoy az adatsorra teljesül a Benford-törvény. Konklúzió Miért állítjuk tehát, hoy a Benford-törvény nem alkalmas felezési idôt számító elméleti modellek tesztelésére? A válasz az, hoy a Benford-törvénnyel való szembesítés csak az adathalmaz eloszlásfüvényének alakját vizsálja. Ha az adatok sok naysárendet átívelôen mefelelôen eyenletes eloszlásúak, akkor a Benford-törvény teljesülni fo. Tehát, ha ey elméleti modell ilyen felezési idôket szoláltat, akkor ki foja állni a törvény próbáját. De ez a próba önmaában nem mond semmit arról, hoy a modell fizikaila mennyire helyes. A tapasztalattal teljesen összeeyeztethetetlen eredményt adó modellek is teljesíthetik a törvényt, mésem foadjuk el ôket helyesnek. Ez fordítva is iaz: ha ey modell naysárendile helyesen írja le atommaok széles körének felezési idejét a mikroszekundumtól a milliárd évi, akkor ez ey kiváló modell lehet. Ám esetle a modell mealkotói az elméletük korlátait felismerve minden felezési idôt csak naysárendi pontossáal, 1 1 n s alakban adnak me, akkor az adathalmaz triviálisan nem foja teljesíteni a Benford-törvényt, pedi fizikaila ien értékes az elmélet. A Benford-törvény a viláunkban elôforduló számok ey elsô pillantásra melepô, ien érdekes tulajdonsáát írja le. A körülötte kialakult kultusznak köszönhetôen az érdeklôdô olvasók bôsées (fôként anol nyelvû) irodalmat találhatnak a témával folalkozó yûjtô-weboldalon [8]. Már ma is szép számmal akadnak a törvénynek yakorlati alkalmazásai, és várhatóan ez a jövôben mé inkább íy lesz. Körültekintôen kell azonban bánnunk a törvény alkalmazhatósáával, nehoy olyan hibát kövessünk el, mint az írásunkban idézett szerzôk a felezési idôk esetén. Irodalom, hasznos weboldalak 1. http://en.wikipedia.or/wiki/benford s_law 2. http://index.hu/tudomany/brittudosok/211/1/25/matematiku sok_jottek_ra_a_oro_csalasra/, http://www.cesruc.or/uploads/soft/1331/1-13311z221.pdf 3. http://onlinelibrary.wiley.com/doi/1.129/21gl4483/pdf 4. D. Ni, Z. Ren, Eur. Phys. J. A 38 (28) 251. 5. G. Audi et al., Nucl. Phys. A 729 (23) 3. 6. http://oo.l/pv59w 7. S. W. Smith: The Scientist and Enineer s Guide to Diital Sinal Processin. California Technical Publishin, 1997, 28, Ch. 34, pp. 71 722. 8. http://www.benfordonline.net 31