A véletlen, kiszámítás és információ viszonya

Hasonló dokumentumok
XIII. Bolyai Konferencia Bodnár József Eötvös József Collegium, ELTE TTK, III. matematikus. A véletlen nyomában

Probabilisztikus modellek V: Struktúra tanulás. Nagy Dávid

Mesterséges intelligencia, 7. előadás október 13. Készítette: Masa Tibor (KPM V.)

HELYI TANTERV MATEMATIKA (emelt szintű csoportoknak) Alapelvek, célok

EMMI kerettanterv 51/2012. (XII. 21.) EMMI rendelet 2. sz. melléklet Matematika az általános iskolák 5 8.

Véletlenszám generátorok

Matematika. Padányi Katolikus Gyakorlóiskola 1

különösen a média közleményeiben való reális tájékozódást. Mindehhez elengedhetetlen egyszerű matematikai szövegek értelmezése, elemzése.

informáci démona Benczúr András ELTE IK ELTE escience RET

2. fejezet Hálózati szoftver

MATEMATIKA 5 8. ALAPELVEK, CÉLOK

5. évfolyam. Gondolkodási módszerek. Számelmélet, algebra 65. Függvények, analízis 12. Geometria 47. Statisztika, valószínűség 5

Fizika évfolyam. tantárgy 2013.

Számítógépek és híradástechnika: az emberiség új kommunikációs korszaka I. Rész: A kommunikáció fejlődése és a jelek új világa Benczúr András

MATEMATIKA 1-2.osztály

Matematika helyi tanterv 5 8. évfolyam számára Alapelvek, célok

Mesénkben a példák, amelyeket az óvodáskorú gyermekek könnyen megérthetnek, elemi matematikai információkat közölnek. Könyvünk matematikai anyaga

Digitális technika VIMIAA01

BIZONYTALAN ADATOK KEZELÉSE: FUZZY SZAKÉRTŐI RENDSZEREK

különösen a média közleményeiben való reális tájékozódást. Mindehhez elengedhetetlen egyszerű matematikai szövegek értelmezése, elemzése.

Apor Vilmos Katolikus Iskolaközpont. Helyi tanterv. Matematika. készült. a 51/2012. (XII. 21.) EMMI rendelet 1. sz. melléklet 1-4./1.2.3.

reális tájékozódást. Mindehhez elengedhetetlen egyszerű matematikai szövegek értelmezése, elemzése. A tanulóktól megkívánjuk a szaknyelv életkornak

A tanulói tevékenységre alapozott fizikaoktatás változatos tevékenységkínálatával lehetővé teszi, hogy a tanulók kipróbálhassák és megismerhessék

különösen a média közleményeiben való reális tájékozódást. Mindehhez elengedhetetlen egyszerű matematikai szövegek értelmezése, elemzése.

Az 5-2. ábra két folyamatos jel (A és B) azonos gyakoriságú mintavételezését mutatja ábra

Információelmélet Szemináriumi gyakorlatok

Matematika évfolyam. tantárgy 2013.

GAZDASÁGI STATISZTIKA

Osztályozóvizsga követelményei

19. Hasításos technikák (hash-elés)

Az élet bonyolult. Maróy Ákos

Az informatika tantárgy fejlesztési feladatait a Nemzeti alaptanterv hat részterületen írja elő, melyek szervesen kapcsolódnak egymáshoz.

EMMI kerettanterv 51/2012. (XII. 21.) EMMI rendelet 1. sz. melléklet Matematika az általános iskolák 1 4. évfolyama számára

Fejlesztendő területek, kompetenciák:

Matematika évfolyam. Vass Lajos Általános Iskola Helyi tanterv Matematika 1 4. osztály

Matematika helyi tanterv,5 8. évfolyam

Matematika évfolyam

képességgel és készséggel, hogy alkalmazni tudják matematikai tudásukat, és felismerjék, hogy a megismert fogalmakat és tételeket változatos

Mesterséges Intelligencia MI

NIKerettanterv MATEMATIKA 1. évfolyan Éves óraszám: 180 óra, heti 5 óra

értelmezéséhez, leírásához és kezeléséhez. Ezért a tanulóknak rendelkezniük kell azzal a képességgel és készséggel, hogy alkalmazni tudják

Gyarmati Dezső Sport Általános Iskola MATEMATIKA HELYI TANTERV 1-4. OSZTÁLY

Nemzeti alaptanterv 2012 MATEMATIKA

JANUS PANNONIUS TUDOMÁNYEGYETEM. Schipp Ferenc ANALÍZIS I. Sorozatok és sorok

MATEMATIKA Kiss Árpád Országos Közoktatási Szolgáltató Intézmény Vizsgafejlesztő Központ

A hierarchikus adatbázis struktúra jellemzői

Számsorozatok Sorozat fogalma, példák sorozatokra, rekurzív sorozatokra, sorozat megadása Számtani sorozat Mértani sorozat Kamatszámítás

TARTALOM AZ INFORMATIKA FOGALMA A fogalom kialakítása Az informatika tárgyköre és fogalma Az informatika kapcsolata egyéb

TANMENETJAVASLAT AZ ÚJ KERETTANTERVHEZ MATEMATIKA 1. ÉVFOLYAM KÉSZÍTETTÉK: KURUCZNÉ BORBÉLY MÁRTA ÉS VARGA LÍVIA TANKÖNYVSZERZŐK 2013

TÁVOKTATÁSI TANANYAGOK FEJLESZTÉSÉNEK MÓDSZERTANI KÉRDÉSEI

Gyártási folyamatok tervezése

1. Bevezetés. A számítógéptudomány ezt a problémát a feladat elvégzéséhez szükséges erőforrások (idő, tár, program,... ) mennyiségével méri.

CCI-szám: 2007HU16UPO001. EGYSÉGES SZERKEZETBE FOGLALT MÓDOSÍTÁS november

Valószínűségszámítás

ÍRÁSBELI KIVONÁS. 31. modul. Készítette: KONRÁD ÁGNES

A szárazmegmunkálás folyamatjellemzőinek és a megmunkált felület minőségének vizsgálata keményesztergálásnál

Vári Péter-Rábainé Szabó Annamária-Szepesi Ildikó-Szabó Vilmos-Takács Szabolcs KOMPETENCIAMÉRÉS 2004

Az enyhe értelmi fogyatékos fővárosi tanulók 2009/2010. tanévi kompetenciaalapú matematika- és szövegértés-mérés eredményeinek elemzése

HELYI TANTERV MATEMATIKA GIMNÁZIUMI OSZTÁLYOK

A kompetenciákhoz tartozó indikátorok értelmezése példákkal az adott terület, tantárgy vonatkozásában. Szakterületi/szakspecifikus példák

Helyi tanterv Német nyelvű matematika érettségi előkészítő. 11. évfolyam

A Számítógépek felépítése, mőködési módjai. A Számítógépek hardverelemei

MATEMATIKA TANTERV Bevezetés Összesen: 432 óra Célok és feladatok

Szakdolgozat. Pongor Gábor

MATEMATIKA. Tildy Zoltán Általános Iskola és Alapfokú Művészeti Iskola Helyi tanterv 1-4. évfolyam 2013.

Következõ: Lineáris rendszerek jellemzõi és vizsgálatuk. Jelfeldolgozás. Lineáris rendszerek jellemzõi és vizsgálatuk

KÖNYVTÁR-INFORMATIKAI KÉPZÉS A KLTE-N

8. Mohó algoritmusok Egy esemény-kiválasztási probléma. Az esemény-kiválasztási probléma optimális részproblémák szerkezete

Készítette:

Gyakorlatok. P (n) = P (n 1) + 2P (n 2) + P (n 3) ha n 4, (utolsó lépésként l, hl, u, hu-t léphetünk).

Kiegészítés a Párbeszédes Informatikai Rendszerek tantárgyhoz

Terület- és térségmarketing. /Elméleti jegyzet/

GAZDASÁGINFORMATIKA ALAPJAI...

Matematikai alapok. Dr. Iványi Péter

A 3D képgenerálás komplexitása

Mára új helyzet alakult ki: a korábbiakhoz képest nagyságrendekkel komplexebb

Analízis előadás és gyakorlat vázlat

2014. március TÉMA HÉT

A tudás alapú társadalom iskolája

Gyakorló feladatok ZH-ra

ÍRÁSBELI ÖSSZEADÁS, KIVONÁS. A MŰVELETI SORREND SZÁMÍTÁSOKBAN ÉS SZÖVEGES FELADATOK MEGOLDÁSA SORÁN. 9. modul

Kémia: A kémia kerettanterv (B változat) 10% szabadon tervezhető órakeretének felhasználása: 9. évfolyam: A kémia és az atomok világa:

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

Diplomamunka. Miskolci Egyetem. Leghosszabb szériák vizsgálata. Készítette: Selling István Mérnök Informatikus MSc jelölt

4. Előfeltételek (ha vannak) 4.1 Tantervi Nincs 4.2 Kompetenciabeli Feladatok kijelentéseinek megértése

15. BESZÉD ÉS GONDOLKODÁS

MAGYARORSZÁG TÁRSADALOMTÖRTÉNETE A POLGÁRI KORBAN

értelmezéséhez, leírásához és kezeléséhez. Ezért a tanulóknak rendelkezniük kell azzal a képességgel és készséggel, hogy alkalmazni tudják

Készítette: Fegyverneki Sándor. Miskolci Egyetem, 2002.

Útmutató a Matematika 1. tankönyv használatához

Történelemtanítás Online történelemdidaktikai folyóirat

Építőipari Szakképző Iskolája 9024 Győr, Nádor tér 4.

Kombinatorika évfolyam. Szerkesztette: Surányi László Ábrák: Hraskó András december 6.

Analízisfeladat-gyűjtemény IV.

Ittfoglalomösszea legfontosabbtudnivalókat, részleteka honlapon, illetvea gyakorlatvezetőtől is kaptok információkat.

MATEMATIKA ÉVFOLYAM


OPERÁCIÓKUTATÁS, AZ ELFELEDETT TUDOMÁNY A LOGISZTIKÁBAN (A LOGISZTIKAI CÉL ELÉRÉSÉNEK ÉRDEKÉBEN)

FRAKTÁLOK ÉS A KÁOSZ

Átírás:

A véletlen, kiszámítás és információ viszonya Benczúr András ELTE IK ELTE escience RET A Természet Világa alapításának 140. évfordulója alkalmából 2009. szeptember 18. 1

Bevezető: A kommunikáció, Shannon hírközlési modellje, az információelmélet kezdetei. Az adatátvitel kérdése, adatátviteli hálózatok, műsorszórás. A forrás bizonytalansága - más lett fontos: nem az elemi üzenetválasztás, hanem az összefüggő üzenet-adatvilág került előtérbe. A múlt adatbázisának kezelése, a jövő adatbázisának tervezése összefonódik. 2

Információelméleti háttér A múlt fuzzy, a jövő véletlen. A múlt van az adatbázisokban, a jövő lehetőségeinek alakítása van a számításokban: az eloszlást tudjuk befolyásolni, nem a teljes véletlent. Jim Gray: a mérések fuzzyk, a számítások közelítők új tudományos módszerek, e-science Juris Hartmanis: a véletlen, algoritmusok, Kolmogorov komplexitás 3

Van már, amivel tudunk mit kezdeni, sok minden van, amire fejlesztik a technológiát. Juris Hartmanis: (idézet Turing-díj előadásából, ACM Communications, 1994. október) Meg vagyok győződve, hogy a számítástudomány már eddig is teremtett és továbbra is hatalmas lehetőségeket teremt fizikai és intellektuális világunk megértéséhez való hozzájárulásban. A kiszámítás paradigmája, egyre hatékonyabb univerzális számítási berendezésekkel ellátva, motiválja és teszi lehetővé a fizikai és intellektuális folyamatok feltárását és szimulálását, és egyben felbecsüli lehetőségeiket és korlátjaikat. 4

Az információ mérőszámai Kiindulás: mit mérnek? Valaminek a leírását adjuk meg, helyettesítünk jelekből álló leírásokkal. Lehetőleg rövid leírásokat keresünk. A leírásból kívánt pontossággal visszanyerhető legyen, amit helyettesít. Az információ mérőszámai leírások hosszára vonatkoznak, az adott feladat szempontjából optimális megoldás hosszát adják meg. 5

Az információ mérőszámai Kolmogorov: Három megközelítés 1. Valószínűségi: Shannon-entrópia n H( p, p, p ) p log p 1 2 n i 2 i 2. Algoritmusos: Kolmogorov-entrópia C x C U i 1 ( x) min l p U p x, és, ha nincs A definícióban U a rögzített referencia függvény, tipikusan az univerzális Turing - gépet választják. ilyen p. 3. Kombinatórikus: azonos hosszú kód a halmaz minden elemére 6

Definíció: Az feltételes Komogoroventrópia C x y C ( x y) A definícióban U a U min l p U p, y rögzített kétváltozó s x, és, ha nincs ilyen referencia függvény. p. Prefix-változat: Az U által használt kódok prefixmentes rendszert alkotnak. A megfelelő entrópiák jelölése: K x, és K x y. Az algoritmikus entrópiák konstans erejéig egyértelműek. 7

Játék a kombinatórikus entrópiával n kocka felcímkézése Azonos hosszú bináris kódot kell ragasztani minden kockára: nlog 2 n bit összesen. (Ennél kisebb összhossz prefixmentes kódokkal nem érhető el.) Legyenek színes kockáink, és színenként kell azonos hosszú kódot ragasztani: i k 1 Mennyi bitet nyertünk: n ni log 2 n ahol i k 1 k bitre van szükség, a színek száma, az i - edik színnel n i n n n n i 1 2 log2 nh, n n n n i i és számú kocka, nk n rendelkezi k. 8

Az egyenletesség szerepe A halmaz szerinti prefix entrópia A kombinatórikus entrópia az egyenletes eloszlás optimális kódja - miatt a halmaz szerinti feltételes prefix entrópiára teljesül a következő egyenlőtlenség: Legyen S egy m elemű, természetes számokból álló halmaz. Ekkor: K x S m m log 2 x S Az egyenletes hosszúságú kódnál átlagosan nem jobb a feltételes optimális kód. 9

T 1, T 2, - a standard felsorolása a prefix Turing gépeknek, T i a i függvényt számolja ki. Definíció. Adott y szerint x feltételes prefix Kolmogorov bonyolultsága: K K x x y K min p, i x l i' p : T 0,1 *, i Az univerzális prefix TM : U(y I p)=t i (y p) Ekvivalens definíciót ad: K(x y)=min q {l(q):u(y q)=x} Definiáljuk az A= {x 1, x 2,,x m } halmazra: K(A)=K( A ), és K(x A)=K(x A ). i y' p x, p N. 10

Honnan következtethetünk a jövő eloszlására? Hogyan befolyásolhatjuk a jövő eloszlását? A múltra vonatkozó ismereteinket kell felhasználni. Ez az ismeret most a világháló adatbázisában gyűlik. A múlt leírásának tömöríthetősége: a Kolmogorov entrópia világa A Shannon entrópia: a jövő leírásának tömörségére ad mérőszámot: a jövő lehetséges kimeneteleinek eloszlása ismeretében mi a megkülönböztető leírások hosszának várható értéke? Ennek alsó határa a Shannon entrópia. (felkészülés a jövőre) Kétrészes kód: törvényszerűség leírása és a maradó véletlen, tipikus adat (jelentése a jövőre nézve) 11

A feltételes Kolmogorov bonyolultság alkalmazása, a két részes kód: a) Adott elemet tartalmazó egyszerűen leírható halmaz, abban tipikus elem b) Kevés elemszámú, egyszerűen leírható halmaz A halmaz lehet például egy valószínűségeloszlásból származó tipikus minták halmaza (Bernoulli eloszlás) Példa: 2n szögpontú, q,p paraméterű reguláris páros gráf 12

Definíció: A Kolmogorov struktúra függvény: h min log S : x S, x 2 K S S * : U S * S, A tanú halmaz a h x (α) értékhez S x (α). K(S x (α)), és log 2 S x (α) =h x (α). K(x) + h x (α)+c. (i) S={x}, K(S) K(x)+O(1), tehát h x (K(x)+O(1))=0. (ii) =0+O(1) esetében az {y:l(y)=n} halmazra h x (0+O(1)) n. 13

Definíció: x S esetén a halmazon belüli véletlenségi hiány x S log 2 S K x S * x S, ha és egyébként. Definíció: A minimális véletlenségi hiány függvény min x S : x S, K x S S az üres halmazon a minimum végtelen. Az x kétrészes kódjához az MDL (Minimum Description Length) függvény a következő: min log S K S : x S, K x 2 S A három függvény között logaritmikus additív pontossággal (mind az értékekben, mind az argumentumokban) a következő egyenlőség teljesül: x h x K x x S K x 14

Az információ fogalma Idegen szavak szótárából: Információ: 1. felvilágosítás, tudósítás, tájékoztatás, hírközlés 2. értesülés, adat 3. tudósítási, tájékoztatási anyag, hír Informál: tájékoztat, felvilágosít, tudósít 15

Saját megközelítésem Visszatérve az információ fogalmára, a három matematikai mérőszám behatárol egy fogalmat: az információ az, aminek a mennyiségét mérik. Más kontextusban használt információra ezek a mérőszámok felelőtlenül nem használhatók. Szerintem az információ fogalma történetileg érthető, Kezdet: Az információ az élettelen és élő határvonalának egyik oldalán: az élőnél jelenik meg. Az élettelenben az információ értelmezhetetlen. 16

Saját megközelítés Az élő az információ reprezentálására nem csupán belső lehetőségeit használja, hanem az élettelent is felhasználja reprezentáció céljából. Hibás az a fogalomalkotás, ami ezt a reprezentációt az élettelen információjaként tünteti fel. Majd a kommunikációnál térünk vissza erre. Az információ a múltra vonatkozik, és a jövőre való felkészülésben hasznosul. Az eredeti latin szó egyik értelmezése sem vonatkozik a jövőre. A jövőről nincs tudósítás, a jövőre lehetnek előrejelzések, akár teljes biztosak is, de lehetnek csupán elképzelések is, akár minden esély nélkül. Valakinek a jövőre vonatkozó elképzelései is csak a múltról tudósítanak: egy múltban lezajlott gondolkodás eredményéről. 17

Információ Az élet, az élő egyed gyűjt információt, átad, örökít információt. Miben, hol jelenik meg először az információ? A sejten belül, majd az élő szövet szerveződéseiben és mozgásaiban. Miből keletkezik az információ: a fizikai-kémiai hatásokból, az érzékelésekből. Hogyan hat az információ: érzékelődik. Ami érzékelődik, az mozgás (változás), és mozgást (változást) tud kiváltani. Az a mozgás megint érzékelődik is. És így tovább. Van benne eleve rekurzió. 18

Információ Az állatvilág egyik jellemzője a célirányos mechanikai mozgás, helyváltoztatás. Ehhez a mozgás vezérlésében, koordinálásában igen nagy teljesítményű információfeldolgozás, igen nagy kiszámítási teljesítmény szükséges. Az idegrendszer méretezése ehhez a csúcsteljesítményhez igazodik. Amikor nincs mozgás, ez a kapacitás kihasználatlan, előfordulhat, hogy más információfeldolgozást is végezhet. Akaratlagossá is válhat ez a tevékenység, bizonyos mértékben irányíthatóvá, ami a gondolkodáshoz vezet. Ennyi dióhéjban a biológiai individuumok belső informatikája. 19

Információ A következő informatikai szint az élővilágban az egyedek közötti kommunikáció. Ennek kiinduló elve az idegrendszerek függetlensége. Ez alatt azt értem, hogy egyik élőlény a másik belső információreprezentációit és folyamatait közvetlenül nem ismerheti. Nincs az idegrendszereknek közvetlen együttműködése. Az egymásra hatás csak közbeiktatott közeg változásain keresztül történhet. Ez a kommunikáció. Eddigi írásaim innen indultak: a kommunikációból. 20

Új hangsúly : instrumentális elemi észlelés, élménymegosztás, vizuális üzenetek, tetszőleges multimédia forrás használható Új üzenet keletkezése V1 V Üzenet észlelése V2 E1 Üzenet kibocsátás Változtatás a valós világban Térbeli, időbeli terjedés E2 T1 Valóság - Egyén - Tudat T2 21

Információs rendszer Új, relatív üzenet keletkezése V Közös észlelés V Közös ismeretrendszer Új, relatív kérdés üzenet keletkezése V E E T Valóság - Egyén - Tudat Válaszüzenet T 22

Konvergencia: informatika-távközlés-média Integrálódás: informatika integrálja a komponenseket F A CS V C C C ADAT ADAT Illesztés valós folyamathoz Illesztés valós folyamathoz Multimédia, mérés és automatizálás, folyamatirányítás, térinformatika, bioinformatika, 23 e-világ, CAD, CAM,...

A véletlen és kiszámítás információra nem lenne szükség véletlen nélkül, az információ nem lenne használható kiszámítás nélkül. Nem lenne semmi szerepe. A véletlen matematikai modelljét a jövő leírásának eszközeként használhatjuk, mint a jövő bizonytalanságának, kiszámíthatatlanságának leírási módszerét. A múlt homályos leírása és a múlt véletlen gyökerei, valamint a jövő bizonytalanságát modellező valószínűségeloszlásra való következtetéseink hogyan hozhatók össze? A jövőre csak a múltból következtethetünk. Beck Mihály a Parajelenségek és paratudományok c. könyv 67- oldalán: A különböző folyamatok időbeli lejátszódásának leírása valójában csak akkor lehetséges, ha a jövő nem más, mint megismételt múlt. 24

Mindez erőteljesen összefügg a kiszámíthatóság világával, s ezért ide tartozik a Turing-díjas Juris Hartmanis (az idő- és tárbonyolultság elméletének egyik megalapozója) Turing-előadásából: A kiszámítás paradigmája lehetővé tette a véges és végtelen sorozatok Kolmogorov bonyolultságának segítségével a véletlen fogalmának tisztázását. Megint, a kiszámítási modell univerzalitása lényeges szerepet játszik ezen fogalmak érvényességének bizonyításában. Számítás-bonyolultsági megfontolások finomították a véletlenség viszonylagos fogalmát a tekintetbe vett alkalmazáshoz viszonyítva. Bizonyítást nyert, hogy mi véletlen (elfogadható vagy átmegy a teszten), az attól függ, mekkora a számítási kapacitása az adott alkalmazásnak. Továbbra is igen mély nyitott problémák vannak ezen a területen a fizikai folyamatok és a kiszámítás viszonyáról. A Kolmogorov-véletlen sorozat (nem tömöríthető egyik kezdőszelete sem) nem kiszámítható, mégpedig igen erős értelemben: nincs olyan Turing gép, amely ki tudna írni egy véletlen sorozatot saját méreténél (program hossza, vagyis a leírása) nagyobb hosszúságban. Vajon a megfelelő törvény (tétel) igaz-e minden fizikai rendszerre? Tud-e egy kis fizikai rendszer tetszőleges hosszúságú Kolmogorov-véletlen sorozatot előállítani, vagy még pontosabban, képes-e egy véges fizikai rendszer (pontosan meghatározva a szükséges energia bemenettel, de véletlenszerűség hozzávétele nélkül) korlátlan Komogorovvéletlen sorozatot előállítani? Ha igen, akkor valójában a fizikai folyamatokat nem lehet teljes mértékben szimulációval jellemezni. 25

Rényi Alfréd egy kérdése Lehet egy vizsga nehézségét azzal jellemezni, hogy hány bit-et kell a hallgatóknak tudni? Enciklopédikus jellegű tárgyakban ez nem is teljesen abszurdum, a matematikában, persze, ennek nincs értelme, hiszen a dolgok egymásból következnek, aki az alapokat tudja, elvben mindent tud, illetve tudhatna. Egy matematikai elmélet összes eredménye tulajdonképpen csírájában benne van az axiómákban vagy mégsem? Erről egyszer még gondolkodni fogok. (Rényi Az információ matematikai fogalmáról (Egy egyetemi hallgató naplója) Ars Mathematica, Rényi Alfréd összegyűjtött írásai, TYPOTEX, 2005.) 26

A válasz az algoritmikus információelméletben van. Egy matematikai elmélet összes (bizonyítható) eredménye felsorolható, csak győzzük kivárni, mikor érünk el az éppen kérdezett eredményig. A feltételes Kolmogorov-entrópia mutatja, hogy adott bitnyi ismeret matematikai tétel esetén kevesebb kiegészítéssel vezet el egy kérdés válaszáig, mint történelmi tétel esetén, másként mondva, kevesebb újonnan megtanult bit feldolgozása után érünk el a tételhez. Azonban a feldolgozás sebessége sem elhanyagolható. Sőt, a felhasználható tárméret sem. Fejben más a határ, mint papír-ceruzával. 27

Paradoxon Paradox módon az algoritmusos információelmélet szerint a matematika egyszerűbb, mint a történelem. Intuitív magyarázata ennek az állításnak az, hogy ugyanannyi mennyiségű írásos válasz a vizsgán (matematikából a definíciók, tételek pontos megfogalmazását és a tételek bizonyításának leírását értve válasz alatt) kevesebb memorizálandót jelent matematikából, mint történelemből. Ugyanígy magyarázható, miért egyszerűbb a vers, mint a próza megtanulása szó pontossággal. A matematika kevésbé véletlenszerű, mint a történelem. (Még irritálóbb állítás, hogy az élő anyag egyszerűbb, mint az élettelen. Ennek kifejtése a genetika-genomika világába vezet már. A genetikai kódnak a bioszféra gépezetébe helyezésével történő kiszámításként elképzelve az egyed kifejlődését.) 28

Turing-gépekkel illusztrálva Próbáljuk meg Turing-gépekkel illusztrálni a vizsgát. (A Turing gép. A véges leírás jelentése, viszonyítás a generatív jellegű parciális rekurzív függvények építkezéséhez.) A megtanult bitmennyiség legyen M, mint Magolás. Ez a Turing-gép egyik szalagjára kerül. A Turing-gépnek legyen a magolt résztől elkülönülten kialakult programszalagja is. (Ez modellezi az előzetes tanulás során kialakult gondolkodást.) Ezen kis Turing-gépek programjai (mozgástáblái) vannak. 29

enciklopédikus tudás Mi az enciklopédikus tudás jellemzője: Az M eléréséhez elsősorban indexelés kell, és elért szekvenciák visszaadása. (Az asszociatív emberi visszakeresés is sajátos indexelés. Ebben is nagy a gyakorlás szerepe, és a korábban, más céllal megtanultak szerepe.) 30

matematikai tudás Az axiómarendszerre fogalmak és erős szerkezetek épülnek. A szerkezetek egy része definíció és tétel jellegű, vagyis az axiómákból következő igaz állítások megfogalmazását könnyítő definíciók és utána tételek megfogalmazása. A tételek igazolása algoritmusokkal történik. Turing-gépnél az algoritmusok egy része bitekkel adott a programszalagon, egy része az M-ben új adatként van. A kettő erős együttműködése tesz lehetővé kevés új bit megtanulásával nagyobb visszaadható tudást. A tételek generatív megfogalmazhatósága (szabályok alapján állíthatjuk elő tételek sorát) rávezet a tételek megfogalmazására pontatlan tudás esetén is, ugyanígy a bizonyítások is generatívfelsorolható módon rekonstruálhatók. 31

Azonban a rekonstruáláshoz igen gyors számítási teljesítményre van szükség. Gondolkodni és érteni kell! A gondolkodást gyakorolni kell. (Konfuciustól idézet emlékezetből: Tanulni csak gondolkodva érdemes. Gondolkodni tanulás nélkül veszélyes.) A tételek generatív előállítása az elméletek formális nyelvként való megadhatóságára épül. A tételekből egy elég sűrű részhalmaz tudása alapján könnyű kitölteni sok további tételt. Ehhez viszont jól kell ismerni a nyelvet. A tételek és bizonyítások szövedéke újabb tételekhez vezet. A matematikai vizsgán a ritka tételtudás esetén gyors generatív, kiszámító gondolkodás is elég lehet, a sűrűbb tételhalmaz tudása viszont gyengébb gondolkodási képesség mellett is elegendő lehet. 32

. A matematika múltja igen sok lehetséges ág bejárását jelenti. Ez is a megismert múlt része, a megismert gondolatok múltja. Ebből építkezünk tovább. A matematika maga lehetséges axiómarendszerei, tételei nem változik. Az változik, hogy ebből emberi tudatok mit jártak be. A matematikusok teremtett világai ebben a legnagyobb kirándulások. A teremtés új és új terminális és grammatikai elemeket hoz be. Új nyelveket kell tanulni. Egyre többet lehet bennük megfogalmazni. A megfogalmazottak (megismert tételek) mennyisége eléri-e az emberöltő által továbbdolgozható volument? Osztott, párhuzamos és ellenőrizhető matematikai gondolkodás jön-e majd létre? 33

Informatikai tudásanyag Az informatika maga, és ezért ismeretanyaga változik, és igen gyorsan. (Szemben a természettudományokkal, ahol nem a természet változik, hanem ismereteink és észlelési lehetőségeink bővülnek.) A változást emberi tudatok bejárása eredményezi. Teremtett világ. Vannak benne matematikai jellegű részvilágok, és tele van heurisztikákkal is. Az eredmény: programok, technológiák, materializált gépek. Utána azonban gépek folytatják a lehetséges tételek bejárást. Ezekről a bejárásokról megint emberi tudatnak kell tételeket fogalmazni. Mire a tétel kész, már lehet, hogy más bejárások (programok, technológiák) leváltották a tétel tárgyát képező bejárásokat. (A bejárás itt tulajdonképpen kiszámításokat jelent, vagy emberi tudat által végzettet, vagy gép által végzettet.) 34

Korábban voltak a könyvek, oda ömlött be minden tudásunk (helyesek és hibásak, jó szándékúak és rossz szándékúak.) Vörösmarty: Gondolatok a könyvtárban Az USA Kongresszusi Könyvtár: 28 millió könyv. Teljes digitalizálása: 10-100 Mbyte/kötet:összesen 280-2800 TeraByte. Most a világháló adatbázisába ömlik minden. Becsült mérete Zetabyte tartományban van. Másfél évenként kétszereződik, gyorsul. Exabyte: az 1999-ben keletkezett információ (adattömeg) fele. IDC tanulmány szerint közel fél Zetabyte, pontosabban 3 892 179 868 480 350 000 000 bitnyi információ keletkezett 2008-ban, 2009-ben ezerszer annyi várható, mint 1999-ben. 35

Programkódok Mennyi az elkészült programok bitmennyisége? Hogyan viszonylik ez a világháló 10 21 (Zeta-bájt) méret közelében lévő adatmennyiségéhez? Megbecsülhető, hány bájt keletkezhet 100 millió programozó napi 16 órás munkájával másodpercenként egy leütés (fél bájt) írási sebességgel évente: Az eredmény: 1.051.200.000.000.000 bájt. Egyszerűsítve, ez 1 Exabájt. Ez a szinte irreálisan magas felső becslés évente ekkora növekedési korlátot mutat. (Ha 100 millió digitális kamerát működtetnénk másodpercenként egy felvétellel, az évente kétmilliószor ekkora adattömeget jelentene, 2000 Zetabyte lenne az eredmény.) 36

Tudományos adatok Milyen arányt képviselnek? A lagnagyobbak Petabyte tartományban. CERN: évente 10Pbyte A világháló nagy része azonban a közvetlen emberi érzékelésnek megfelelő észlelések rögzítéséből áll. 37

Méretarányok A háttértároló 100-szor olcsóbb, mint a gyors memória, igen nagy tárolókapacitás jött létre. (60% PC-ken van) Amdahl törvények a kiegyensúlyozott rendszerről: a másodpercenkénti lebegőpontos műveletek száma, az operatív memória mérete byte-ban, a másodpercenkénti I/O mennyiség byteban, valamint a háttértároló mérete úgy aránylik egymáshoz, mint 1:1:0,1:100. A petaművelet/sec tartományban 1 GByte/sec adatelérési sebességű merevlemezekből 100000 kell, 1 TeraByte kapacitású tárolókból 100000. Visszafele: 1 Zetabyte adatbázishoz 10 Exaflops processzor telejsítmény, 10 Exabyte memória, 1 Exabyte beolvasási sávszélesség kell. 38

Cyber-infrastruktúra Z. Karvalics László A cyber-infrastruktúra mint aktuális kihívás és mint tudományszociológiai probléma I. Magyar Tudomány 2007. A cyberkörnyezet egyaránt támogatja a tudománygyár működésének átfogó újratervezését (reengineering) és a kutatási folyamatok jobb programozását - evvel a tudomány új korszaka születik meg (next generation science), amit bátran nevezhetünk adat-intenzív tudománynak (data intensive science) (Jim Grey, Alex Szalay et.al. 2005). 39

Jeltömeg és kontrollválság Z. Karvalics László Az adatsilóktól a tudomány kontrollforradaimáig. Magyar Tudomány 2008. A tudósok lényegesen gyorsabban hozzák létre az új adatokat, mint ahogy azokat elemezni tudnák. Az eredmény leginkább az optikai csalódásra hasonlít. (Hugh Kiefferttől származó idézet) 40

Mi az e-science? Az ELTE escience RET pályázatból Új feltörekvő technológia, melynek révén nagyléptékű, komplex tudományos tevékenység fejthető ki a modern információs technológia felhasználásával. Legfőbb jellemzője a rendkívül sok, gyakran különböző helyekről elérhető adaton operáló kiértékelő munka, melynek eredményes véghezvitelére az adatok automatikus gyűjtése, optimális adatbázisba rendezésére, rendkívül nagy számítástechnikai kapacitást igénylő feldolgozására, és a lényeget megragadó vizualizációjára van szükség. 41

CyberinfrastruCture Vision for 21st Century DisCoVery National Science Foundation Cyberinfrastructure Council March 2007 42

Az átfogó kép a tudományban Mérések Archívumok Szakirodalom tények tények? kérdések válaszok Szimuláció Adatfeltárás Petabyte kezelése Közös séma Hogyan szervezzük? Hogyan szervezzük át? Hogyan működjünk együtt? Adatlekérdezés és vizualizáció Hatékonyság 43

http://skyserver.sdss.org Solves the 20 queries Has 150 hours of online instruction Translated to Hungarian Professional astronomers us it as the SDSS Science Catalog Analysis Service. Clone operating in Hungary. 44

45

Experiment Budgets ¼ ½ Software Software for Instrument scheduling Instrument control Data gathering Data reduction Database Analysis Visualization Millions of lines of code Repeated for experiment after experiment Not much sharing or learning Let s work to change this Identify generic tools Workflow schedulers Databases and libraries Analysis packages Visualizers 46 Simulation (computational science) are > ½ software

Észlelés megismerés információ Fizikai jelenségek észlelése: egy másik, már ismertebb jelenségre való hatáson keresztül történik. A kezdeti észlelés, mint felismerhető jelenség, az emberi érzékszervekre, érzékekésre alapul, a telereceptoraink, azaz a látó és halló receptoraink informálnak bennünket.. 47

helyettesítés Minden észlelésből helyettesítő jelek maradnak. Tudatunkban is. Utána már csak ezekkel tudunk manipulálni. Ez viszont csak algoritmusokkal történik absztrakt értelemben. Az emberi gondolkodás, következtetés, stb, minden eddigi lehetősége a kiszámítási világon belül van. Ami ezen túl van, az nem ellenőrizhető. (Bár a kiszámítás, gondolkodás se mindig ellenőrizhető.) 48

megismerés Miben áll a természettudományos megismerés legfontosabb lehetősége: Addig kell provokálnia természetet, míg olyan új múltat nem eredményez, amilyet eddig még nem észleltünk. A jövőre csak a múltból következtethetünk. Ezt fogalmazza meg másként Beck Mihály a Parajelenségek és paratudományok c. könyv 67- oldalán: A különböző folyamatok időbeli lejátszódásának leírása valójában csak akkor lehetséges, ha a jövő nem más, mint megismételt múlt. 49

Zárszó Juris Hartmanis: Zárszó: Hiszek abban, hogy a számítógéptudomány rendelkezik olyan potenciális erővel, amely által mélyebben be tudunk tekinteni a kiszámítás paradigmájába, valamint saját intellektuális folyamatainkba, kvantitatív megértésüket kaphatjuk, és így, esetleg talán, egy lehetőséget nyerünk a tudható határának átlépésében. 50

Köszönöm a figyelmet! 51