Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép https://www.wolframalpha.com/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 1. Témakörök Bevezetés Történeti háttér az idevezető út Technológia a négy komponens Technológia Érdekes tények Konklúzió
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 2. Bevezetés Nem egy alapvetően szintaktikai - keresőprogram, mint pl. a Google, vagy a Bing Nem olyan statikus ismerethalmaz, mint a Wikipédia, vagy az Encyclopédia Valós idejű számítási válaszadó rendszer
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 3. Bevezetés Cél: A Wolfram Alpha hosszútávú célja minden rendszerezett tudás azonnali számíthatóságának és elérhetőségének biztosítása mindenki számára. Rendszerezett tudás: - Tárgyszerű adatok - Modellek - Módszerek - Algoritmusok - Képletek
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 4. Bevezetés Már kidolgozott területek: - Matematika - Statisztika és adatelemzés - Fizika - Kémia - Anyagok - Műszaki tudományok - Csillagászat - Földtudományok - Élettudományok - Számítástudomány - Egységek és mértékek - Dátumok és időpontok - Időjárás - Helyszínek és geográfia - Emberek és történelem - Kultúra és média - Zene - Szavak és nyelvészet - Sport és játékok - Színek - Pénz és üzlet - Szocio-ökonómiai adatok - Egészség és gyógyászat - Étel és táplálkozás - Oktatás - Szervezetek - Szállítás - Technológiák - Web- és komputerrendszerek
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 5. Történeti háttér az idevezető út A névadó és projektvezető: Stephen Wolfram Öt éves munka betetőződése és 25 éves megelőző fejlesztésé Stephen a Wolfram Research céget 1987-ben indította, elsősorban a Mathematica szoftverre összpontosítva A szoftver a Mathematicán alapul és 2009-ben 7 millió programsorból állt. CPU-k ezrein fut 4 helyszínre szétosztva (2009).
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 6. Történeti háttér az idevezető út 2002-ben Stephen publikálta az A New Kind of Science c. könyvét Ingyenes elérés a weben! A könyvben lefektetett elveken alapuló terméket 2004-ben kezdték fejleszteni Wolfram Alpha néven A Wolfram Alpha hivatalosan 2009-ben jelent meg a közönség számára. https://www.wolframscience.com/nksonline/toc.html
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 7. Történeti háttér számítható tudás A Rendszerezett Adatok és a Kiszámítható Tudás története Krisztus előtt 20 000-re nyúlik vissza az aritmetika feltalálásával. Lásd: http://www.wolframdatasummit.org/2010/timeline.html Tudományos könyvek, enciklopédiák, népszámlálások, térképek már az Ősi Mezopotámia óta gyűjtik az adatokat.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 8. Technológia a négy komponens Hogyan épül fel és működik a Wolfram Alpha? A felépítés négy modulon alapszik
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 9. 1. modul - Adatgyűjtés Területek szakértői segítik a teamet a legjobb adatok megtalálásában és ellenőrzésében. Külső, szervezeten kívülről jövő adatfelajlánlás szintén lehetséges, de az összes ilyen adatot szigorúan ellenőrzik. Az adatok gyakorlatilag 100%-a nem az Internetről származik. Az adatgyűjtés és ellenőrzés a munka kb. 5%-a.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 10. 1. modul - Adatgyűjtés
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 11. 2. modul Formalizálás A gyűjtött adatok szervezése, hogy feldolgozhatóvá váljon. Az adat jelöléseinek, egységeinek, és a többi adathoz való kapcsolődásának meghatározása Az adatok algoritmikus kódolása, hogy amikor szükség van rájuk, rendelkezésre álljanak kiszámítható adatok. Az algoritmusok, modellek és egyenletek kódolása a Mathematica program nyelvén, mely egyben a Wolfram Alpha programozási nyelve is.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 12. 2. modul Formalizálás.. A Mathematica nyelvén tetszőleges strukturált kifejezések reprezentálhatók. Eredményként a kód tömörebb, mint pl. a Java, vagy Python nyelveknél. A Mathematica hatalmas függvény- és algoritmuskészlettel bír, melyen új, akár összetettebb algoritmusok is implementálhatók. Az új függvényekkel még könnyebb az új algoritmusok implementálása.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 13. 2. modul Formalizálás.. Példa egy formalizálásra
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 14. 2. modul Formalizálás.. Példa egy másik formalizálásra
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 15. 3. modul Természetes nyelv feldolgozás (NLP) A rendszer és a felhasználók közti interakció legkényelmesebb eszköze a természetes emberi nyelv. A probléma abban van, hogy a rendszer csak kis szövegrészletekkel találkozik az input során, és ezeknek kell egyértelmű jelentést tulajdonítania. Nagyobb szövegmennyiséggel éppen könnyebb lenne a feladat. Az implementált megoldások általában jó eredménnyel működnek.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 16. 3. modul Természetes nyelv feldolgozás (NLP) Példa: szöveges kérdés
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 17. 3. modul Természetes nyelv feldolgozás (NLP) 2. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 18. 3. modul Természetes nyelv feldolgozás (NLP) 3. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 19. 3. modul Természetes nyelv feldolgozás (NLP) 4. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 20. 4. modul Vizualizálás A Wolfram Alfa egyik vonzó tulajdonsága az eredmények vizuális megjelenítése. A Mathematicának több eszköze is van erre a kihívásra, hogy az igényes számítási esztétikának megfeleljen. Egy adott specifikus szimbolikus reprezentálás esetére ez automatizálja, mi és hogyan legyen prezentálva.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 21. 4. modul Vizualizálás 1. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 22. 4. modul Vizualizálás 2. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 23. 4. modul Vizualizálás 3. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 23. 4. modul Vizualizálás 3. Példa (ellenőrizve)
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 24. 4. modul Vizualizálás 4. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 25. 4. modul Vizualizálás 5. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 26. 4. modul Vizualizálás 6. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 27. 4. modul Vizualizálás 7. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 28. 4. modul Vizualizálás 8. Példa
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 29. Technológia Érdekes tények Több mint 10 trillió adat. Több mint 50 000 algoritmus és modellfajta. Több mint 1 000 felhasználói nyelv. Több mint 8 millió sornyi szimbolikus Mathematica kód. Szuperszámítógépek clusterein fut, beleértve a világ 44. legnagyobb gépét, az R Smarr-t is. Sok száz terabájtnyi tároló.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 30. Amikor nem tud valamit
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 31. Konklúzió Az adatreprezentálás és a dolgok halmazára vonatkozó lekérdezések leképezésének lényege hogy ezek számításra is képesek. A lekérdezéseknél a válasz megadásához egy belső, előre strukturált adatbázist alkalmaz. A számítás, feldolgozás egy halom adatot hoz fel a Google keresőgépeihez viszonyítva. Kevés, vagy semmi információ nincs arról, hogyan dolgozik a rendszer belül.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 31. Források, hivatkozások Wolfram Alpha weboldal: http://www.wolframalpha.com/ Wolfram Alpha blog: http://blog.wolframalpha.com/ A Wolfram Alpha készítésének története: http://www.stephenwolfram.com/publications/making-wolframalpha/ Vélemények: Wolfram alpha: hogy működik? http://www.computerweekly.com/opinion/opinion-wolfram- Alpha-How-does-it-work; http://www.techradar.com/news/internet/how-the-hell-doeswolfram-alpha-work--599561 A Wolfram Alpha architektúrája: http://highscalability.com/wolfram-alpha-architecture Wolfram Data Summit konferencia: http://www.wolframdatasummit.org/2010/ Wolfram Alpha a youtubon: https://www.youtube.com/user/wolframalpha