Budapesti M szaki és Gazdaságtudományi Egyetem Gazdasági és Társadalomtudományi Kar Tudománylozóa és Tudománytörténet Doktori Iskola Emergencia és Hallgatólagos Tudás a Gépekben Héder Mihály PhD Értekezés Tézisfüzet Témavezet k Dr. Margitay Tihamér Egyetemi Tanár BME GTK Filozóa és Tudománytörténet Tanszék Dr. Vámos Tibor Akadémikus MTA Számítástechnikai és Automatizálási Kutatóintézet 2014
Tartalomjegyzék 1. A kutatás el zményei és háttere 2 2. Célkit zések 3 3. Új eredmények 5 4. Tézispontokhoz kapcsolódó tudományos közlemények 8 5. További tudományos közlemények (válogatott) 9 6. Hivatkozások 10 1
1. A kutatás el zményei és háttere Kutatásom kiinduló kérdése 2009-ben az volt, hogy mi a nyelvi feldolgozás egy bizonyos feladatosztályában az úgynevezett Natural Language Understanding (NLU) 1 területén sikeresen m ködni képes számítógépes rendszerek (mesterséges intelligenciák, MI), létrehozásának helyes módszertani megközelítése. A doktori kutatás hátterét az adta, hogy az MTA SZTAKIban különféle szöveges dokumentumok els sorban hivatali panaszlevelek értelmezésére képes webes rendszer els verzióján dolgoztunk Vámos Tiborral közösen. 2010-ben és 2011-ben erre a kísérletezésre alapozva, de kissé más hangsúlyokkal, két egymásra épül projektet is kiviteleztem információkinyerés és NLU témában, több kollégával és hallgatóval közösen. 2 A vizsgálódások mögött eleinte volt egy feltevés, amely szerint ha kizárólag a módszertani oldalt vizsgáljuk, akkor számos csapda elkerülhet. Nem kell az embergép demarkáció végeláthatatlan kérdésébe belebonyolódni, sem azt megválaszolni, hogy milyen értelemben intelligens a gép és így tovább. Hamar arra a felismerésre jutottam azonban, hogy a különféle ontológiai alapkérdések kikerülhet sége egy teljesen irreális illúzió. Éppen ezért a helyett, hogy az elkötelez dés mentes módszertan lehetetlen feladatát próbáltam volna megoldani, inkább egy mélyebb és utólag már azt is merem állítani, hogy önmagán túlmutató jelent ség kérdést vizsgáltam meg disszertációmban. Ez a kérdés a gépek, ezen belül is az intelligens és autonóm rendszerek ontológiai státuszára vonatkozik. Ez mintegy el tanulmányként fogható fel az eredeti, módszertani kérdéshez képest a helyett, hogy magát a módszertani kérdést válaszolnám meg. Elméletem foglalkozik a programtervezés és a számítás kapcsolatával, valamint a számítás természetével, ontológiai státuszával is. Így tehát nem pusztán a módszertani kérdés szempontjából vannak konzekvenciái, hanem különféle gépek teljesítményének értékelésére, és ezek állati vagy emberi teljesítményekkel való összevetésére is kiterjed hatóköre. 3 1 Natural Language Understanding, azaz természetes szövegek megértése. 2 Ezeket a projekteket az MTA SZTAKI nanszírozta, az úgynevezett bels kutatási pályázatok révén. 3 Ezen vizsgálódások már egyáltalán nem csak az NLU feladatok problematikájára terjednek ki. 2
2. Célkit zések A Mesterséges Intelligencia lozóája széles körben m velt, gazdag irodalommal rendelkez kutatási terület. Ezen belül azonban a számítógép felépítésének és m ködésének alapos lozóai vizsgálata meglehet sen elhanyagolt részterület volt nagyon sokáig. Ennek nagyrészt az az oka, hogy a legtöbb vitában hallgatólagosan egy tisztán explicit szimbólumokat feldolgozó Turing gépet feleltettek meg a számítógépnek. A Turing gép azonban pusztán a számítógépek tervezésére és leírására használható ismeretelméleti eszköz, amely a számítógépeknek csak bizonyos aspektusait írja le. Disszertációm egyik célja, hogy igazoljam ezen fogalmi eltolódás meglétét és jelent ségét az ismertebb érv-rendszerek mögött, mint Hubert Dreyfus MI-kritikája vagy a kínai szoba érvelés. A Mesterséges Intelligencia újabb hullámaiban a kutatók megtestesült és emergens rendszereket igyekeztek létrehozni, de anélkül, hogy a gépek felfogása körüli alapproblémákra igazán reektáltak volna. Újfajta architektúrákkal, például molekuláris számítógépekkel is kísérleteztek. Célom, hogy bemutassam: habár jelent s technikai és módszertani újítások történtek az MI új hullámában, igazi elvi változás nem következett be a megtestesült (embodied) és emergens lozóából kölcsönzött kifejezések az MI területén pusztán újfajta tervezési és kivitelezési eljárásokat jelölnek, de ennél többet nem. Vizsgálataim során világossá vált, hogy nemcsak a gépi tudás kérdése leválaszthatatlan a tudás általános kérdésér l, de ezek együtt sem tárgyalhatók anélkül, hogy a világ felépítésére vonatkozó legalapvet bb kérdésekben, azaz a metazika ügyében állást ne foglalnánk. A legpopulárisabb mesterséges intelligencia lehet ségével kapcsolatos érvelések, mint például a Turing gép vagy a Kínai szoba valójában tisztázatlanul hagyják, hogy milyen metazikai elképzelések állnak mögöttük, bár egy kritikai elemzés általában ki tudja mutatni különféle el feltevések jelenlétét. Más diskurzusokban, például az elmelozóa számos vitájában már expliciten tárgyalt tény, hogy más válaszok lehetségesek az elme kérdéseire, ha a világ helyes leírása valamifajta dualizmus, esetleg a platonizmus modern formája, és mások akkor, ha a materializmus a helyes világkép. Disszertációm célja, hogy belátva, hogy a metazikai kérdés nem hagyható el egy emergentista számítógép-felfogást dolgozzak ki. Disszertációmban az emergentista lozóa egyik legújabb és legjobban kidolgozott változatát, Polányi Mihály lozóai rendszerét a modern informatikában tapasztalható fejleményekre alkalmazom, és Polányi szellemében, de lozóai rendszerének konzekvenciáit továbbgondolva, a számítógépek emergens természetét és a gépi hallgatólagos tudás létezését mutatom meg. Hiszek benne, hogy e vizsgálódás eredménye fontos, ugyanis amennyiben megállja a helyét megérthetjük segítségével a gépek által produkált teljesítmények min ségét és jelent ségét, valamint azt is, hogy milyen alapvet en eltér egy 3
ember egy gépt l. Mindezt úgy, hogy nem fogják veszélyeztetni a vizsgálat eredményét a jöv ben várható még látványosabb mesterséges intelligencia megoldások, de ugyanakkor nem is redukáljuk az embert mechanisztikus géppé. 4
3. Új eredmények A mesterséges intelligencia elemzésének rejtett el feltevéseivel kapcsolatban az alábbi tézist állítom fel. 1. Hubert Dreyfus híres MI kritikájában (Dreyfus 1972) egy rejtett el feltevést fogad el. Ez az el feltevés a számítógépek természetére vonatkozik, és azt mondja, hogy azok pusztán szimbólum feldolgozók, amelyeket leginkább a Turing gépekkel azonosíthatunk. Így tehát a számítógépek képességei és korlátai is a Turing gép képességeivel és korlátaival esnek egybe. Dreyfus munkáját kiemelten kezelem, mert ez az egyik legels átfogó elemzés az MI-r l amely er s lozóai alapokon nyugszik. Azonban a fenti el feltevés nem csak nála gyelhet meg. John Searle, Roger Penrose, mi több Polányi Mihály is hasonló el feltevéseket fogad el és használ a gépek lehet ségeinek elemzésekor. Ennek részleteit bemutatom disszertációmban. Jobbára ebben a szellemben dolgoztak továbbá a korai MI gyakorlati szakemberei is, csak épp k rendszerint nem reektáltak erre a feltevésre, vagy ha mégis, semmilyen problémát nem láttak benne. Dreyfus egy el rejelzést is tesz, amelynek lényege, hogy mivel a számítógép csak formális m veleteket tud végrehajtani (ez az, amiben állításom szerint téved), az intelligencia viszont nem formalizálható (ebben igaza van), következésképp nem várhatók igazán intelligens számítógépes megoldások, például jól sakkozó gépek és természetes nyelvvel boldoguló rendszerek. A projektek falakba fognak ütközni és az emberi teljesítmény megközelíthetetlen marad. Az a veszélyes Dreyfus és mások ilyen értelm MI kritikáiban, hogy az MI sikereinek rossz értékelése következik bel lük. Mert az új, egyre jelent sebb MI eredményekb l látszólag az következik, hogy egyre több feladatosztályt sikerült formalizálni. A még nem formalizált intelligencia felségterülete ebben a téves felfogásban csakis monoton csökkenhet. Például lassan már a kreativitás és az érzelmek amiket sokan kizárólag az ember tulajdonságainak tartanának meg is veszélybe kerülnek. Ha így gondolkodunk, akkor egyre valószín bbnek látszik, hogy Dreyfusnak és másoknak az intelligencia formalizálhatatlanságában nem volt igaza. Legújabb cikkében (Dreyfus 2012, p. 98) még maga Dreyfus is megtörni látszik egy-egy mondat erejéig. 4 Ezek a következtetések az intelligencia teljes formalizálhatóságáról azonban tévesek a hibás számítógép-felfogás miatt. A számítógépek természetére vonatkozó téziseim az alábbiak: 4 Az IBM Watson (lásd a disszertációban) rendszeréb l még hiányolja az általános értelmet. De ha valaki ezt is meg tudná valósítani, azt így kellene értékelni: If computers ever do pass this hurdle by performing billions of meaningless operations a second, we will have to think hard about what we mean by being humanly intelligent. 5
1. Minden számítás rendelkezik zikai jelleggel is. Számos esetben ez a tény nem releváns a számítás vizsgálata szempontjából ez mindig a konkrét számítás függvénye. 2. A számítás kimenetét nem határozzák meg teljesen a formálisan megadható tényez k, mint a program, a paraméterezés és a futás során érkez input szimbólumok. 3. A számítást befolyásoló különböz tényez k a program (és a mögötte lév algoritmus), a paraméterezés, a számítógép környékén zajló zikai folyamatok, a felhasználói és a más rendszerb l érkez interakciók holisztikus viszonyban vannak egymással. Ennek folyományaként a számítás folyamata és outputja e tényez k holisztikus 5 viszonyának eredménye. 4. A fentiek következménye, hogy a számítógépeket pusztán formális rendszernek tekinteni, vagy azt mondani, hogy pusztán formális m veleteket hajtanak végre, nem helyes megközelítés. Attól, hogy a formális tényez k nem határozzák meg teljesen a számítás kimenetét, gyakran eltekintünk, mert a kimenetet olyan, tisztán szimbólumként értelmezhet dologként fogadjuk el, amelynek a zikai tulajdonságai nem relevánsak. Ez azonban csak egy speciális esete a számításoknak. Az, hogy a számítás el állításában részt vev architekturális szintek együttesen kontrollálják a kimenetet, teljesen megfelel az emergentista metazika elveinek. A tézisek harmadik csoportja a számítógép eddig bemutatott holisztikus tulajdonságait Polányi Mihály emergentista világképében helyezi el, így lehet ség nyílik arra, hogy a számítógépek teljesítményét értékeljük, és a gépi tudás lehet ségét felvessük. 1. Polányi Mihály Személyes Tudás-ban ismertetett (Polányi 1964) világfelfogásának helyes alkalmazása az, hogy minden gép emergens, és ennek megfelel en zikai leírással és nem-zikai m veleti elvekkel együttesen írható csak le, pusztán zikai leírással nem. Igaz ez a számítógépre is. 2. Léteznek robotok, amelyek hallgatólagos tudással bírnak. Ezek a robotok aktív centrummal rendelkeznek (ez a tudás szükséges feltétele), amely egy számítógépben valósul meg. 3. Nem létezhetnek tisztán explicit tudású számítógépek. Ezek az eredmények rávilágítanak, hogy az emergens számítások 6 -nak nevezett, jelenleg aktív informatikai kutatási területetet valójában nem az 5 Holisztikus, amennyiben nem választhatók szét a különféle tényez k hatásai a kimenet el állításában 6 emergent computing 6
emergencia (a szó eredeti értelmében) különbözteti meg a többi területt l már a legels számítógépek is emergensek voltak, és az általuk végrehajtott számítások is. Az emergens számítások kutatási program esetében csak újfajta tervezési módszerekr l van szó. Az explicit tudás elemzése megvilágítja azt is, hogy a részben explicit tudással rendelkez számítógépeknek az artikuláció képességével kell rendelkeznie. Hogy léteznek-e majd valaha ilyenek, az empirikus kérdés. Jelenleg ilyeneket nem ismerünk. Amíg tényleg nincsenek ilyen gépek, addig azt mondhatjuk, hogy ha egy gépnek van tudása, az hallgatólagos. Ez ellentétes azzal a sokak számára intuitív elképzeléssel, hogy ha beszélhetünk is gépi tudásról, az biztosan explicit kell, hogy legyen. 7
4. Tézispontokhoz kapcsolódó tudományos közlemények Héder, Mihály (2011b). Integrating articial intelligence solutions into interfaces of online knowledge production. In: ICIC Express Letters 5.12, pp. 43924401. (2013). The machine's role in human's service automation and knowledge sharing. In: AI & SOCIETY, pp. 18. Héder, M. (2012a). Emergens Számítások. In: Emergens Evolúció. Ed. by G. Kertész D. Paksi and G. Zemplén. Budapest, L'Harmattan, pp. 129141. Héder, M (2012b). Explicit Knowledge in the Philosophies of Harry Collins and Michael Polanyi. In: Polanyiana 2012/1-2 (21). Héder, M. (2013). Emergent Knowledge and Its Challenge to Reductionist Thought. In: Tradition and Discovery 39 (2), pp. 2934. Héder, M. and D. Paksi (2011). A gépek hallgatólagos tudása és szimbólumkezelése. In: Polanyiana 2011/1-2 (20), pp. 5067. (2012). Autonomous Robots and tacik knowledge. In: Appraisal 9 (2), pp. 814. 8
5. További tudományos közlemények (válogatott) Bártházi, Eszter and Mihály Héder (2009). Panaszlevelek automatikus kategorizálása szerkezeti egységek és jellemz kifejezések gyelembevételével. In: VI. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2009). Szegedi Tudományegyetem Informatikai Tanszékcsoport, pp. 5591. (2010). Panaszlevelek szerkezetének gépi felismerése. In: VII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2010). Szegedi Tudományegyetem Informatikai Tanszékcsoport, pp. 313. Héder, Mihály (2011a). Dialogue-assisted natural language understanding for a better web. In: ERCIM NEWS 85, pp. 4344. (2012). The denition of the message representation creation problem in the context of internet-based knowledge sharing and service automation. In: International Stability and Technology Conference. Vol. 3. 1, pp. 144 148. Héder, Mihály, Eszter Bártházi, and Tibor Vámos (2011). Natural language understanding in governance service automation. In: proceedings of the IFAC 18th world congress, Milan, pp. 63856390. Héder, Mihály, Zoltán László, and Tibor Sulyán (2007). Another neat tool for refactoring Erlang programs. In: Proceedings of the 11th IASTED International Conference on Software Engineering and Applications. ACTA Press, pp. 336341. Héder, Mihály and Pablo N Mendes (2012). Round-trip semantics with Sztakipedia and DBpedia Spotlight. In: Proceedings of the 21st international conference companion on World Wide Web. ACM, pp. 357360. Heder, Mihaly and Balazs Ratai (2010). Semantically Enhanced Representation of Legal Contracts for Web Applications. In: Studia Iuridica Auctoritate Universitatis Pecs Publicata 147, pp. 211230. Héder, Mihály and Illés Solt (2013). DBpedia Mashups. In: Semantic Mashups. Springer, pp. 119143. Héder, Mihály and Domonkos Tikk. Creating semantically enhanced documents with the help of text mining. In: Proceedings of the 9th International Symposium of Hungarian Researchers on Computational Intelligence, pp. 281292. Héder, Mihály et al. (2011). Sztakipedia: mashing up natural language processing, recommender systems and search engines to support Wiki article editing. In: AI mashup challenge 2011 at extended semantic web conference (ESWC 2011), Iraklion, Crete, Greece. Vamos, Tibor and Mihály Héder (2011). Understanding in distributed socialadministrative network systems. In: MIPRO, 2011 Proceedings of the 34th International Convention. IEEE, pp. 180184. 9
6. Hivatkozások Dreyfus, Hubert L (1972). What computers can't do: A critique of articial reason. Harper & Row New York. (2012). A History of First Step Fallacies. In: Minds and Machines 22.2, pp. 8799. Polányi, Mihály (1964). Személyes Tudás I-II. Budapest, Atlantisz Kiadó, 1994. 10