A gép az ember tükre, avagy hogyan (ne) adjuk át saját előítéleteinket a mesterséges értelemnek

Hasonló dokumentumok
AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK

DIGITALIZÁCIÓ KINEK MI? AVAGY A KIKERÜLHETETLEN ÖSVÉNY A SIKERES VERSENYKÉPESSÉG ÉRDEKÉBEN.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Meteorológiai ensemble elırejelzések hidrológiai célú alkalmazásai

Bevezetés az e-magyar programcsomag használatába

Kollektív tanulás milliós hálózatokban. Jelasity Márk

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

Egyenlőtlenségi mérőszámok alkalmazása az adatbányászatban. Hajdu Ottó BCE: Statisztika Tanszék BME: Pénzügyek tanszék Budapest, 2011

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

YANG ZIJIAN GYŐZŐ 杨子剑

A kibontakozó új hajtóerő a mesterséges intelligencia

Modellkiválasztás és struktúrák tanulása

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

Mesterséges Intelligencia II. kötelező feladat (3. forduló) - Ajánló rendszer 2.

A mesterséges intelligencia kihívásai. Dr. Charaf Hassan, egyetemi tanár, BME-AUT

A töltőfolyadék térfogatváltozása alapján, egy viszonyítási skála segítségével határozható meg a hőmérséklet.

Pletykaalapú gépi tanulás teljesen elosztott környezetben

Mikroszkopikus közlekedési szimulátor fejlesztése és validálása (Development and validating an urban traffic microsimulation)

ADATBÁNYÁSZAT AZ AUTÓIPARI TERMÉKEK FEJLESZTÉSÉBEN

1) Végdátum mérföldkövei, elvárások az euró zónában és azon kívül. 3) A SEPA irányítás lehetséges változási irányai.

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

1 Kereskedői tételes forgalmi listák rekordleírásai

MIKE URBAN COLLECTION SYSTEM

Software Engineering Babeş-Bolyai Tudományegyetem Kolozsvár

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Hogyan tovább Hazai programmatic?

A magyar létige problémái a számítógépes nyelvi elemzésben

OLYMPICS! SUMMER CAMP

Növekedés határok nélkül, biztonságosan. 56. Közgazdász-vándorgyűlés

A klubnap fő témája: Alapozás

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások

Példák a tanulási eredmények kidolgozására, megfogalmazására

Legjobban fizetõ adsense kulcsszavak, július vezet a "mesothelioma"

discosnp demo - Peterlongo Pierre 1 DISCOSNP++: Live demo

Copyright 2013, Oracle and/or its affiliates. All rights reserved.

Adatbányászat az Oracle9i-ben. Fekete Zoltán vezető termékmenedzser

Szolgáltatás Modellezés. Tivoli Business Service Management

Kódverifikáció gépi tanulással

Beszerzések adatalapú vizsgálata a 21. században

Megerősítéses tanulási módszerek és alkalmazásaik

Eredmények kiértékelése

Előítéletesség a szabadúszóknak szóló online piactereken. Aniko Hannak Claudia Wagner

Start UP vagy start DOWN a siker a humán és menedzsment tényezőkön is

A termelésirányítás optimalizálása az IBM adattároló gyárában

Tesztelés és hibajavítás Microsoft Visual Studio 2005 fejlesztőkörnyezetben

Sikerek és buktatók: milyen út vezet a Q1 nemzetközi publikációkhoz? Keszey Tamara Budapesti Corvinus Egyetem Marketing és Média Intézet

1.2. Az anyag vagy keverék megfelelő azonosított felhasználása, illetve ellenjavallt felhasználása

Szomszédság alapú ajánló rendszerek

Mesterséges Intelligencia Elektronikus Almanach

Eladni könnyedén? Oracle Sales Cloud. Horváth Tünde Principal Sales Consultant március 23.

No.: XX/0. Page: 1. Kedves Partnerünk!

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY Department of Distributed Systems

Deep Learning a gyakorlatban Python és LUA alapon Felhasználói viselkedés modellezés

KOGGM614 JÁRMŰIPARI KUTATÁS ÉS FEJLESZTÉS FOLYAMATA

Hálózati kapcsoló - refencia táblázat Mains Switches Product Reference Guide

ANGOL NYELV, MINT ELSŐ IDEGEN NYELV

A PROJEKT ÖSSZEFOGLALÓ ÉRTÉKELÉSE. Buzás Kálmán. Budapest, október 11. PROJEKT PARTNEREK

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Best Practices for TrusBest Practices for Trusted Digital Repositories in HOPE. ted Digital Repositories in HOPE.

Brooklyn Credit Risk Monitoring System

CAMPUS HUNGARY ÖSZTÖNDÍJPROGRAM B2 (KONVERGENCIA RÉGIÓ)

Adatbányászati, data science tevékenység projektmenedzsmentje

OncotypeDX az emlőrák kezelésében

Műholdas adatok használata az OMSZ rövidtávú numerikus előrejelző rendszerében

Egységesítés felsőfokon

Adatbányászati, data science tevékenység

Mi látjuk előre, amit Ön csak a promója után! Sales & Marketing, Üzletfejlesztési lehetőségek térinformatikával

Az adathalászat trendjei

AZ ÚJGENERÁCIÓS TANKÖNYVEK KOJANITZ LÁSZLÓ

Ajánlat / Offer. Tételek. Tételek. DECORATION & DESIGN KFT (Központ) Eladó/Supplier.: Decoration & Design Kft. 2310SzigetszentmiklósKántor u. 5.

Mit mond a XXI. század emberének a statisztika?

Adatbányászati technikák (VISZM185) 2015 tavasz

Genome 373: Hidden Markov Models I. Doug Fowler

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Csima Judit április 9.

1: Idõ(tartam), frekvencia (gyakoriság) mérés

Prediktív analitikai megoldások bankok és biztosítók számára

Statisztikus tanulás az idegrendszerben

A TESZTELÉS ALAPJAI MIÉRT SZÜKSÉGES A TESZTELÉS? MI A TESZTELÉS? ÁLTALÁNOS TESZTELÉSI ALAPELVEK

Események detektálása természetes nyelvű szövegekben

Társasjáték az Instant Tanulókártya csomagokhoz

Az indexelés újdonságai Oracle Database 12c R1 és 12c R2

Mesterséges intelligencia alapú regressziós tesztelés

HAL SST CL P 30 W 230 V E14

Think customer Hatékony ügyfélszolgálat és megvalósítási módszertan. WorkShop

Statisztikai alapú tulajdonnév-felismerő magyar nyelvre

Számla Hiteles másolat 2/2.példány 1.lap

A pénzügyi szervezetek panaszkezelési eljárásáról szóló 11/2012 (XI.8.) ajánlás

Mi az? Többértelműség Kutatás NYELVTECHNOLÓGIA. Sass Bálint Pázmány Nap október 17.


Koncz Alexandra Tanárnőnél vizsgázóknak ezen felül: Past simple and Past continuous Ferund or infinitive

TrendMiner (Politikai témájú SM üzenetek (szociál)pszichológiai vizsgálata)

Excel vagy Given-When-Then? Vagy mindkettő?

Nagykálló Város Önkormányzata

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

Kezdőlap > Termékek > Szabályozó rendszerek > EASYLAB és TCU-LON-II szabályozó rendszer LABCONTROL > Érzékelő rendszerek > Típus DS-TRD-01

Ambiens szabályozás problémája Kontroll és tanulás-1

Mesterséges intelligencia. Gregorics Tibor people.inf.elte.hu/gt/mi

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Logistic regression. Quantitative Statistical Methods. Dr.

Átírás:

A gép az ember tükre, avagy hogyan (ne) adjuk át saját előítéleteinket a mesterséges értelemnek Varjú Zoltán 2018.05.22. HWSW Meetup

ML Engineering

Rules of Machine Learning #1 Don t be afraid to launch a product without machine learning #14 Starting with an interpretable model makes debugging easier #17 Start with directly observed and reported features as opposed to learned features Forrás: Martin Zinkevich Rules of Machine Learning: Best Practices for ML Engineering https://developers.google.com/machine-learning/rules-of-ml/

Machine Learning: The High Interest Credit Card of Technical Debt Complex Models Erode Boundaries Data Dependencies Cost More than Code Dependencies System-level Spaghetti Sculley et al: Machine Learning: The High Interest Credit Card of Technical Debt https://ai.google/research/pubs/pub43146

Emberközpontú gépi tanulás Human-Centered Machine Learning https://medium.com/google-design/human-centered-machine-learning-a770d10562cd

Alapelvek a gép nem találja meg helyetted a problémát minden az adatokon múlik, legyen torzításoktól mentes, kiegyensúlyozott tanulóadatod a gépi tanulás akkor jó megoldás, ha tényleg hozzá is ad valamit a rendszerhez és nem helyettesíthető mással nincs tökéletes megoldás, döntsd el hogy a fals pozitív vagy a fals negatív eredmények fájnak-e neked jobban a lifelong learning az algoritmusoknál is létszükséglet

Kompromisszumok Mi fáj jobban? Mit értékelünk jobban? Elmulasztani egy potenciális ügyfelet (fals negatív), vagy nem releváns adatokkal foglalkozni? Ha predikcióink inkább helyesek, vagy Ha a lehető legtöbb esetet találjuk meg egy-egy osztályból? Precision vs Recall Forrás: https://medium.com/google-design/human-centered-machine-learning-a770d 10562cd

A nagy nem feltétlenül jobb emberi adatok emberi előítéletek tükröznek a gépi tanulás nem tudja ezeket kiküszöbölni Forrás: https://motherboard.vice.com/en_us/article/j5jmj8/google-artificial-intelligenc e-bias

A modell előítéleteink gyűjteménye átláthatóság skála kár

Járókelő - Classifier API

Mi az a klasszifikáció? Előre megadott kategóriákba sorolni az inputot Lehetnek egymást kizáró, vagy átfedő kategóriáink Forrás: https://medium.com/google-design/human-centered-machine-learning-a770d 10562cd

Small, imbalanced data

Nehéz egyetérteni

Feature Engineering Segítőkészség, érthetőség, közvetlenség és gyorsaság dimenziókat megragadó jellemzők átbeszélése Nyelvileg kinyerhető jellemzőkre fordítás - 28 jellemző Előfeldolgozás Nyelvi feldolgozás - magyarlánc (tokenizálás, lemmatizálás, szófaji egyértelműsítés) Szótárak készítése

Közvetlenül a kapott adatokból: válaszadási idő válaszadás formátuma megszólításban személynév aláírásban személynév Szótárak: barátságtalan megfogalmazások megoldásra utaló szavak köszönet szavak szentiment- és emócióarányok Nyelvi feldolgozás után: mondatszám átlagos szószám/mondat max szószámot átlépő mondatok főnevek aránya igék aránya főnév/ige arány lexikai diverzitás szavak átlagos rangja Regex: javítási dátum rendeletek

Kiértékelés

Hogyan tovább? Tversky index A forint olyan mint az euró vagy Az euró olyan mint a forint? A veréb vagy a gólya tipikusabb madár? Probability calibration Ensemble

Köszönöm a figyelmet! zvarju@precongox.com @zoltanvarju http://kereses.blog.hu/