Megoldási kísérletek:
|
|
- Fanni Mészárosné
- 6 évvel ezelőtt
- Látták:
Átírás
1 TV-nézettség mérése TV-nézőmérő rendszer és lehetséges torzítása Előadó: Zempléni András Minden országban működik Célja: visszajelzés a TV-műsorok készítőinek reklámok által elért közönség becslése Eszköze: TV-n nézett csatornát regisztráló készülék, a nézők gombnyomással jeleznek Problémák a mérőeszköznél Adatszolgáltatók köre: panel Vajon néz-e a nézőnek bejelentkezett? Elfelejtkezhet bejelentkezni Megoldási kísérletek: időnkénti kontroll-kérdések telefonos ellenőrzés adatok szűrése kiválasztás: évenként elvégzett széleskörű felmérés (Establishment Survey, Alapozó felmérés) alapján cél: minél jobban reprezentálja az ország lakosságát valóság: nem teljes az egyezés korrekció: súlyozás A súlyozás Kérdések a súlyozásnál figyelembe veendő változókra vonatkozóan Célja: a minta kiegyenlítése, az alapozó felmérés, ill. a mikrocenzus alapján számított esetszámok (universe-k) beállítása Lehetséges módszerek: Cellamátrix (többdimenziós együttes eloszlás minden cellájára) RIM weighting (marginálisok súlyozása) Mely változókat (változó - kombinációkat) válasszuk? Melyek legyenek a súlyozás kategóriái?
2 Kérdések a súlyozásról Példa RIM weighting súlyozásra Melyik módszerrel? Ha kevés a változó, a cellamátrix, egyébként a marginális-súlyozás a reális Magyarországon ez utóbbi módszert alkalmazzák (RIM weighting). Mely változókat (változó - kombinációkat) válasszuk? Mik legyenek a súlyozás kategóriái? Ha egy változó nem szerepel a súlyozásban, az adott - esetleg kiegyenlítetlen - panel torzíthatja a nézettség becslését Példa: Két változó, két-két értékkel, különböző súlyozási kategóriákkal: súlyozás nélkül csak az egyik változó súlyozó mindkét változó súlyozó Képzeletbeli példa universek Képzeletbeli példa panel A népesség (universe) összetétele Férfi Nő Összesen A panel összetétele Férfi Nő Összesen Városi Falusi Városi Falusi Összesen Összesen Kérdés: hogyan súlyozzunk, hogy a súlyozás utáni minta peremeloszlásai megfeleljenek a teljes populációnak? Súlyozás lépései /1 Súlyozás lépései / A universe összetétele Férfi Nő Összesen (ezer) 5 súlyok Városi Falusi 4 Összesen A universe összetétele (ezer) Városi.5 Falusi.65 súlyok Férfi Nő Összesen 5 súlyok Összesen 5 5 5
3 átlagsúly Képzeletbeli példa panel és nézettség A súlyok megoszlása A panel összetétele és a becsült nézettség (valószínűség) Városi 5 AMR=.1 Falusi 1 AMR=.3 Férfi Nő Összesen 1 AMR=.1 4 AMR= Összesen G yako r i ság Túl sok súlyozó változó -> a súlyok nagy szórást mutatnak A súlyok m egoszlása én , 9, 33, 37, 41, 45, 49, 53, 57, Súlyozatlan becslés: 455/175=.6 Súlyozott becslés: A súlyok koncentrációja A súlyok ingadozása A panel különböző súlyú részeinek hatása 15 Ha a panel az adott változó szerint nem arányos, a súlyok szórása nő Az előző példában : ha csak 1 változó szerint súlyozunk: max/min= Az egyes % nagyságú csoportok ha mindkét változó szerint súlyozunk: max/min= 1 A becslések megbízhatósága Következtetések Ha valószínűségi modellt alkalmazunk (N Poisson eloszlású a műsor nézői független X,Y-tól): D ( N i1 X Y ) i i N D ( X( iyi ) ( XY ) ( ) X mx )( ( Y my ) )( ) i1 XY mxy X mx Y my Azokat a változókat célszerű súlyozó változónak választani, amelyek hatnak a TV nézési szokásokra napi kiegyenlítettsége fontos a felhasználók számára X: súlyok, Y:nézettség. X szórása is növeli a becslés szórását. Nagyobb panel esetén a becslések szórása csökken Célszerű kihagyni azokat, amelyek nem fontosak, de viszonylag kiegyenlítetlen a minta az adott szempontból Alacsony esetszámú kategória (<5 paneltag) nézettségére vonatkozó becslés szórása igen nagy
4 A változók hatásának vizsgálata Clusteranalízis Cluster-analízis A módszer lényege: több számértékkel egyidejűleg jellemzett megfigyelések csoportosítása a távolságuk alapján A megfigyelések: az egyes panel-tagok a vizsgált 1 hetes időszakban mennyit nézték az egyes csatornákat (külön-külön, idősávonként, ill. összesítve). Cél: sokdimenziós megfigyelések csoportosítása Módszerek: 1. k-közép módszer (előre rögzített clusterszámmal dolgozunk, iterációs eljárás) ezt használtuk a TVnézettségnél. hierarchikus eljárások (n-ről egyesével csökken a clusterszám, definiálni kell a megállás helyét) Minden esetben definiálni kell clusterek távolságát (középpontok távolsága, minimális/maximális elemenkénti távolság, stb.) A nézettségi adatok clusterei (k-közép módszer); a legfontosabb TV csatornák átlagos nézettsége az egyes clusterekben A clusterek elhelyezkedése Cluster sorszáma MTV MTV Duna TV M 5 T 4 V Cluster 4 TV TV RTL Klub 3 RTL Klub A clusterek vizsgálata A Kruskal-Wallis statisztika Elemeztük a csoportok összetételét. A változókat rangsorolhatjuk aszerint, hogy mennyire különböznek az egyes clusterek között. A legfontosabbak azok, amelyek nagy eltérést mutatnak. A mérőszám az úgynevezett Kruskal- Wallis próbastatisztika, amely chi-négyzet eloszlású, ha csak véletlen eltérés van a csoportok között. 1 K N( N 1) N 1 ni( Ri ) N a teljes minta elemszáma (kb. 16) R i az i-edik csoporthoz tartozó elemek rangjainak (a nagyság szerinti sorban elfoglalt helyei sorszámának) átlaga n i az i-edik csoport elemszáma i
5 átlagsúly átlagsúly Néhány korcsoport szerepe Néhány kevésbé fontos változó Chi-négyzet Chi-négyzet Borsod, Heves megye 11.4 Baranya, Tolna, Somogy megye 6. Fejér, Veszprém, Zala megye 3. Városi nő 3.8 Kisvárosi harmincas nő 3.1 A változók kiválasztása Az új súlyok koncentrációja Tesztek a különböző kategória-rendszerekkel: A 6-as panel különböző súlyú részeinek hatása 15 A 84-es panel különböző súlyú részeinek hatása 15 iterációk konvergenciája 1 1 kritikus csoportok vizsgálata külön-külön 9 9 telefon szükséges (felhasználók elvárása) jövedelem beválasztása jelentősen növeli a szórást alsó két iskolázottsági kategória (<8 oszt., = 8 oszt.) összevonása célszerű Az egyes % nagyságú csoportok Az egyes % nagyságú csoportok A változók számának csökkentése után adódó súlyok A becslések szórásának vizsgálata Az egymás utáni napok közötti súlyok korrelációja közel.99 a súlyok szórása kisebb a 98-as érték harmadánál A súlyozás (ideális esetben, azaz amikor a universe esetszámok pontosak és teljesül a függetlenség) nem okoz torzítást, legfeljebb a szórást növeli. A megfigyelések nem függetlenek! családon belüli (kényszerű) kapcsolat: az egymáshoz közeli időpontokban nagyon hasonló a műsorok nézőinek összetétele Kérdés: valójában hány elemű mintának felel meg a panel? Kérdés: mekkora is ez a szórás?
6 A bootstrap eljárás Alkalmazása Véletlen, az adott napi panellel családlétszám szerint azonos megoszlást mutató paneleket generálunk. A súlyozási eljárást minden egyes panelre külön-külön elvégezzük Így panelenként kapunk becslést a nézettségi adatokra. X c, X,...X n a panel által adott percben szolgáltatott adatok. A mintákat a panelból vesszük, a nézettségi adatok nem változnak. Gond: nem függetlenek a panel-tagok, de az összefüggőség szórásra gyakorolt hatása vizsgálható a módszerrel. A szórások összehasonlítása A két szórás alakulása egy nap során (átlagos percenkénti nézettség, AMR) Elméleti érték: p ˆ(1 pˆ ) n A bootstrap minták révén megfigyelt (tapasztalati) szórás: ahol p i az egyes mintáknál kapott becslés, pedig ezek átlaga p 1 n 1 ( p p) i RTLSZ. RTLELMS PERC A két szórás hányadosa A két szórás hányadosa a évesek, mint célcsoport esetén Nem függ szignifikánsan az időponttól a nézettségtől Lényeges viszont a vizsgált célcsoport, hiszen az összefüggés mértéke jelentősen eltérhet MTV1SZ MTV1ELMS PERC
7 A szórások hányadosa a főbevásárlók, mint célcsoport esetén Ha a főbevásárlókat tekintjük, nincs családon belüli összefüggés. 1.4 SHANY TVSZ.9 Observed TVELMS Linear PERC ATL A bootstrap mintákból kapott becslés szórása Alapozó felmérés Az előző ábra szerint a bootstrap mintákból kapott becslés szórása néhány százalékkal nagyobb a vártnál. Az ok: a bootstrap mintákra kapott súlyozás szélsőségesebb - a súlyok szórása mintegy 1%-kal magasabb - (hiszen a minta természetszerűleg kevésbé arányos) és ez növeli a kapott becslések szórását. 8. család, reprezentatív minta gond: nem mindenkit lehet elérni, ill. nem mindenki válaszol a kérdésekre a család szociológiai viszonyait vizsgálja a nézőméréshez való viszonyt is rögzíti (több, mint 5% nem vállalja a részvételt) Az esetleges torzítás vizsgálata A becsült és a megfigyelt TV üzemórák összehasonlítása Számszerűsítés: a becsült és a ténylegesen megfigyelt TV-nézés (heti össz üzemóra) vizsgálata Bootstrap elemzés: a teljes alapozó felméréspopulációval azonos eloszlású TV üzemórát becslő háztartásokból álljanak a mintapanelok. Ez így még nem egyértellmű, a későbbiekben térünk vissza a lehetséges megoldási módokra. TUHETI: a háztartásonként mért heti össz-tv üzemórák átlaga ÓRAHETI pedig az Alapozó Felmérésben elozetesen bevallott heti TV üzemóra. N Min Max Átlag ÓRAHETI TUHETI
8 Boot-átlag hivatalos A torzítás Az eltérések vizsgálata A fenti két populáció metszete azokból áll, akik a panelbe kerültek az alapozó felmérésből, ezért az eltérés csak a becslés bizonytalanságát mutatatja. Viszont, ha az ORAHETI értékét a nézőmérő rendszerhez való viszony függvényében vizsgáljuk: AGBMER N Min Max Átlag elutasít (1) vállalk. () beszerelt (3) Az ORAHETI értékek eltérésének szignifikanciáját kétmintás t-próbával vizsgálhatjuk: Az AGBMER = 1 és = csoportok közötti eltérés szignifikáns nem sziginifikáns az eltérés az AGBMER = és = 3 csoportok között. A torzítás számszerűsítése Az egyes csatornák és idősávok nézettsége 1,95,9116 5,64,94819 Bootstrap korrekció Bootstrap mintákat generálva, melyek (esetleg becsült) ORAHETI értékeinek megoszlása megegyezik az alapozó felmérésben megfigyelttel M1411_1 TV411_1 M1411_ TV411_ M1411_3 TV411_3 M1411_4 TV411_4 M1411_5 TV411_5
Megoldási kísérletek:
TV-nézettség mérése TV-nézőmérő rendszer és lehetséges torzítása Előadó: Zempléni András Minden országban működik Célja: visszajelzés a TV-műsorok készítőinek reklámok által elért közönség becslése Eszköze:
Megoldási kísérletek:
TV-nézettség mérése TV-nézőmérő rendszer és lehetséges torzítása Előadó: Zempléni András Minden országban működik Célja: visszajelzés a TV-műsorok készítőinek reklámok által elért közönség becslése Eszköze:
Megoldási kísérletek: idınkénti kontroll-kérdések telefonos ellenırzés adatok szőrése
TV-nézettség mérése TV-néz nézımérı rendszer és lehetséges torzítása Elıadó: Zempléni András Minden országban mőködik Célja: visszajelzés a TV-mősorok készítıinek reklámok által elért közönség becslése
Megoldási kísérletek:
TV-néz nézımérı rendszer és lehetséges torzítása Elıadó: Zempléni András TV-nézettség mérése Minden országban mőködik Célja: visszajelzés a TV-mősorok készítıinek reklámok által elért közönség becslése
DIGITÁLIS ÁTÁLLÁS HATÁSA A NÉZETTSÉGMÉRÉSRE DIGITÁLIS KORREKTÚRA Vörös Csilla március 19.
DIGITÁLIS ÁTÁLLÁS HATÁSA A NÉZETTSÉGMÉRÉSRE DIGITÁLIS KORREKTÚRA 2013 Vörös Csilla 2013. március 19. MÉRÉSI RENDSZER AZ ANALÓG LEKAPCSOLÁS HATÁSA ADATFELVÉTELEK A LEKAPCSOLÁS IDŐSZAKÁBAN PANELMINTA A LEKAPCSOLÁS
STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba
Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum
Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása
Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból
Populációbecslés és monitoring. Eloszlások és alapstatisztikák
Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk
Egyszempontos variancia analízis. Statisztika I., 5. alkalom
Statisztika I., 5. alkalom Számos t-próba versus variancia analízis Kreativitás vizsgálata -nık -férfiak ->kétmintás t-próba I. Fajú hiba=α Kreativitás vizsgálata -informatikusok -építészek -színészek
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
[Biomatematika 2] Orvosi biometria. Visegrády Balázs
[Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés
Hipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
KÖVETKEZTETŐ STATISZTIKA
ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak
A GDP hasonlóképpen nem tükrözi a háztartások közötti munka- és termékcseréket.
FŐBB MUTATÓK A regionális GDP adatok minősége alapvetően 3 tényezőtől függ: az alkalmazott számítási módszertől a felhasznált adatok minőségétől a vizsgált területi egység nagyságától. A TERÜLETI EGYENLŐTLENSÉGEK
A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI. Omnibusz 2003/08. A kutatás dokumentációja. Teljes kötet
A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI Omnibusz 2003/08 A kutatás dokumentációja Teljes kötet 2003 Tartalom BEVEZETÉS... 4 A MINTA... 6 AZ ADATFELVÉTEL FŐBB ADATAI... 8 TÁBLÁK A SÚLYVÁLTOZÓ KÉSZÍTÉSÉHEZ...
A telefonnal való ellátottság kapcsolata a rádió és televízió műsorszórás használatával a 14 éves és idősebb lakosság körében
A telefonnal való ellátottság kapcsolata a rádió és televízió műsorszórás használatával a 14 éves és idősebb lakosság körében Kiegészítő elemzés A rádió és televízió műsorszórás használatára a 14 éves
1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre Varianciaanalízis A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk
y ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre Statisztikai hipotézis vizsgálatok elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari
Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok
Eloszlás-független módszerek (folytatás) 14. elıadás (7-8. lecke) Illeszkedés-vizsgálat 7. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok elemzésére Illeszkedés-vizsgálat Gyakorisági sorok
Biostatisztika VIII. Mátyus László. 19 October
Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.
Bevezetés a hipotézisvizsgálatokba
Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -
Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.
Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak
VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)
VIZSGADOLGOZAT (100 pont) A megoldások csak szöveges válaszokkal teljes értékűek! I. PÉLDÁK (60 pont) 1. példa (13 pont) Az egyik budapesti könyvtárban az olvasókból vett 400 elemű minta alapján a következőket
Kettőnél több csoport vizsgálata. Makara B. Gábor
Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a
Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,
Kutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November
Adatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
Mintavételi eljárások
Mintavételi eljárások Daróczi Gergely, PPKE BTK 2008. X.6. Óravázlat A mintavétel célja Alapfogalmak Alapsokaság, mintavételi keret, megfigyelési egység, mintavételi egység... Nem valószínűségi mintavételezési
STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.
STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése
PILLANATKÉP AZ ANALÓG FÖLDI LEKAPCSOLÁS UTÁN
PILLANATKÉP AZ ANALÓG FÖLDI LEKAPCSOLÁS UTÁN 2013. NOVEMBER Nielsen Közönségmérés CSAK ANALÓG FÖLDI VÉTELLEL RENDELKEZŐK ARÁNYA 2013. június 2. és november 30., televízióval rendelkező háztartások %-ában
Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016
Gyakorlat 8 1xANOVA Dr. Nyéki Lajos 2016 A probléma leírása Azt vizsgáljuk, hogy milyen hatása van a család jövedelmének a tanulók szövegértés teszten elért tanulmányi eredményeire. A minta 59 iskola adatait
Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet
Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e
A maximum likelihood becslésről
A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának
Tévénézési trendek Magyarországon és innovatív megoldások
Tévénézési trendek Magyarországon és innovatív megoldások Nielsen Ügyfélkonferencia 2011. május 11. Előadó: Vörös Csilla Copyright 2011The Nielsen Company Tartalom Eszközellátottság és -használat Növekvő
Varianciaanalízis 4/24/12
1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása
PILLANATKÉP AZ ANALÓG FÖLDI LEKAPCSOLÁS ELSŐ HULLÁMA UTÁN AUGUSZTUS, NIELSEN KÖZÖNSÉGMÉRÉS
PILLANATKÉP AZ ANALÓG FÖLDI LEKAPCSOLÁS ELSŐ HULLÁMA UTÁN 2013. AUGUSZTUS, NIELSEN KÖZÖNSÉGMÉRÉS CSAK ANALÓG FÖLDI VÉTELLEL RENDELKEZŐK ARÁNYA 2013. augusztus A háztartások körében 1 A 3 országos földi
Módszertani segédanyag a nézettségi adatok értelmezéséhez
Műhely Módszertani segédanyag a nézettségi adatok értelmezéséhez A köznyelv és a sajtó gyakran nem tesz különbséget a tévéműsorok nézettségét jellemző különböző mutatószámok között. A csatornák párharcában
Segítség az outputok értelmezéséhez
Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró
A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI OMNIBUSZ 2004/05. A kutatás dokumentációja
A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI OMNIBUSZ 2004/05 A kutatás dokumentációja 2004 Omnibusz 2004/05 Mellékletek Tartalom BEVEZETÉS... 3 A MINTA... 5 AZ ADATFELVÉTEL FŐBB ADATAI... 7 Bevezetés A kutatást
Statisztika Elıadások letölthetık a címrıl
Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel
Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
Biometria gyakorló feladatok BsC hallgatók számára
Biometria gyakorló feladatok BsC hallgatók számára 1. Egy üzem alkalmazottainak megoszlása az elért teljesítmény %-a szerint a következı: Norma teljesítmény % Dolgozók száma 60-80 30 81-90 70 91-100 90
Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE
Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás
6. Előadás. Vereb György, DE OEC BSI, október 12.
6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás
1. tábla Főkereső azonos a főbevásárlóval
Műhely Fő bevásárlók és fő keresők tévénézése A média-ipar szempontjából a háztartás két legfontosabb személyéről kérdezte meg az AGB Hungary a 2001. évi őszi alapozó adatfelvételében, hogy mennyit televíziózik.
TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23
TARTALOMJEGYZÉK 1. téma Átlagbecslés (Barna Katalin).... 7 2. téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 3. téma Összefüggések vizsgálata, korrelációanalízis (Dr. Molnár Tamás)... 73 4. téma Összefüggések
Biomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely. 2011. december 8.
A társadalomkutatás módszerei I. 13. hét Daróczi Gergely Budapesti Corvinus Egyetem 2011. december 8. Outline 1 célja 2 Alapfogalmak 3 Mintavételi eljárások 4 További fogalmak 5 Mintavételi hiba számítása
biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell
Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
Heckman modell. Szelekciós modellek alkalmazásai.
Heckman modell. Szelekciós modellek alkalmazásai. Mikroökonometria, 12. hét Bíró Anikó A tananyag a Gazdasági Versenyhivatal Versenykultúra Központja és a Tudás-Ökonómia Alapítvány támogatásával készült
Centura Szövegértés Teszt
Centura Szövegértés Teszt Megbízhatósági vizsgálata Tesztfejlesztők: Megbízhatósági vizsgálatot végezte: Copyright tulajdonos: Bóka Ferenc, Németh Bernadett, Selmeci Gábor Bodor Andrea Centura Kft. Dátum:
Biomatematika 13. Varianciaanaĺızis (ANOVA)
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA. Változás SPSS állomány neve: Budapest, 2002.
TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA Változás 2002 SPSS állomány neve: F54 Budapest, 2002. Változás 2002 2 Tartalomjegyzék BEVEZETÉS... 3 A SÚLYOZATLAN MINTA ÖSSZEHASONLÍTÁSA ISMERT DEMOGRÁFIAI ELOSZLÁSOKKAL...
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett
Az első számjegyek Benford törvénye
Az első számjegyek Benford törvénye Frank Benford (1883-1948) A General Electric fizikusa Simon Newcomb (1835 1909) asztronómus 1. oldal 2. oldal A híres arizonai csekk sikkasztási eset http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm
Statisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
PLATFORMOK, KÉPERNYŐK ÉS NÉZŐK
PLATFORMOK, KÉPERNYŐK ÉS NÉZŐK HTE 2013 Vörös Csilla 2013. október 4. TARTALOM Digitális Mérés Technológiája Analóg Földi Lekapcsolás és Mérés Platformváltók Platformok és Nézettség Képernyő Tények Kitekintés
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
A társadalomkutatás módszerei I.
A társadalomkutatás módszerei I. 13. hét Daróczi Gergely Budapesti Corvinus Egyetem 2011. december 8. Outline 1 A mintaválasztás célja 2 Alapfogalmak 3 Mintavételi eljárások 4 További fogalmak 5 Mintavételi
Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.
Statsztka próbák Paraméteres. A populácó paraméteret becsüljük, ezekkel számolunk.. Az alapsokaság eloszlására van kkötés. Nem paraméteres Nncs lyen becslés Nncs kkötés Ugyanazon problémára sokszor megvan
Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat
Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi
Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58
u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)
Gyakorlat (Kétmintás próbák) 2018. december 4. Kétmintás u-próba 1 Adott két független minta 0.0012 szórású normális eloszlásból. Az egyik, 9 elem minta realizációjának átlaga 0.1672, a másik 16 elem é
TELEVÍZIÓS KÍNÁLAT ÉS FOGYASZTÁS. Vörös Csilla 2014. Február 27.
TELEVÍZIÓS KÍNÁLAT ÉS FOGYASZTÁS Vörös Csilla 2014. Február 27. ELÉRÉS ÉS KÖZÖNSÉGARÁNY A NAPI TÉVÉNÉZÉSI IDŐ ÉS AZ ELÉRÉS Célcsoportok: Teljes lakosság (9 179 449 fő) és 18+ (7 857 565 fő) Idősáv: 02:00-25:59
Függetlenségvizsgálat, Illeszkedésvizsgálat
Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata
A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:
A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását,
Kistérségi gazdasági aktivitási adatok
Kistérségi gazdasági aktivitási adatok 1. A KMSR rendszerben alkalmazott statisztikai módszerek Előadó: Dr. Banai Miklós 2. A KMSR rendszer által szolgáltatott adatok, jelentések Előadó: Kovács Attila
Több valószínűségi változó együttes eloszlása, korreláció
Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...
Többváltozós lineáris regressziós modell feltételeinek tesztelése I.
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós
Biomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)
Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Klaszteranalízis Hasonló dolgok csoportosítását jelenti, gyakorlatilag az osztályozás szinonimájaként értelmezhetjük. A klaszteranalízis célja A klaszteranalízis alapvető célja, hogy a megfigyelési egységeket
Normális eloszlás tesztje
Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
Asszociációs szabályok
Asszociációs szabályok Nikházy László Nagy adathalmazok kezelése 2010. március 10. Mi az értelme? A ö asszociációs szabály azt állítja, hogy azon vásárlói kosarak, amik tartalmaznak pelenkát, általában
Többváltozós lineáris regressziós modell feltételeinek
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p
Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás
STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x
Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?
Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles
Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis
Hipotézis BIOMETRIA 5. Előad adás Hipotézisvizsg zisvizsgálatok Tudományos hipotézis Nullhipotézis feláll llítása (H ): Kétmintás s hipotézisek Munkahipotézis (H a ) Nullhipotézis (H ) > = 1 Statisztikai
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.
V. Gyakorisági táblázatok elemzése
V. Gyakorisági táblázatok elemzése Tartalom Diszkrét változók és eloszlásuk Gyakorisági táblázatok Populációk összehasonlítása diszkrét változók segítségével Diszkrét változók kapcsolatvizsgálata Példák
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs
Jelentés a Diagnosztikus fejlődésvizsgáló rendszer alkalmazásáról a 2018/2019. tanévben
Jelentés a Diagnosztikus fejlődésvizsgáló rendszer alkalmazásáról a 2018/2019. tanévben 2018. december 1. Jogszabályi háttér A 2018/2019. tanév rendjéről szóló 13/2018. (VI. 14.) EMMI rendelet írja elő