Príklad rozdelenia chí kvadrát. Klasické metódy štatistiky: chí-kvadrát test. Kritické distribučné body χ2

Distribúcia. Pearsonovo rozdelenie Hustota pravdepodobnosti ... Wikipedia

chí-kvadrát rozdelenie- distribúcia "chi square" - Témy informačná bezpečnosť EN chi square distribúcia ... Technická príručka prekladateľa

chí-kvadrát rozdelenie- rozdelenie pravdepodobnosti spojitej náhodnej premennej s hodnotami od 0 do, ktorej hustota je daná vzorcom, kde 0 s parametrom =1,2,...; je funkcia gama. Príklady. 1) Súčet štvorcov nezávislého normalizovaného normálneho náhodného ... ... Slovník sociologickej štatistiky

CHI-SQUARE DISTRIBUTION (chi2)- Distribúcia náhodnej premennej chi2. ak sú náhodné vzorky veľkosti 1 odobraté z normálneho rozdelenia so strednou hodnotou (a rozptylom q2, potom chi2 = (X1 u)2/q2, kde X je vzorkovaná hodnota. Ak sa veľkosť vzorky ľubovoľne zväčšuje až po N, potom chi2 = … …

Hustota pravdepodobnosti ... Wikipedia

- (distribúcia Snedecor) Hustota pravdepodobnosti ... Wikipedia

Fisherovo rozdelenie Hustota pravdepodobnosti Funkcia rozdelenia Počet parametrov s ... Wikipedia

Jeden zo základných pojmov teórie pravdepodobnosti a matematickej štatistiky. S moderným prístupom ako matematika. modelu skúmaného náhodného javu sa vezme zodpovedajúci priestor pravdepodobnosti (W, S, P), kde W je množina elementárnych ... Matematická encyklopédia

Gamma rozdelenie Hustota pravdepodobnosti Funkcia rozdelenia Parametre ... Wikipedia

F DISTRIBÚCIA- Teoretické rozdelenie pravdepodobnosti náhodnej premennej F. Ak sú náhodné vzorky veľkosti N vybrané nezávisle od normálnej populácie, každá z nich generuje rozdelenie chí-kvadrát so stupňom voľnosti = N. Pomer dvoch takýchto ... . .. Slovník v psychológii

knihy

  • Teória pravdepodobnosti a matematická štatistika v problémoch. Viac ako 360 úloh a cvičení, Borzykh D.A. Navrhovaná príručka obsahuje úlohy rôznych úrovní zložitosti. Pozornosť sa však sústreďuje na úlohy stredná náročnosť. Toto sa robí zámerne s cieľom povzbudiť študentov, aby…

Rozdelenie chí-kvadrát je jedným z najpoužívanejších v štatistike na testovanie štatistických hypotéz. Na základe rozdelenia „chí-kvadrát“ bol skonštruovaný jeden z najsilnejších testov dobrej zhody, Pearsonov test „chí-kvadrát“.

Test dobrej zhody je kritériom na testovanie hypotézy o navrhovanom zákone neznámeho rozdelenia.

Na testovanie hypotézy sa používa test χ2 („chí-kvadrát“) rôzne distribúcie. Toto je jeho zásluha.

Výpočtový vzorec kritéria sa rovná

kde m a m' sú empirické a teoretické frekvencie

zvažovaná distribúcia;

n je počet stupňov voľnosti.

Na overenie potrebujeme porovnať empirické (pozorované) a teoretické (vypočítané za predpokladu normálneho rozdelenia) frekvencie.

Ak sa empirické frekvencie úplne zhodujú s frekvenciami vypočítanými alebo očakávanými, S (E - T) = 0 a kritérium χ2 sa tiež bude rovnať nule. Ak sa S (E - T) nerovná nule, bude to znamenať nesúlad medzi vypočítanými frekvenciami a empirickými frekvenciami série. V takýchto prípadoch je potrebné vyhodnotiť významnosť kritéria χ2, ktoré sa teoreticky môže meniť od nuly do nekonečna. Toto sa robí porovnaním skutočne získanej hodnoty χ2ph s jej kritickou hodnotou (χ2st). Nulová hypotéza, t. j. predpoklad, že nezrovnalosť medzi empirickými a teoretickými alebo očakávanými frekvenciami je náhodná, je vyvrátená, ak je χ2ph väčšia alebo rovnaká až χ2st pre akceptovanú hladinu významnosti (a) a počet stupňov voľnosti (n).

Rozdelenie pravdepodobných hodnôt náhodnej premennej χ2 je spojité a asymetrické. Závisí od počtu stupňov voľnosti (n) a pri narastajúcom počte pozorovaní sa približuje k normálnemu rozdeleniu. Preto sa na odhad použije kritérium χ2 diskrétne distribúcie je spojená s niektorými chybami, ktoré ovplyvňujú jej hodnotu, najmä pri malých vzorkách. Na získanie presnejších odhadov sa vzorka rozdelila v variačná séria, musí mať aspoň 50 možností. Správna aplikácia kritéria χ2 tiež vyžaduje, aby frekvencie variantov v extrémnych triedach neboli menšie ako 5; ak ich je menej ako 5, tak sa skombinujú s frekvenciami susedných tried tak, aby ich celkový počet bol väčší alebo rovný 5. Podľa kombinácie frekvencií klesá aj počet tried (N). Počet stupňov voľnosti sa nastavuje podľa sekundárneho počtu tried, pričom sa berie do úvahy počet obmedzení voľnosti variácií.



Keďže presnosť určenia kritéria χ2 do značnej miery závisí od presnosti výpočtu teoretických frekvencií (T), na získanie rozdielu medzi empirickými a vypočítanými frekvenciami by sa mali použiť nezaokrúhlené teoretické frekvencie.

Ako príklad si vezmite štúdiu zverejnenú na webovej stránke venovanej tejto aplikácii štatistické metódy v humanitných vedách.

Chí-kvadrát test umožňuje porovnanie rozdelenia frekvencií, či už sú normálne rozložené alebo nie.

Frekvencia sa vzťahuje na počet výskytov udalosti. Frekvencia výskytu udalosti sa zvyčajne rieši, keď sa premenné merajú v škále mien a ich ostatné charakteristiky, okrem frekvencie, nie je možné alebo problematické vybrať. Inými slovami, keď má premenná kvalitatívne charakteristiky. Mnoho výskumníkov má tiež tendenciu prekladať výsledky testov do úrovní (vysoké, stredné, nízke) a zostavovať tabuľky rozdelenia skóre, aby zistili počet ľudí na týchto úrovniach. Na dôkaz, že v jednej z úrovní (v jednej z kategórií) je skutočne viac (menej) ľudí, sa používa aj koeficient chí-kvadrát.

Pozrime sa na najjednoduchší príklad.

U mladších dospievajúcich sa uskutočnil test sebaúcty. Výsledky testov boli preložené do troch úrovní: vysoká, stredná, nízka. Rozložené frekvencie nasledujúcim spôsobom:

Vysoká (H) 27 os.

Stredné (C) 12 osôb

Nízka (H) 11 os.

Je zrejmé, že väčšina detí s vysokým sebavedomím, to však treba štatisticky dokázať. Na to používame Chí-kvadrát test.

Našou úlohou je skontrolovať, či sa získané empirické údaje líšia od teoreticky rovnako pravdepodobných. Na to je potrebné nájsť teoretické frekvencie. V našom prípade sú teoretické frekvencie ekvipravdepodobné frekvencie, ktoré sa nachádzajú sčítaním všetkých frekvencií a delením počtom kategórií.

V našom prípade:

(B + C + H) / 3 \u003d (27 + 12 + 11) / 3 \u003d 16,6

Vzorec na výpočet chí-kvadrát testu je:

χ2 = ∑(E - T)І / T

Postavíme stôl:

Nájdite súčet posledného stĺpca:

Teraz musíte nájsť kritickú hodnotu kritéria podľa tabuľky kritických hodnôt (tabuľka 1 v prílohe). Na to potrebujeme počet stupňov voľnosti (n).

n = (R - 1) * (C - 1)

kde R je počet riadkov v tabuľke, C je počet stĺpcov.

V našom prípade je len jeden stĺpec (rozumej pôvodné empirické frekvencie) a tri riadky (kategórie), takže vzorec sa mení – stĺpce vylučujeme.

n = (R-1) = 3-1 = 2

Pre pravdepodobnosť chyby p≤0,05 an = 2 je kritická hodnota χ2 = 5,99.

Získaná empirická hodnota je väčšia ako kritická hodnota – frekvenčné rozdiely sú významné (χ2= 9,64; p≤0,05).

Ako vidíte, výpočet kritéria je veľmi jednoduchý a nezaberie veľa času. Praktická hodnota testu chí-kvadrát je obrovská. Táto metóda je najcennejšia pri analýze odpovedí na dotazníky.


Uveďme si komplexnejší príklad.

Psychológ chce napríklad vedieť, či je pravda, že učitelia sú viac zaujatí voči chlapcom ako voči dievčatám. Tie. skôr chváliť dievčatá. Na tento účel psychológ analyzoval charakteristiky študentov napísané učiteľmi na frekvenciu výskytu troch slov: „aktívny“, „usilovný“, „disciplinovaný“, počítali sa aj synonymá slov. Údaje o frekvencii výskytu slov boli zapísané do tabuľky:

Na spracovanie získaných údajov používame chí-kvadrát test.

K tomu zostrojíme tabuľku rozdelenia empirických početností, t.j. frekvencie, ktoré pozorujeme:

Teoreticky očakávame, že frekvencie budú rozdelené rovnomerne, t.j. frekvencia bude rozdelená medzi chlapcov a dievčatá. Zostavme si tabuľku teoretických frekvencií. Za týmto účelom vynásobte súčet riadkov súčtom stĺpcov a vydeľte výsledné číslo celkovým súčtom (súčtami).

Výsledná tabuľka pre výpočty bude vyzerať takto:

χ2 = ∑(E - T)І / T

n = (R - 1), kde R je počet riadkov v tabuľke.

V našom prípade chí-kvadrát = 4,21; n = 2.

Podľa tabuľky kritických hodnôt kritéria nájdeme: pri n = 2 a chybe 0,05 kritickú hodnotu χ2 = 5,99.

Výsledná hodnota je menšia ako kritická hodnota, čo znamená, že je akceptovaná nulová hypotéza.

Záver: učitelia nepripisujú dôležitosť pohlaviu dieťaťa pri písaní jeho charakteristík.


Záver.

K. Pearson významne prispel k rozvoju matematickej štatistiky (veľký počet fundamentálnych pojmov). Pearsonov hlavný filozofický postoj je formulovaný takto: pojmy vedy sú umelé konštrukcie, prostriedky na opis a usporiadanie zmyslovej skúsenosti; pravidlá ich spájania do vedeckých návrhov určuje gramatika vedy, ktorá je filozofiou vedy. Prepojiť heterogénne pojmy a javy umožňuje univerzálna disciplína – aplikovaná štatistika, hoci podľa Pearsona je aj subjektívna.

Mnohé stavby K. Pearsona priamo súvisia alebo sú vyvinuté pomocou antropologických materiálov. Vyvinul množstvo metód numerickej klasifikácie a štatistických kritérií používaných vo všetkých oblastiach vedy.


Literatúra.

1. A. N. Bogolyubov, Matematika. Mechanika. Biografický sprievodca. - Kyjev: Naukova Dumka, 1983.

2. Kolmogorov A. N., Juškevič A. P. (ed.). Matematika 19. storočia. - M.: Veda. - T.I.

3. 3. Borovkov A.A. Matematické štatistiky. Moskva: Nauka, 1994.

4. 8. Feller V. Úvod do teórie pravdepodobnosti a jej aplikácií. - M.: Mir, T.2, 1984.

5. 9. Harman G., Moderná faktorová analýza. - M.: Štatistika, 1972.

Test \(\chi^2\) ("chi-kvadrát", tiež "Pearsonov test dobrej zhody") má v štatistike mimoriadne široké uplatnenie. IN všeobecný pohľad môžeme povedať, že sa používa na testovanie nulovej hypotézy o poslušnosti pozorovanej náhodnej premennej určitému teoretickému zákonu rozdelenia (podrobnejšie pozri napr.). Konkrétna formulácia testovanej hypotézy sa bude líšiť prípad od prípadu.

V tomto príspevku popíšem ako funguje test \(\chi^2\) na (hypotetickom) príklade z imunológie. Predstavte si, že sme vykonali experiment na zistenie účinnosti potlačenia rozvoja mikrobiálneho ochorenia, keď sa do tela vpravia príslušné protilátky. Celkovo bolo do experimentu zapojených 111 myší, ktoré sme rozdelili do dvoch skupín, vrátane 57 a 54 zvierat. Prvá skupina myší dostala injekciu patogénnych baktérií, po ktorej nasledovalo zavedenie krvného séra obsahujúceho protilátky proti týmto baktériám. Zvieratá z druhej skupiny slúžili ako kontroly – dostávali len bakteriálne injekcie. Po určitom čase inkubácie sa ukázalo, že 38 myší zomrelo a 73 prežilo. Z mŕtvych patrilo 13 do prvej skupiny a 25 do druhej (kontrola). Nulová hypotéza testovaná v tomto experimente môže byť formulovaná nasledovne: podanie séra s protilátkami nemá žiadny vplyv na prežitie myší. Inými slovami, tvrdíme, že pozorované rozdiely v prežívaní myší (77,2 % v prvej skupine oproti 53,7 % v druhej skupine) sú úplne náhodné a nesúvisia s pôsobením protilátok.

Údaje získané v experimente môžu byť prezentované vo forme tabuľky:

Celkom

Baktérie + sérum

Iba baktérie

Celkom

Tabuľky ako táto sa nazývajú kontingenčné tabuľky. V tomto príklade má tabuľka rozmer 2x2: existujú dve triedy objektov ("Baktérie + sérum" a "Iba baktérie"), ktoré sa skúmajú podľa dvoch kritérií ("Mŕtvy" a "Preživší"). Toto najjednoduchší prípad kontingenčné tabuľky: samozrejme, počet študovaných tried aj počet funkcií môže byť väčší.

Aby sme otestovali vyššie formulovanú nulovú hypotézu, musíme vedieť, aká by bola situácia, keby protilátky v skutočnosti nemali žiadny vplyv na prežitie myší. Inými slovami, musíte počítať očakávané frekvencie pre zodpovedajúce bunky kontingenčnej tabuľky. Ako to spraviť? V experimente zomrelo celkom 38 myší, čo je 34,2 %. celkový počet zapojené zvieratá. Ak zavedenie protilátok neovplyvní prežitie myší, u oboch experimentálne skupiny treba dodržať rovnaké percento úmrtnosti, a to 34,2 %. Ak vypočítame, koľko je 34,2 % z 57 a 54, dostaneme 19,5 a 18,5. Toto sú očakávané miery úmrtnosti v našich experimentálnych skupinách. Očakávané miery prežitia sa vypočítajú podobným spôsobom: keďže celkovo prežilo 73 myší alebo 65,8 % z ich celkového počtu, očakávané miery prežitia sú 37,5 a 35,5. Urobme novú kontingenčnú tabuľku, teraz s očakávanými frekvenciami:

mŕtvy

Preživší

Celkom

Baktérie + sérum

Iba baktérie

Celkom

Ako vidíte, očakávané frekvencie sú značne odlišné od pozorovaných, t.j. Zdá sa, že podávanie protilátok má vplyv na prežitie myší infikovaných patogénom. Tento dojem môžeme kvantifikovať pomocou Pearsonovho testu dobrej zhody \(\chi^2\):

\[\chi^2 = \sum_()\frac((f_o - f_e)^2)(f_e),\]


kde \(f_o\) a \(f_e\) sú pozorované a očakávané frekvencie. Sčítanie sa vykonáva nad všetkými bunkami tabuľky. Takže pre uvažovaný príklad máme

\[\chi^2 = (13 – 19,5)^2/19,5 + (44 – 37,5)^2/37,5 + (25 – 18,5)^2/18,5 + (29 – 35,5)^2/35,5 = \]

Je \(\chi^2\) dostatočne veľké na zamietnutie nulovej hypotézy? Na zodpovedanie tejto otázky je potrebné nájsť zodpovedajúcu kritickú hodnotu kritéria. Počet stupňov voľnosti pre \(\chi^2\) sa vypočíta ako \(df = (R - 1)(C - 1)\), kde \(R\) a \(C\) sú číslo riadkov a stĺpcov v konjugácii tabuľky. V našom prípade \(df = (2 -1)(2 - 1) = 1\). Keďže poznáme počet stupňov voľnosti, môžeme teraz ľahko zistiť kritickú hodnotu \(\chi^2\) pomocou štandardnej R-funkcie qchisq() :


Pre jeden stupeň voľnosti teda hodnota kritéria \(\chi^2\) presahuje 3,841 len v 5 % prípadov. Nami získaná hodnota 6,79 výrazne prevyšuje túto kritickú hodnotu, čo nám dáva právo zamietnuť nulovú hypotézu, že neexistuje žiadny vzťah medzi podávaním protilátok a prežitím infikovaných myší. Odmietnutím tejto hypotézy riskujeme, že sa mýlime s pravdepodobnosťou menšou ako 5%.

Treba poznamenať, že vyššie uvedený vzorec pre kritérium \(\chi^2\) poskytuje trochu nadhodnotené hodnoty pri práci s kontingenčnými tabuľkami veľkosti 2x2. Dôvodom je, že rozdelenie samotného kritéria \(\chi^2\) je spojité, zatiaľ čo frekvencie binárnych prvkov ("zomreli" / "prežili") sú z definície diskrétne. V tomto smere je pri výpočte kritéria zvykom zavádzať tzv. korekcia kontinuity, alebo Yatesov dodatok :

\[\chi^2_Y = \sum_()\frac((|f_o - f_e| - 0,5)^2)(f_e).\]

Pearson "Test chí-kvadrát s Yatesom"údaje korekcie kontinuity: myši X-squared = 5,7923, df = 1, p-hodnota = 0,0161


Ako vidíte, R automaticky aplikuje Yatesovu korekciu na spojitosť ( Pearsonov Chi-kvadrát test s Yatesovou korekciou kontinuity). Hodnota \(\chi^2\) vypočítaná programom bola 5,79213. Môžeme zamietnuť nulovú hypotézu žiadneho účinku protilátky s rizikom, že sa mýlime s pravdepodobnosťou tesne nad 1 % (p-hodnota = 0,0161).

Ministerstvo školstva a vedy Ruskej federácie

Federálna agentúra pre vzdelávanie mesta Irkutsk

Bajkal Štátna univerzita ekonomika a právo

Katedra informatiky a kybernetiky

Chi-kvadrát rozdelenie a jeho aplikácia

Kolmyková Anna Andrejevna

študent 2. ročníka

skupina IS-09-1

Na spracovanie získaných údajov používame chí-kvadrát test.

K tomu zostrojíme tabuľku rozdelenia empirických početností, t.j. frekvencie, ktoré pozorujeme:

Teoreticky očakávame, že frekvencie budú rozdelené rovnomerne, t.j. frekvencia bude rozdelená medzi chlapcov a dievčatá. Zostavme si tabuľku teoretických frekvencií. Za týmto účelom vynásobte súčet riadkov súčtom stĺpcov a vydeľte výsledné číslo celkovým súčtom (súčtami).


Výsledná tabuľka pre výpočty bude vyzerať takto:

χ2 \u003d ∑ (E – T)² / T

n = (R - 1), kde R je počet riadkov v tabuľke.

V našom prípade chí-kvadrát = 4,21; n = 2.

Podľa tabuľky kritických hodnôt kritéria nájdeme: pri n = 2 a chybe 0,05 kritickú hodnotu χ2 = 5,99.

Výsledná hodnota je menšia ako kritická hodnota, čo znamená, že je akceptovaná nulová hypotéza.

Záver: učitelia nepripisujú dôležitosť pohlaviu dieťaťa pri písaní jeho charakteristík.

Aplikácia

Kritické distribučné body χ2

stôl 1

Záver

Študenti takmer všetkých odborov študujú na konci kurzu vyššia matematikačasti „teória pravdepodobnosti a matematická štatistika“, v skutočnosti sa oboznamujú len s niektorými základnými pojmami a výsledkami, ktoré zjavne nestačia na praktická práca. S niektorými matematickými metódami výskumu sa študenti stretávajú v špeciálnych kurzoch (napríklad „Prognózovanie a plánovanie realizovateľnosti“, „Technická a ekonomická analýza“, „Kontrola kvality produktov“, „Marketing“, „Kontroling“, „ Matematické metódy Prognostika, "štatistika" atď. - v prípade študentov ekonomických odborov je však prezentácia vo väčšine prípadov veľmi skrátená a predpisujúca, v dôsledku čoho odborníci na aplikovanú štatistiku nemajú dostatok vedomostí.

Preto veľký význam má kurz „Aplikovaná štatistika“ v technické univerzity, a na ekonomických univerzitách - kurz "Ekonometria", pretože ekonometria je, ako viete, štatistická analýza konkrétnych ekonomických údajov.

Teória pravdepodobnosti a matematická štatistika poskytujú základné poznatky pre aplikovanú štatistiku a ekonometriu.

Sú potrebné pre špecialistov na praktickú prácu.

Uvažoval som o spojitom pravdepodobnostnom modeli a snažil som sa ukázať jeho použiteľnosť na príkladoch.

Bibliografia

1. Orlov A.I. Aplikovaná štatistika. M.: Vydavateľstvo "Skúška", 2004.

2. Gmurman V.E. Teória pravdepodobnosti a matematická štatistika. M.: absolventská škola, 1999. - 479 s.

3. Ayvozyan S.A. Teória pravdepodobnosti a aplikovaná štatistika, v.1. M.: Jednota, 2001. - 656. roky.

4. Khamitov G.P., Vederniková T.I. Pravdepodobnosti a štatistiky. Irkutsk: BSUEP, 2006 - 272 s.

5. Ezhova L.N. Ekonometria. Irkutsk: BSUEP, 2002. - 314s.

6. Mosteller F. Päťdesiat zábavných pravdepodobnostných problémov s riešeniami. M. : Nauka, 1975. - 111s.

7. Mosteller F. Pravdepodobnosť. M. : Mir, 1969. - 428. roky.

8. Yaglom A.M. Pravdepodobnosť a informácie. M. : Nauka, 1973. - 511s.

9. Chistyakov V.P. Kurz pravdepodobnosti. M.: Nauka, 1982. - 256 s.

10. Kremer N.Sh. Teória pravdepodobnosti a matematická štatistika. M.: UNITI, 2000. - 543 s.

11. Matematická encyklopédia, v.1. M.: Sovietska encyklopédia, 1976. - 655s.

12. http://psystat.at.ua/ - Štatistika v psychológii a pedagogike. Článok Chí-kvadrát test.

Predtým koniec XIX storočí normálne rozdelenie považovaný za univerzálny zákon o variácii údajov. K. Pearson si však všimol, že empirické frekvencie sa môžu značne líšiť od normálneho rozdelenia. Otázkou bolo, ako to dokázať. Vyžadovalo si to nielen grafické porovnanie, ktoré je subjektívne, ale aj prísne kvantitatívne zdôvodnenie.

Tak bolo vynájdené kritérium χ 2(chi kvadrát), ktorý testuje významnosť nesúladu medzi empirickými (pozorovanými) a teoretickými (očakávanými) frekvenciami. Stalo sa to už v roku 1900, ale toto kritérium sa používa dodnes. Navyše bol prispôsobený na riešenie širokého spektra úloh. V prvom rade ide o rozbor kategorických údajov, t.j. tie, ktoré sú vyjadrené nie kvantitou, ale príslušnosťou k nejakej kategórii. Napríklad trieda auta, pohlavie účastníka experimentu, druh rastliny atď. Na takéto dáta nie je možné použiť matematické operácie ako sčítanie a násobenie, dajú sa pre ne vypočítať iba frekvencie.

Pozorované frekvencie označujeme Oh (Pozorované), očakávané - E (očakávané). Ako príklad si zoberme výsledok hodu kockou 60-krát. Ak je symetrický a rovnomerný, pravdepodobnosť, že sa objaví ktorákoľvek strana, je 1/6, a preto očakávaný počet každej strany je 10 (1/6∙60). Pozorované a očakávané frekvencie zapíšeme do tabuľky a nakreslíme histogram.

Nulová hypotéza je, že frekvencie sú konzistentné, to znamená, že skutočné údaje nie sú v rozpore s očakávanými. Alternatívnou hypotézou je, že odchýlky vo frekvenciách presahujú náhodné výkyvy, rozdiely sú štatisticky významné. Aby sme vyvodili rigorózny záver, potrebujeme.

  1. Zovšeobecnená miera nesúladu medzi pozorovanými a očakávanými frekvenciami.
  2. Rozdelenie tejto miery pri platnosti hypotézy, že neexistujú žiadne rozdiely.

Začnime vzdialenosťou medzi frekvenciami. Ak vezmeme len rozdiel O - E, potom bude takéto meranie závisieť od rozsahu údajov (frekvencií). Napríklad 20 - 5 = 15 a 1020 - 1005 = 15. V oboch prípadoch je rozdiel 15. Ale v prvom prípade sú očakávané frekvencie 3-krát menšie ako pozorované a v druhom prípade iba 1,5 %. Potrebujeme relatívnu mieru, ktorá nezávisí od mierky.

Venujme pozornosť nasledujúcim skutočnostiam. Vo všeobecnosti môže byť počet kategórií, v ktorých sa merajú frekvencie, oveľa väčší, takže pravdepodobnosť, že jedno pozorovanie bude spadať do tej či onej kategórie, je dosť malá. Ak áno, potom sa rozdelenie takejto náhodnej premennej bude riadiť zákonom o vzácnych udalostiach, tzv Poissonov zákon. V Poissonovom zákone, ako je známe, hodnota matematické očakávanie a odchýlky sú rovnaké (parameter λ ). Preto očakávaná frekvencia pre určitú kategóriu nominálnej premennej E i bude súčasnosť a jej rozptyl. Ďalej, Poissonov zákon s veľkým počtom pozorovaní má tendenciu k normálu. Spojením týchto dvoch faktov dostaneme, že ak je pravdivá hypotéza o zhode medzi pozorovanými a očakávanými frekvenciami, potom s veľkým počtom pozorovaní, výraz

Je dôležité mať na pamäti, že normálnosť sa objaví iba pri dostatočne vysokých frekvenciách. V štatistike sa všeobecne uznáva, že celkový počet pozorovaní (súčet frekvencií) by mal byť aspoň 50 a očakávaná frekvencia v každej gradácii by mala byť aspoň 5. Iba v tomto prípade má vyššie uvedená hodnota štandardnú normálnu hodnotu. distribúcia. Predpokladajme, že táto podmienka je splnená.

Štandardné normálne rozdelenie má takmer všetky hodnoty v rozmedzí ±3 (pravidlo troch sigma). Takto sme dostali relatívny rozdiel vo frekvenciách pre jednu gradáciu. Potrebujeme všeobecné opatrenie. Nemôžete len spočítať všetky odchýlky - dostaneme 0 (hádajte prečo). Pearson navrhol pridať druhé mocniny týchto odchýlok.

Toto sú znamenia Chí-kvadrát test Pearson. Ak frekvencie skutočne zodpovedajú očakávaným, potom bude hodnota kritéria relatívne malá (pretože väčšina odchýlok je blízko nule). Ale ak sa ukáže, že kritérium je veľké, potom to svedčí v prospech významných rozdielov medzi frekvenciami.

Pearsonovo kritérium sa stáva „veľkým“, keď sa výskyt takejto alebo ešte väčšej hodnoty stane nepravdepodobným. A na výpočet takejto pravdepodobnosti je potrebné poznať rozdelenie kritéria pri mnohonásobnom opakovaní experimentu, kedy je hypotéza frekvenčnej zhody správna.

Ako vidíte, hodnota chí-kvadrát závisí aj od počtu termínov. Čím je ich viac, tým by mala byť hodnota kritéria väčšia, pretože každý výraz sa bude podieľať na celkovej sume. Preto pre každé množstvo nezávislý podmienok, bude mať vlastnú distribúciu. Ukazuje sa, že χ 2 je celá rodina distribúcií.

A tu sa dostávame k jednému šteklivému momentu. Čo je to číslo nezávislý podmienky? Zdá sa, že každý termín (t. j. odchýlka) je nezávislý. Myslel si to aj K. Pearson, no ukázalo sa, že sa mýlil. V skutočnosti bude počet nezávislých členov o jeden menší ako počet gradácií nominálnej premennej n. prečo? Pretože ak máme vzorku, pre ktorú už bol vypočítaný súčet frekvencií, tak jednu z frekvencií môžeme vždy definovať ako rozdiel medzi celkovým počtom a súčtom všetkých ostatných. Preto bude odchýlka o niečo menšia. Ronald Fisher si túto skutočnosť všimol 20 rokov po tom, čo Pearson vyvinul svoje kritérium. Dokonca aj stoly museli byť prerobené.

Pri tejto príležitosti Fisher zaviedol do štatistiky nový pojem - stupeň voľnosti(stupne voľnosti), čo je počet nezávislých členov v súčte. Pojem stupňov voľnosti má matematické vysvetlenie a objavuje sa len v distribúciách spojených s normálom (Student, Fisher-Snedekor a samotná chí-kvadrát).

Aby sme lepšie pochopili význam stupňov voľnosti, obráťme sa na fyzikálny analóg. Predstavte si bod, ktorý sa voľne pohybuje v priestore. Má 3 stupne voľnosti, pretože sa môže pohybovať v akomkoľvek smere trojrozmerného priestoru. Ak sa bod pohybuje po akomkoľvek povrchu, potom už má dva stupne voľnosti (dopredu-dozadu, sprava-doľava), hoci sa naďalej nachádza v trojrozmernom priestore. Bod pohybujúci sa pozdĺž pružiny je opäť v trojrozmernom priestore, ale má len jeden stupeň voľnosti, pretože sa môže pohybovať dopredu alebo dozadu. Ako vidíte, priestor, kde sa objekt nachádza, nie vždy zodpovedá skutočnej slobode pohybu.

Približne aj rozdelenie štatistického kritéria môže závisieť od menšieho počtu prvkov, ako sú potrebné podmienky na jeho výpočet. Vo všeobecnom prípade je počet stupňov voľnosti menší ako počet pozorovaní o počet dostupných závislostí.

Takže rozdelenie je chí na druhú ( χ 2) je rodina rozdelení, z ktorých každé závisí od parametra stupňov voľnosti. A formálna definícia chí-kvadrát testu je nasledovná. Distribúcia χ 2(chí-kvadrát) s k stupňa voľnosti je rozdelenie súčtu štvorcov k nezávislé štandardné normálne náhodné premenné.

Ďalej by sme mohli prejsť k samotnému vzorcu, podľa ktorého sa počíta funkcia rozdelenia chí-kvadrát, no, našťastie, všetko je už dávno vypočítané za nás. Na získanie pravdepodobnosti záujmu môžete použiť buď príslušnú štatistickú tabuľku, alebo hotovú funkciu v Exceli.

Je zaujímavé sledovať, ako sa tvar distribúcie chí-kvadrát mení v závislosti od počtu stupňov voľnosti.

Keď sa stupne voľnosti zvyšujú, rozdelenie chí-kvadrát má tendenciu byť normálne. Vysvetľuje sa to pôsobením centrálnej limitnej vety, podľa ktorej súčet Vysoké číslo nezávislé náhodné premenné majú normálne rozdelenie. Nehovorí nič o štvorcoch.

Pearsonov test hypotézy chí-kvadrát

Dostávame sa teda k testovaniu hypotéz pomocou metódy chí-kvadrát. Vo všeobecnosti zostáva technika. Predkladá sa nulová hypotéza, že pozorované frekvencie zodpovedajú očakávaným (t. j. nie je medzi nimi žiadny rozdiel, pretože sú prevzaté z rovnakej všeobecnej populácie). Ak je to tak, potom bude rozptyl relatívne malý, v medziach náhodných výkyvov. Miera šírenia je určená testom chí-kvadrát. Ďalej sa buď porovnáva samotné kritérium s kritickou hodnotou (pre zodpovedajúcu hladinu významnosti a stupňa voľnosti), alebo sa presnejšie vypočíta pozorovaná p-hodnota, t.j. pravdepodobnosť získania takejto alebo ešte väčšej hodnoty kritéria pri platnosti nulovej hypotézy.

Pretože Keďže nás zaujíma zhoda frekvencií, potom bude hypotéza zamietnutá, keď je kritérium väčšie ako kritická úroveň. Tie. kritérium je jednostranné. Niekedy (niekedy) je však potrebné otestovať hypotézu ľaváka. Napríklad, keď sú empirické údaje veľmi podobné tým teoretickým. Potom môže kritérium spadať do nepravdepodobnej oblasti, ale už vľavo. Faktom je, že v prírodných podmienkach je nepravdepodobné, že by sa získali frekvencie, ktoré by sa prakticky zhodovali s teoretickými. Vždy existuje nejaká náhoda, ktorá spôsobuje chybu. Ak však takáto chyba neexistuje, možno boli údaje sfalšované. Napriek tomu sa zvyčajne testuje pravoruká hypotéza.

Vráťme sa k problému s kockami. Vypočítajte hodnotu chí-kvadrát testu podľa dostupných údajov.

Teraz nájdime kritickú hodnotu pri 5 stupňoch voľnosti ( k) a hladina významnosti 0,05 ( α ) podľa tabuľky kritických hodnôt rozdelenia chí-kvadrát.

To znamená kvantil distribúcie 0,05 chi na druhú (pravý koniec) s 5 stupňami voľnosti x2 0,05; 5 = 11,1.

Porovnajme skutočnú a tabuľkovú hodnotu. 3,4( χ 2) < 11,1 (x2 0,05; 5). Vypočítané kritérium sa ukázalo byť menšie, čo znamená, že hypotéza rovnosti (súhlasu) frekvencií nie je zamietnutá. Na obrázku situácia vyzerá takto.

Ak by vypočítaná hodnota spadala do kritickej oblasti, potom by bola nulová hypotéza zamietnutá.

Správnejšie by bolo vypočítať aj p-hodnotu. Aby ste to dosiahli, musíte v tabuľke nájsť najbližšiu hodnotu pre daný počet stupňov voľnosti a zobraziť zodpovedajúcu úroveň významnosti. Ale toto je minulé storočie. Budeme používať počítač, najmä MS Excel. Excel má niekoľko funkcií súvisiacich s chí-kvadrátom.

Nižšie je ich stručný popis.

XI2.OBR je kritická hodnota kritéria pri daná pravdepodobnosť vľavo (ako v štatistických tabuľkách)

chi2.ex.ph je kritická hodnota kritéria pre danú pravdepodobnosť vpravo. Funkcia v podstate duplikuje predchádzajúcu. Ale tu môžete okamžite uviesť úroveň α , namiesto odčítania od 1. Je to pohodlnejšie, pretože vo väčšine prípadov je potrebný pravý koniec distribúcie.

CH2.DIST– p-hodnota vľavo (hustota sa dá vypočítať).

HI2.DIST.PH– p-hodnota vpravo.

HI2.TEST– vykoná chí-kvadrát test na dvoch frekvenčných rozsahoch naraz. Počet stupňov voľnosti je o jeden menší ako počet frekvencií v stĺpci (ako by mal byť), čím sa vráti p-hodnota.

Teraz vypočítajme pre náš experiment kritickú (tabuľkovú) hodnotu pre 5 stupňov voľnosti a alfa 0,05. Vzorec Excelu bude vyzerať takto:

CH2.OBR(0,95;5)

chi2.inv.rx(0,05;5)

Výsledok bude rovnaký – 11,0705. Práve túto hodnotu vidíme v tabuľke (zaokrúhlená na 1 desatinné miesto).

Nakoniec vypočítame p-hodnotu pre 5 stupňov voľnosti kritéria χ 2= 3,4. Potrebujeme pravdepodobnosť napravo, takže vezmeme funkciu s pridaním RH (pravý chvost)

CH2.DIST.RH(3,4;5) = 0,63857

Takže pri 5 stupňoch voľnosti pravdepodobnosť získania hodnoty kritéria χ 2= 3,4 a viac sa rovná takmer 64 %. Prirodzene, hypotéza nie je zamietnutá (p-hodnota je väčšia ako 5%), frekvencie sa veľmi dobre zhodujú.

Teraz otestujme hypotézu frekvenčnej zhody pomocou chí-kvadrát testu a Excel funkcie HI2.TEST.

Žiadne tabuľky, žiadne ťažkopádne výpočty. Zadaním stĺpcov s pozorovanými a očakávanými frekvenciami ako argumentov funkcie okamžite dostaneme p-hodnotu. Krása.

Teraz si predstavte, že hráte kocky s podozrivým typom. Rozdelenie bodov od 1 do 5 zostáva rovnaké, ale hodí 26 šestiek (počet všetkých hodov je 78).

p-hodnota sa v tomto prípade ukáže ako 0,003, čo je oveľa menej ako 0,05. Existujú vážne dôvody pochybovať o správnosti kocky. Tu je návod, ako táto pravdepodobnosť vyzerá na diagrame rozdelenia chí-kvadrát.

Samotné kritérium chí-kvadrát sa tu ukazuje ako 17,8, čo je prirodzene viac ako tabuľkové kritérium (11,1).

Dúfam, že sa mi podarilo vysvetliť, čo je to kritérium vhodnosti. χ 2(chí-kvadrát) Pearson a ako sa s ním testujú štatistické hypotézy.

Na záver ešte raz o dôležitej podmienke! Chí-kvadrát test funguje správne iba vtedy, keď počet všetkých frekvencií presiahne 50 a minimálna očakávaná hodnota pre každú gradáciu nie je menšia ako 5. Ak je v niektorej kategórii očakávaná frekvencia menšia ako 5, ale súčet všetkých frekvencií presahuje 50, potom sa táto kategória skombinuje s najbližšou tak, aby ich celková frekvencia presiahla 5. Ak to nie je možné, alebo súčet frekvencií je menší ako 50, mali by sa použiť presnejšie metódy testovania hypotéz. O nich si povieme inokedy.

Nižšie je uvedený videoklip o tom, ako otestovať hypotézu pomocou testu chí-kvadrát v Exceli.