Varianta ia valori. Dispersia și abaterea standard în MS EXCEL. Așteptările matematice ale unei variabile aleatoare discrete

Așteptările matematice arată în jurul cărei măsură numerică sunt grupate valorile variabilă aleatorie. Cu toate acestea, este, de asemenea, necesar să se poată măsura variabilitatea (variabilitatea) unei variabile aleatoare în raport cu așteptarea matematică. Un astfel de indicator al variabilității este așteptarea matematică a pătratului diferenței dintre variabila aleatoare și așteptarea ei matematică, și anume M [(X - M [X]) 2].

Definiție. varianța unei variabile aleatoare x este numărul 14 DX] = M [(XM [X]) 2], (3.30)

sau DX] = ±f(x t) o(*,-M[X]) 2.

În figura 3.26 sunt prezentate formule de calcul a distribuției - probabilitate statistică fx;) - precum și indicatori: așteptare matematică M [X](celula E9) și varianța D [X] (celula G9).

14 Ne propunem să comparăm această definiție cu definiția varianței eșantionului

Orez. 3.26. Formule pentru calcularea m [x] și 0 [X] Tabelul din fig. 3.27 prezintă rezultatele calculării așteptării matematice m [x]și dispersie 0 [X] conform exemplului 3.14, precum și histograma distribuției m [x]= 4,00 (celula E9) și varianța 0 [X] = 1,00 (celula B9).

Așteptările matematice arată că valoarea variabilei aleatoare X grupate în jurul valorii de 4,00, al căror număr este de 50% din total. Cu toate acestea, alte date pot fi grupate în jurul aceleiași valori.

Orez. 3.27. Tabel și histograma distribuției cu A / [X] = 4,00 și £> [X] = 1,00

Din fig. 3.28 se poate observa că pentru așteptarea matematică [x] = 4,00, dispersia £> [X] = 2,32 este de două ori mai mare decât conform datelor din fig. 3.28. 3.27. Histograma corespunzătoare indică, de asemenea, o variabilitate semnificativă.

Orez. 3.28. Tabel și histograma distribuției cu M[X]=4,00 și £>[X]=2,32

Ne propunem să comparăm tabelele și graficele din Fig. 3.27 și 3.28 și trageți concluzii. Proprietăți dispersie variabile aleatoare care sunt utilizate constant în metodele statistice probabilistice:

o dacă X- variabilă aleatoare, a și b - unele numere, B = ax + b, Acea

D= a 2 D[X] (3,31)

(aceasta înseamnă că numărul a ca parametru de scară afectează semnificativ varianța, în timp ce numărul b - parametrul de schimbare nu afectează valoarea varianței);

o dacă X 1, X 2, X n sunt variabile aleatoare independente pe perechi (adică X t și X sunt independente pentru i Ф j), atunci varianța sumei este egală cu suma varianțelor

D = D + D + ... + D . (3,32)

Relația pentru așteptarea matematică (3.25) și dispersia (3.32) are importanţă atunci când se studiază proprietățile eșantionului, deoarece rezultatele observațiilor sau măsurătorilor eșantionului sunt considerate în statistica matematică ca realizări ale variabilelor aleatoare independente.

Un alt indicator al variabilității este strâns legat de varianța unei variabile aleatoare - abaterea standard.

Definiție. Abaterea standard a unei variabile aleatoare x este un număr integral

SD [X]= +VD[X]. (3,33)

Asa de, deviație standard legate clar de dispersie.

În teoria și practica cercetării statistice, un rol important joacă și funcțiile speciale - așa-numitele momente (inițiale și centrale), care sunt caracteristice ale variabilelor aleatoare.

Definiție. Momentul inițial de ordinul k al variabilei aleatoare X numite matematice așteptând k-th gradul acestei valori:

~ K= M. 15 (3.34)

Definiție. Momentul central de ordinul k al variabilei aleatoare X se numește așteptare gradul k abateri ale acestei valori x de la așteptările sale matematice:

m = m k, unde a = M[X].

Pentru a desemna momentele variabilelor aleatoare, folosim aceleași litere ca și pentru momentele seriei variaționale, dar cu semn suplimentar~ („tilde”).

Formule pentru calcularea momentelor discrete (care iau valorile X iar cu probabilitate p) și continuă (cu densitate de probabilitate / x)) aleatorie

valorile sunt date în tabel. 3.4.

Tabelul 3.4

Formule pentru calcularea momentelor variabilelor aleatoare

În ceea ce privește șirurile variaționale, momentele variabilelor aleatoare discrete au o semnificație similară:

Primul moment de pornire(¿= 1) variabilă aleatoare Heh a ei așteptări matematice:

~ 1 = M [X] = s. (3.36)

Al doilea moment central(¿= 2) determină varianța 0 [X] a variabilei aleatoare x:

W d(chi - a) 2 g. u \u003d TsH] \u003d (T 2. (3.37)

Al treilea moment central(¿= 3) caracterizează asimetria distribuției variabilei aleatoare x:

P

Coeficient de asimetrie iar distribuția variabilei aleatoare x are forma:

G \u003d ~ X (chi "a) 3 R și = A. (3,38)

Al patrulea moment central(¿= 4) caracterizează abruptul distribuţiei variabilei aleatoare.

Pe baza unei comparații a valorilor momentelor teoretice și ale eșantionului, sunt estimați parametrii distribuțiilor variabilelor aleatoare (a se vedea, de exemplu, secțiunile 4 și 5).

După cum sa menționat mai sus, în statistica matematică sunt utilizate două linii paralele de indicatori: prima este legată de practică (aceștia sunt indicatori eșantion), a doua se bazează pe teorie (aceștia sunt indicatori ai unui model probabilistic). Raportul dintre acești indicatori este prezentat în tabel. 3.5.

Tabelul 3.5

Corelația dintre indicatorii eșantionului empiric și modelul probabilistic

Tabelul 3.5 a continuat

Deci obiectivul Statisticile descriptive este transformarea unui set de date empirice eșantion într-un sistem de indicatori - așa-numitele statistici legate de obiecte din viața reală. Deci, psihologii, profesorii și alți specialiști lucrează în sfera reală, ale cărei obiecte sunt indivizi, grupuri de indivizi, echipe, ale căror caracteristici sunt indicatori empilici. Cu toate acestea, scopul principal al studiului este obținerea de noi cunoștințe, iar cunoștințele există într-o formă ideală sub forma caracteristicilor modelelor teoretice. Aceasta ridică problema unei tranziții corecte de la indicatorii empiric ai obiectelor reale la indicatorii unui model teoretic. Această tranziție necesită o analiză atât a abordărilor metodologice generale, cât și a fundamentelor matematice riguroase. Posibilitatea fundamentală aici este deschisă de lege numere mari, a cărei justificare teoretică a fost oferită de Jacob Bernoulli (1654-1705), Pafnuty Lvovich Cebyshev (1821-1894) și alți matematicieni ai secolului al XIX-lea.

Întrebare. Sarcină.

1. Extindeți conceptul de variabilă aleatoare.

2. Care este diferența dintre variabilele aleatoare discrete și continue?

3. Din ce elemente constă spațiul de probabilitate?

4. Cum se construiește distribuția unei variabile aleatoare discrete?

5. Cum sunt legate funcția de densitate A (x) și funcția de distribuție B (x)?

6. Oferiți o interpretare geometrică a integralei B(co) = | L(x) cx = 1.

În teoria măsurătorilor, al doilea punct central, numit dispersie rezultate observaționale sau variație aleatoare a erorilor D2.

Să găsim varianța variabilei aleatoare din exemplul anterior folosind această formulă:

Varianta unei erori aleatoare este o caracteristică a dispersării rezultatelor observațiilor în raport cu așteptarea matematică.

Dispersia are dimensiunea pătratului mărimii fizice măsurate, prin urmare, mult mai des în practica metrologică se folosesc deviație standard (RMS) a rezultatelor observațiilor, care este rădăcina pătrată a varianței: a = ^ D.X. RMS are dimensiunea mărimii fizice măsurate.

Densitatea de probabilitate a rezultatelor observațiilor pentru diferite valori ale erorii RMS are următoarea formă (Fig. 5.4).

Orez. 5.4

Cu cât o mai mare, cu atât funcția de distribuție devine mai plată și mai „fuzzie”.

Dispersia are patru proprietăți.

Proprietatea 1. Dispersia unei valori constante este zero: D(C) = 0.

Dovada. Prin definiție, varianța unei variabile aleatoare este egală cu diferența dintre abaterile pătrate ale fiecărei valori a acestei variabile și așteptările ei matematice: D(X) = M[X-M(X)]2. Apoi DC) = = M[S-M(S)]2.În conformitate cu prima proprietate a așteptării matematice (așteptarea matematică a unei valori constante este egală cu valoarea în sine), avem DC) = DOMNIȘOARĂ- C) 2 \u003d M (0) 2 \u003d 0. Acest lucru indică, de asemenea, că valoarea constantă păstrează aceeași valoare și nu are împrăștiere.

Proprietatea 2. Factorul constant poate fi scos din semnul de dispersie prin pătratul:

Dovada. Prin definiție, varianța unei variabile aleatoare D(CX) = MSH-M(SH) 2].În conformitate cu a doua proprietate a așteptărilor matematice ( factor constant poate fi scos din semnul așteptării matematice)

Proprietatea 3. Varianța sumei a două variabile aleatoare independente este egală cu suma varianțelor acestor variabile:

Dovada. Conform formulei de dispersie, avem

Deschizând parantezele și folosind proprietatea așteptare a sumei mai multor cantități și produsul a două variabile aleatoare independente, obținem

Consecința acestei proprietăți este că varianța sumei mai multor variabile aleatoare reciproc independente este egală cu suma varianțelor acestor variabile și, de asemenea, că varianța sumei unei valori constante și a unei variabile aleatoare este egală cu varianța unei variabile aleatoare, adică

Proprietatea 4. Varianța diferenței a două variabile aleatoare independente este egală cu suma varianțelor acestor variabile: D(X-Y) = D(X) + D(Y).

Dovada. Datorita celei de-a treia proprietati D(X-Y) = D(X) + D(-Y). Conform celei de-a doua proprietăți de dispersie D(-Y) = (-1) 2 D(Y) = D(Y). Prin urmare,

Pe baza acestei proprietăți abaterea standard a sumei unui număr finit de variabile aleatoare reciproc independente este rădăcină pătrată din suma abaterilor standard pătrate ale acestor mărimi:

Se știe că, conform legii distribuției, se pot găsi caracteristicile numerice ale unei variabile aleatoare. Aceasta, la rândul său, înseamnă că dacă mai multe variabile aleatoare au aceleași legi de distribuție, atunci caracteristicile lor numerice sunt aceleași.

Considera P variabile aleatoare independente X r X 2 ,..., X p, care au aceleaşi distribuţii şi, în consecinţă, aceleaşi caracteristici (aşteptare matematică, varianţă etc.). Din punct de vedere al teoriei măsurătorilor, studiul caracteristicilor numerice ale mediei aritmetice a acestor mărimi prezintă cel mai mare interes.

Indicând media aritmetică a aleatoriei considerate

cantităţi ca , stabiliți o legătură între caracteristici numerice această medie aritmetică și caracteristicile corespunzătoare ale așteptării matematice, varianței și abaterii standard ale mediei aritmetice a variabilei aleatoare.

1. Așteptarea matematică a mediei aritmetice a variabilelor aleatoare neînrudite reciproc distribuite identic este egală cu așteptarea matematică A fiecare dintre cantități:

2. Dispersia mediei aritmetice P P ori mai mică decât varianța D fiecare dintre cantități:

3. Abaterea standard a mediei aritmetice P variabile aleatoare independente distribuite egal în 4p ori mai mică decât abaterea standard a a fiecărei mărimi:

Exemplu. Abaterea standard a fiecăruia 16 variabile aleatoare reciproc independente distribuite egal este egal cu 10. Aflați abaterea standard a mediei aritmetice a* a acestor variabile.

Dispersia în statistică se găsește ca valori individuale ale caracteristicii în pătratul lui . În funcție de datele inițiale, acesta este determinat de formulele de varianță simple și ponderate:

1. (pentru date negrupate) se calculează prin formula:

2. Varianta ponderată (pentru o serie de variații):

unde n este frecvența (factor de repetabilitate X)

Un exemplu de găsire a varianței

Această pagină descrie un exemplu standard de găsire a varianței, puteți consulta și alte sarcini pentru găsirea acesteia

Exemplul 1. Avem următoarele date pentru un grup de 20 de elevi departamentul de corespondență. Este necesar să se construiască o serie de intervale a distribuției caracteristicilor, să se calculeze valoarea medie a caracteristicii și să se studieze varianța acesteia

Să construim o grupare de intervale. Să determinăm intervalul intervalului cu formula:

unde X max este valoarea maximă a caracteristicii de grupare;
X min este valoarea minimă a caracteristicii de grupare;
n este numărul de intervale:

Acceptăm n=5. Pasul este: h \u003d (192 - 159) / 5 \u003d 6,6

Să facem o grupare pe intervale

Pentru calcule suplimentare, vom construi un tabel auxiliar:

X'i este mijlocul intervalului. (de exemplu, mijlocul intervalului 159 - 165,6 = 162,3)

Creșterea medie a studenților este determinată de formula mediei ponderate aritmetice:

Determinăm dispersia prin formula:

Formula de variație poate fi convertită după cum urmează:

Din această formulă rezultă că varianţa este diferența dintre media pătratelor opțiunilor și pătratul și media.

Dispersia în serie de variații cu intervale egale conform metodei momentelor se poate calcula în felul următor folosind a doua proprietate de dispersie (împărțirea tuturor opțiunilor la valoarea intervalului). Definiţia variance, calculat prin metoda momentelor, conform următoarei formule necesită mai puțin timp:

unde i este valoarea intervalului;
A - zero condiționat, care este convenabil să se folosească mijlocul intervalului cu cea mai mare frecvență;
m1 este pătratul momentului de ordinul întâi;
m2 - momentul de ordinul doi

(daca in populaţia statistică semnul se schimbă astfel încât să existe doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată prin formula:

Înlocuind în această formulă de dispersie q = 1- p, obținem:

Tipuri de dispersie

Varianta totala măsoară variaţia unei trăsături asupra întregii populaţii în ansamblu sub influenţa tuturor factorilor care provoacă această variaţie. Este egal cu pătratul mediu al abaterilor valorilor individuale ale atributului x față de valoarea medie totală x și poate fi definită ca varianță simplă sau varianță ponderată.

caracterizează variația aleatorie, adică parte a variației, care se datorează influenței factorilor necontabiliați și nu depinde de factorul-semn care stă la baza grupării. Această varianță este egală cu pătratul mediu al abaterilor valorilor individuale ale atributului din grupul X față de media aritmetică a grupului și poate fi calculată ca varianță simplă sau ca varianță ponderată.

Prin urmare, măsuri de variație în cadrul grupului variația unei trăsături în cadrul unui grup și este determinată de formula:

unde xi - media grupului;
ni este numărul de unități din grup.

De exemplu, variațiile intra-grup care trebuie determinate în sarcina de a studia efectul calificărilor lucrătorilor asupra nivelului productivității muncii într-un magazin arată variații ale producției în fiecare grup cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea sculelor și materialelor, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor de categorie de calificare (în cadrul grupului, toți lucrătorii au aceeași calificare).

Media variațiilor în interiorul grupului reflectă aleatoriu, adică acea parte a variației care a avut loc sub influența tuturor celorlalți factori, cu excepția factorului de grupare. Se calculează prin formula:

Caracterizează variația sistematică a trăsăturii rezultate, care se datorează influenței factorului-trăsătură care stă la baza grupării. Este egal cu pătratul mediu al abaterilor mediilor grupului de la media generală. Varianta intergrup este calculată prin formula:

Regula de adunare a varianței în statistică

Conform regula de adunare a varianței varianța totală este egală cu suma mediei variațiilor intragrup și intergrup:

Sensul acestei reguli este că varianța totală care apare sub influența tuturor factorilor este egală cu suma varianțelor care apar sub influența tuturor celorlalți factori și cu varianța care apare datorită factorului de grupare.

Folosind formula pentru adăugarea variațiilor, este posibil să se determine a treia necunoscută din două varianțe cunoscute și, de asemenea, să se judece puterea influenței atributului de grupare.

Proprietăți de dispersie

1. Dacă toate valorile atributului sunt reduse (mărite) cu aceeași valoare constantă, atunci varianța nu se va schimba de la aceasta.
2. Dacă toate valorile atributului sunt reduse (mărește) de același număr de ori n, atunci varianța va scădea (crește) în consecință de n^2 ori.

Dispersia unei variabile aleatoare este o măsură a răspândirii valorilor acestei variabile. Varianta mică înseamnă că valorile sunt grupate aproape una de alta. O variație mare indică o împrăștiere puternică a valorilor. Conceptul de dispersie a unei variabile aleatoare este folosit în statistică. De exemplu, dacă comparați varianța valorilor a două cantități (cum ar fi rezultatele observațiilor pacienților de sex masculin și feminin), puteți testa semnificația unei variabile. Varianta este, de asemenea, utilizată atunci când construiești modele statistice, deoarece variația mică poate fi un semn că depășești valorile.

Pași

Calcularea variației eșantionului

    Înregistrați valorile eșantionului.În cele mai multe cazuri, doar eșantioane din anumite populații sunt disponibile pentru statisticieni. De exemplu, de regulă, statisticienii nu analizează costul menținerii populației tuturor mașinilor din Rusia - ei analizează un eșantion aleatoriu de câteva mii de mașini. Un astfel de eșantion va ajuta la determinarea costului mediu pe mașină, dar cel mai probabil, valoarea rezultată va fi departe de cea reală.

    • De exemplu, să analizăm numărul de chifle vândute într-o cafenea în 6 zile, luate în ordine aleatorie. Eșantionul are următoarea formă: 17, 15, 23, 7, 9, 13. Acesta este un eșantion, nu o populație, deoarece nu avem date despre chiflele vândute pentru fiecare zi în care cafeneaua este deschisă.
    • Dacă vi se oferă o populație și nu un eșantion de valori, treceți la secțiunea următoare.
  1. Notați formula pentru calcularea varianței eșantionului. Dispersia este o măsură a răspândirii valorilor unei anumite cantități. Cu cât valoarea dispersiei este mai aproape de zero, cu atât valorile sunt grupate mai aproape. Când lucrați cu un eșantion de valori, utilizați următoarea formulă pentru a calcula varianța:

    Calculați media mostre. Este notat cu x̅. Media eșantionului este calculată ca o medie aritmetică normală: se adună toate valorile din eșantion și apoi se împarte rezultatul la numărul de valori din eșantion.

    • În exemplul nostru, adăugați valorile din eșantion: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Acum împărțiți rezultatul la numărul de valori din eșantion (în exemplul nostru sunt 6): 84 ÷ 6 = 14.
      Media eșantionului x̅ = 14.
    • Media eșantionului este valoarea centrală în jurul căreia sunt distribuite valorile din eșantion. Dacă valorile din grupul de eșantion din jurul eșantionului sunt medii, atunci varianța este mică; în caz contrar, dispersia este mare.
  2. Scădeți media eșantionului din fiecare valoare din eșantion. Acum calculează diferența x i (\displaystyle x_(i))- x̅, unde x i (\displaystyle x_(i))- fiecare valoare din eșantion. Fiecare rezultat obținut indică măsura în care o anumită valoare se abate de la media eșantionului, adică cât de departe este această valoare de media eșantionului.

    După cum sa menționat mai sus, suma diferențelor x i (\displaystyle x_(i))- x̅ trebuie să fie egal cu zero. Aceasta înseamnă că varianța medie este întotdeauna zero, ceea ce nu dă nicio idee despre răspândirea valorilor unei cantități. Pentru a rezolva această problemă, pătrați fiecare diferență x i (\displaystyle x_(i))- X. Acest lucru va avea ca rezultat doar obținerea numere pozitive, care atunci când este adăugată nu va da niciodată 0.

    Calculați suma diferențelor pătrate. Adică, găsiți partea formulei care este scrisă astfel: ∑[( x i (\displaystyle x_(i))-X) 2 (\displaystyle ^(2))]. Aici semnul Σ înseamnă suma diferențelor pătrate pentru fiecare valoare x i (\displaystyle x_(i))în probă. Ați găsit deja diferențele la pătrat (x i (\displaystyle (x_(i)))-X) 2 (\displaystyle ^(2)) pentru fiecare valoare x i (\displaystyle x_(i))în probă; acum doar adăugați aceste pătrate.

    • În exemplul nostru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  3. Împărțiți rezultatul la n - 1, unde n este numărul de valori din eșantion. Cu ceva timp în urmă, pentru a calcula varianța eșantionului, statisticienii au împărțit pur și simplu rezultatul la n; în acest caz, veți obține media varianței pătrate, care este ideală pentru a descrie varianța unui eșantion dat. Dar amintiți-vă că orice eșantion este doar o mică parte din populația generală de valori. Dacă luați un eșantion diferit și faceți aceleași calcule, veți obține un rezultat diferit. După cum se dovedește, împărțirea la n - 1 (mai degrabă decât doar n) oferă o estimare mai bună a varianței populației, care este ceea ce căutați. Împărțirea la n - 1 a devenit obișnuită, deci este inclusă în formula de calcul a varianței eșantionului.

    Diferența dintre varianță și abaterea standard. Rețineți că formula conține un exponent, deci varianța este măsurată în unități pătrate ale valorii analizate. Uneori, o astfel de valoare este destul de dificil de utilizat; în astfel de cazuri, se utilizează abaterea standard, care este egală cu rădăcina pătrată a varianței. De aceea, varianța eșantionului se notează ca s 2 (\displaystyle s^(2)), iar abaterea standard a eșantionului ca s (\displaystyle s).

    • În exemplul nostru, abaterea standard a eșantionului este: s = √33,2 = 5,76.

    Calculul variației populației

    1. Analizați un set de valori. Setul include toate valorile cantității luate în considerare. De exemplu, dacă studiați vârsta rezidenților din regiunea Leningrad, atunci populația include vârsta tuturor locuitorilor acestei regiuni. În cazul lucrului cu un agregat, se recomandă să creați un tabel și să introduceți valorile agregatului în acesta. Luați în considerare următorul exemplu:

      Notați formula de calcul a varianței populației. Deoarece populația include toate valorile unei anumite cantități, următoarea formulă vă permite să obțineți valoarea exactă a varianței populației. Pentru a distinge varianța populației de varianța eșantionului (care este doar o estimare), statisticienii folosesc diverse variabile:

      Calculați media populației. Când se lucrează cu populația generală, valoarea medie a acesteia este notată ca μ (mu). Media populației este calculată ca medie aritmetică obișnuită: se adună toate valorile din populație și apoi se împarte rezultatul la numărul de valori din populație.

      Scădeți media populației din fiecare valoare din populație. Cu cât diferența este mai aproape de zero, cu atât mai aproape sens specific la media populaţiei. Găsiți diferența dintre fiecare valoare din populație și media acesteia și veți avea o primă privire asupra distribuției valorilor.

      Pătrați fiecare rezultat pe care îl obțineți. Valorile diferențelor vor fi atât pozitive, cât și negative; dacă puneți aceste valori pe o linie numerică, atunci ele se vor afla la dreapta și la stânga mediei populației. Acest lucru nu este potrivit pentru calcularea varianței, deoarece pozitiv și numere negative compensa reciproc. Prin urmare, pătrați fiecare diferență pentru a obține numere exclusiv pozitive.

      Aflați media rezultatelor obținute. Ați găsit cât de departe este fiecare valoare din populație de media ei. Aflați media sumei diferențelor pătrate împărțind-o la numărul de valori din populație.

    2. Potriviți această soluție cu formula. Dacă nu înțelegeți cum se leagă soluția de mai sus cu formula, mai jos este o explicație a soluției:

      • Găsim diferența dintre fiecare valoare și media populației și apoi pătratăm fiecare diferență, adică obținem ( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)), (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2))și așa mai departe până la ( x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)), Unde x n (\displaystyle x_(n)) este ultima valoare din populație.
      • Pentru a calcula valoarea medie a rezultatelor obținute, trebuie să găsiți suma lor și să o împărțiți la n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Acum să scriem explicația de mai sus folosind variabile: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n și obțineți o formulă pentru calcularea varianței populației.

Să calculăm înDOMNIȘOARĂEXCELAvarianţa şi abaterea standard a probei. De asemenea, calculăm varianța unei variabile aleatoare dacă distribuția ei este cunoscută.

Mai întâi luați în considerare dispersie, apoi deviație standard.

Varianta eșantionului

Varianta eșantionului (varianța eșantionului,probăvarianţă) caracterizează răspândirea valorilor în matrice relativ la .

Toate cele 3 formule sunt echivalente din punct de vedere matematic.

Din prima formulă se vede că varianța eșantionului este suma abaterilor pătrate ale fiecărei valori din matrice de la medieîmpărțit la dimensiunea eșantionului minus 1.

dispersie mostre se folosește funcția DISP(), ing. numele VAR, adică VARIANCE. De la MS EXCEL 2010, se recomandă utilizarea analogului său DISP.V() , ing. numele VARS, adică Varianta eșantionului. In plus, incepand de la versiunea de MS EXCEL 2010, exista o functie DISP.G (), ing. Numele VARP, adică VARIANCE populației care calculează dispersie Pentru populatia. Întreaga diferență se reduce la numitor: în loc de n-1 ca DISP.V() , DISP.G() are doar n în numitor. Înainte de MS EXCEL 2010, funcția VARP() a fost utilizată pentru a calcula varianța populației.

Varianta eșantionului
=PĂTRAT(Eșantion)/(NUMĂR (Eșantion)-1)
=(SUMSQ(Eșantion)-COUNT(Eșantion)*MEDIE(Eșantion)^2)/ (NUMĂR (Eșantion)-1)- formula uzuală
=SUMA((Eșantion -MEDIE(Eșantion))^2)/ (NUMĂR (Eșantion)-1) –

Varianta eșantionului este egal cu 0 numai dacă toate valorile sunt egale între ele și, în consecință, sunt egale Valoarea medie. De obicei, cu cât valoarea este mai mare dispersie, cu atât este mai mare răspândirea valorilor în matrice.

Varianta eșantionului este o estimare punctuala dispersie distribuția variabilei aleatoare din care probă. Despre clădire intervale de încredere la evaluare dispersie poate fi citit in articol.

Varianta unei variabile aleatoare

A calcula dispersie variabilă aleatoare, trebuie să o știți.

Pentru dispersie variabila aleatoare X folosește adesea notația Var(X). Dispersia este egal cu pătratul abaterii de la medie E(X): Var(X)=E[(X-E(X)) 2 ]

dispersie calculat prin formula:

unde x i este valoarea pe care o poate lua variabila aleatoare și μ este valoarea medie (), p(x) este probabilitatea ca variabila aleatoare să ia valoarea x.

Dacă variabila aleatoare are , atunci dispersie calculat prin formula:

Dimensiune dispersie corespunde pătratului unității de măsură a valorilor inițiale. De exemplu, dacă valorile din eșantion sunt măsurători ale greutății piesei (în kg), atunci dimensiunea varianței ar fi kg 2 . Acest lucru poate fi dificil de interpretat, prin urmare, pentru a caracteriza răspândirea valorilor, o valoare egală cu rădăcina pătrată a dispersiedeviație standard.

Unele proprietăți dispersie:

Var(X+a)=Var(X), unde X este o variabilă aleatoare și a este o constantă.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Această proprietate de dispersie este utilizată în articol despre regresia liniară.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), unde X și Y sunt variabile aleatoare, Cov(X;Y) este covarianța acestor variabile aleatoare.

Dacă variabilele aleatoare sunt independente, atunci acestea covarianta este 0 și, prin urmare, Var(X+Y)=Var(X)+Var(Y). Această proprietate a varianței este utilizată în rezultat.

Să arătăm asta pentru variabile independente Var(X-Y)=Var(X+Y). Într-adevăr, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var(X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Această proprietate a varianței este utilizată pentru a reprezenta un grafic.

Deviația standard a eșantionului

Deviația standard a eșantionului este o măsură a cât de larg sunt împrăștiate valorile din eșantion în raport cu .

A-priorie, deviație standard este egal cu rădăcina pătrată a dispersie:

Deviație standard nu ține cont de mărimea valorilor în prelevarea de probe, ci doar gradul de împrăștiere a valorilor în jurul lor mijloc. Să luăm un exemplu pentru a ilustra acest lucru.

Să calculăm abaterea standard pentru 2 eșantioane: (1; 5; 9) și (1001; 1005; 1009). În ambele cazuri, s=4. Este evident că raportul dintre abaterea standard și valorile matricei este semnificativ diferit pentru eșantioane. Pentru astfel de cazuri, utilizați Coeficientul de variație(Coeficient de variație, CV) - raport deviație standard la medie aritmetic, exprimat ca procent.

În MS EXCEL 2007 și versiuni anterioare pentru calcul Deviația standard a eșantionului se folosește funcția =STDEV(), ing. numele STDEV, adică deviație standard. Începând cu MS EXCEL 2010, se recomandă utilizarea analogului său = STDEV.B () , ing. numele STDEV.S, adică Exemplu de deviare standard.

În plus, începând de la versiunea MS EXCEL 2010, există o funcție STDEV.G () , ing. numele STDEV.P, adică Deviația standard a populației care calculează deviație standard Pentru populatia. Întreaga diferență se reduce la numitor: în loc de n-1 ca STDEV.V() , STDEV.G() are doar n în numitor.

Deviație standard poate fi calculat și direct din formulele de mai jos (vezi fișierul exemplu)
=SQRT(SQUADROTIV(Eșantion)/(COUNT(Eșantion)-1))
=SQRT((SUMSQ(Eșantion)-COUNT(Eșantion)*MEDIE(Eșantion)^2)/(NUMĂR (Eșantion)-1))

Alte măsuri de dispersie

Funcția SQUADRIVE() calculează cu umm de abateri pătrate ale valorilor de la lor mijloc. Această funcție va returna același rezultat ca și formula =VAR.G( Probă)*VERIFICA( Probă) , Unde Probă- o referință la un interval care conține o matrice de valori ale eșantionului (). Calculele în funcția QUADROTIV() se fac după formula:

Funcția SROOT() este, de asemenea, o măsură a dispersării unui set de date. Funcția SIROTL() calculează media valorilor absolute a abaterilor valorilor de la mijloc. Această funcție va returna același rezultat ca și formula =SUMPRODUS(ABS(Eșantion-MEDIE(Eșantion)))/COUNT(Eșantion), Unde Probă- o referință la un interval care conține o serie de valori ale eșantionului.

Calculele în funcția SROOTKL () se fac după formula: