Funcția de distribuție normală de probabilitate. Legea normală a distribuției probabilităților. Combinații liniare de variabile aleatoare distribuite normal

În practică, majoritatea variabile aleatoare care sunt afectate un numar mare de factori aleatori, respectă legea normală a distribuției probabilităților. Prin urmare, în diverse aplicații ale teoriei probabilităților, această lege are o importanță deosebită.

O variabilă aleatorie $X$ respectă legea distribuției normale a probabilității dacă densitatea distribuției sale de probabilitate are următoarea formă

$$f\left(x\right)=((1)\over (\sigma \sqrt(2\pi )))e^(-(((\left(x-a\right))^2)\over ( 2(\sigma )^2)))$$

Schematic, graficul funcției $f\left(x\right)$ este prezentat în figură și poartă denumirea de „curbă gaussiană”. În dreapta acestui grafic se află bancnota germană de 10 mărci, care era folosită chiar înainte de introducerea monedei euro. Dacă te uiți cu atenție, atunci pe această bancnotă poți vedea curba Gauss și descoperitorul ei, cel mai mare matematician Carl Friedrich Gauss.

Să revenim la funcția noastră de densitate $f\left(x\right)$ și să dăm câteva explicații despre parametrii de distribuție $a,\ (\sigma )^2$. Parametrul $a$ caracterizează centrul de dispersie al valorilor variabilei aleatoare, adică are semnificația așteptării matematice. Când parametrul $a$ se modifică și parametrul $(\sigma )^2$ rămâne neschimbat, putem observa deplasarea graficului funcției $f\left(x\right)$ de-a lungul axei absciselor, în timp ce densitatea graficul în sine nu își schimbă forma.

Parametrul $(\sigma )^2$ este varianța și caracterizează forma curbei de densitate $f\left(x\right)$. La modificarea parametrului $(\sigma )^2$ cu parametrul $a$ neschimbat, putem observa cum graficul densității își schimbă forma, micșorându-se sau întinzându-se, fără a se deplasa de-a lungul abscisei.

Probabilitatea ca o variabilă aleatoare distribuită normal să se încadreze într-un interval dat

După cum se știe, probabilitatea ca o variabilă aleatoare $X$ să cadă în intervalul $\left(\alpha ;\ \beta \right)$ poate fi calculată $P\left(\alpha< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Aici funcția $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ este Funcția Laplace. Valorile acestei funcții sunt preluate din . Puteți nota următoarele proprietăți funcțiile $\Phi \left(x\right)$.

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, adică funcția $\Phi \left(x\right)$ este impară.

2 . $\Phi \left(x\right)$ este o funcție crescătoare monotonă.

3 . $(\mathop(lim)_(x\to +\infty ) \Phi \left(x\right)\ )=0,5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \ stânga(x\dreapta)\ )=-0,5$.

Pentru a calcula valorile funcției $\Phi \left(x\right)$, puteți utiliza și vrăjitorul $f_x$ al pachetului Excel: $\Phi \left(x\right)=NORMDIST\left (x;0;1;1\dreapta )-0,5$. De exemplu, să calculăm valorile funcției $\Phi \left(x\right)$ pentru $x=2$.

Probabilitatea ca o variabilă aleatoare distribuită normal $X\in N\left(a;\ (\sigma )^2\right)$ să se încadreze într-un interval simetric în raport cu așteptarea $a$ poate fi calculată prin formula

$$P\left(\left|X-a\right|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Regula trei sigma. Este practic sigur că o variabilă aleatoare distribuită normal $X$ se încadrează în intervalul $\left(a-3\sigma ;a+3\sigma \right)$.

Exemplul 1 . Variabila aleatoare $X$ este supusă legii distribuției normale a probabilității cu parametrii $a=2,\ \sigma =3$. Aflați probabilitatea ca $X$ să se încadreze în intervalul $\left(0,5;1\right)$ și probabilitatea ca inegalitatea $\left|X-a\right|< 0,2$.

Folosind formula

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

găsi $P\left(0,5;1\right)=\Phi \left(((1-2)\peste (3))\right)-\Phi \left(((0,5-2)\ peste (3))\right)=\Phi \left(-0.33\right)-\Phi \left(-0.5\right)=\Phi \left(0.5\right)-\Phi \stanga(0.33\right) =0,191-0,129=0,062 USD.

$$P\left(\left|X-a\right|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

Exemplul 2 . Să presupunem că în cursul anului prețul acțiunilor unei anumite companii este o variabilă aleatorie distribuită conform legii normale cu o așteptare matematică egală cu 50 de unități monetare convenționale și o abatere standard egală cu 10. Care este probabilitatea ca pe o variantă aleasă aleatoriu ziua perioadei în discuție, prețul acțiunii va fi:

a) mai mult de 70 de unități monetare convenționale?

b) sub 50 pe acţiune?

c) între 45 și 58 de unități monetare convenționale pe acțiune?

Fie variabila aleatoare $X$ prețul acțiunilor unei companii. Prin condiție, $X$ este supus legii distribuției normale cu parametrii $a=50$ - valorea estimata, $\sigma =10$ - deviație standard. Probabilitatea $P\left(\alpha< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$a)\ P\left(X>70\right)=\Phi \left(((\infty -50)\peste (10))\right)-\Phi \left(((70-50)\ peste (10))\right)=0,5-\Phi \left(2\right)=0,5-0,4772=0,0228.$$

$$b)\ P\left(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$c)\ P\left(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Variabilele aleatoare sunt asociate cu evenimente aleatorii. Se vorbește despre evenimente aleatorii atunci când este imposibil de prezis fără ambiguitate rezultatul care poate fi obținut în anumite condiții.

Să presupunem că aruncăm o monedă obișnuită. De obicei, rezultatul acestei proceduri nu este unic sigur. Se poate spune doar cu certitudine că unul dintre cele două lucruri se va întâmpla: fie capete, fie cozi vor cădea. Oricare dintre aceste evenimente va fi aleatorie. Puteți introduce o variabilă care va descrie rezultatul eveniment aleatoriu. Evident, această variabilă va lua două valori discrete: heads and tails. Deoarece nu putem prezice cu exactitate dinainte care dintre cele două valori posibile va lua această variabilă, se poate argumenta că în acest caz avem de-a face cu variabile aleatoare.

Să presupunem acum că în experiment evaluăm timpul de reacție al subiectului la prezentarea unui stimul. De regulă, se dovedește că, chiar și atunci când experimentatorul ia toate măsurile pentru a standardiza condițiile experimentale, minimizând sau chiar eliminând posibilele variații în prezentarea stimulului, valorile măsurate ale timpului de reacție al subiectului vor diferi în continuare. În acest caz, ei spun că timpul de reacție al subiectului este descris de o variabilă aleatorie. Deoarece, în principiu, în experiment putem obține orice valoare a timpului de reacție - setul de valori posibile ale timpului de reacție care poate fi obținut în urma măsurătorilor se dovedește a fi infinit - se spune despre continuitate această variabilă aleatoare.

Apare întrebarea: există regularități în comportamentul variabilelor aleatoare? Răspunsul la această întrebare se dovedește a fi afirmativ.

Deci, dacă cheltuiți pe termen nelimitat număr mare aruncând aceeași monedă, veți descoperi că numărul de apariții pe fiecare dintre cele două fețe ale monedei va fi aproximativ același, cu excepția cazului în care, desigur, moneda este falsă și nu este îndoită. Pentru a sublinia acest model, este introdus conceptul de probabilitate a unui eveniment aleatoriu. Este clar că în cazul unei aruncări de monede, unul dintre cele două evenimente posibile va avea loc fără greșeală. Acest lucru se datorează faptului că probabilitatea totală a acestor două evenimente, altfel numită probabilitatea totală, este de 100%. Dacă presupunem că ambele evenimente asociate cu testarea monedei au loc cu probabilități egale, atunci probabilitatea fiecărui rezultat separat, evident, se dovedește a fi de 50%. Astfel, considerațiile teoretice ne permit să descriem comportamentul unei variabile aleatoare date. O astfel de descriere în statistici matematice notat prin termen „distribuția unei variabile aleatoare”.

Situația este mai complicată cu o variabilă aleatoare care nu are un set de valori bine definit, adică. se dovedește a fi continuu. Dar chiar și în acest caz, pot fi remarcate unele regularități importante ale comportamentului său. Deci, atunci când se efectuează un experiment cu măsurarea timpului de reacție al subiectului, se poate observa că diferite intervale ale duratei reacției subiectului sunt estimate cu diferite grade de probabilitate. Este probabil rar ca subiectul să reacționeze prea repede. De exemplu, în sarcinile de decizie semantică, subiecții practic nu reușesc să răspundă mai mult sau mai puțin precis la o viteză mai mică de 500 ms (1/2 s). În mod similar, este puțin probabil ca un subiect care urmează cu fidelitate instrucțiunile experimentatorului să-și întârzie mult răspunsul. În problemele de decizie semantică, de exemplu, răspunsurile estimate a fi mai mult de 5 s sunt de obicei considerate nesigure. Cu toate acestea, cu o certitudine de 100%, se poate presupune că timpul de reacție al subiectului va fi în intervalul de la 0 la + co. Dar această probabilitate este suma probabilităților fiecărei valori individuale a variabilei aleatoare. Prin urmare, distribuția unei variabile aleatoare continue poate fi descrisă ca functie continua y = f (X ).

Dacă avem de-a face cu o variabilă aleatorie discretă, când toate valorile ei posibile sunt cunoscute dinainte, ca în exemplul cu o monedă, de obicei nu este foarte dificil să construiești un model pentru distribuția acesteia. Este suficient să introducem doar câteva ipoteze rezonabile, așa cum am făcut în exemplul luat în considerare. Situația este mai complicată cu distribuția de mărimi continue care preiau un număr necunoscut de valori în avans. Desigur, dacă am dezvoltat, de exemplu, un model teoretic care descrie comportamentul unui subiect într-un experiment cu măsurarea timpului de reacție la rezolvarea unei probleme de decizie semantică, am putea încerca să descriem distribuția teoretică pe baza acestui model. valori specifice timpul de reacție al aceluiași subiect la prezentarea aceluiași stimul. Cu toate acestea, acest lucru nu este întotdeauna posibil. Prin urmare, experimentatorul poate fi forțat să presupună că distribuția variabilei aleatoare de interes pentru el este descrisă de o lege deja studiată în prealabil. Cel mai adesea, deși acest lucru poate să nu fie întotdeauna absolut corect, în aceste scopuri este folosită așa-numita distribuție normală, care acționează ca un standard pentru distribuția oricărei variabile aleatoare, indiferent de natura acesteia. Această distribuție a fost descrisă pentru prima dată matematic în prima jumătate a secolului al XVIII-lea. de Moivre.

Distributie normala apare atunci când fenomenul care ne interesează este supus influenței unui număr infinit de factori aleatori care se echilibrează între ei. Formal, distribuția normală, așa cum a arătat de Moivre, poate fi descrisă prin următoarea relație:

Unde X reprezintă o variabilă aleatorie de interes pentru noi, al cărei comportament îl studiem; R este valoarea probabilității asociată acestei variabile aleatoare; π și e - constante matematice cunoscute care descriu, respectiv, raportul circumferinței la diametru și baza logaritmului natural; μ și σ2 sunt parametrii distribuției normale a variabilei aleatoare, respectiv, așteptarea matematică și varianța variabilei aleatoare X.

Pentru a descrie distribuția normală, se dovedește a fi necesar și suficient să se definească numai parametrii μ și σ2.

Prin urmare, dacă avem o variabilă aleatoare al cărei comportament este descris de ecuația (1.1) cu valori arbitrare ale μ și σ2, atunci o putem nota ca Ν (μ, σ2) fără a ne aminti toate detaliile acestei ecuații.

Orez. 1.1.

Orice distribuție poate fi reprezentată vizual sub forma unui grafic. Grafic, distribuția normală are forma unei curbe în formă de clopot, a cărei formă exactă este determinată de parametrii distribuției, adică. așteptări și variații matematice. Parametrii distribuției normale pot lua aproape orice valoare, care sunt limitate doar de scara de măsurare utilizată de experimentator. În teorie, valoarea așteptării matematice poate fi orice număr din intervalul de numere de la -∞ la +∞, iar varianța poate fi orice număr nenegativ. Prin urmare, există un număr infinit de tipuri diferite de distribuție normală și, în consecință, un număr infinit de curbe care o reprezintă (având, totuși, o formă similară în formă de clopot). Este clar că este imposibil să le descriem pe toate. Cu toate acestea, dacă sunt cunoscuți parametrii unei anumite distribuții normale, aceasta poate fi convertită în așa-numita distribuția normală a unității, așteptarea matematică pentru care este egală cu zero, iar varianța este egală cu unu. Această distribuție normală se mai numește standard sau distribuție z. Graficul distribuției normale a unității este prezentat în fig. 1.1, de unde este evident că vârful curbei în formă de clopot a distribuției normale caracterizează valoarea așteptării matematice. Un alt parametru al distribuției normale - dispersia - caracterizează gradul de „împrăștiere” a curbei în formă de clopot față de orizontală (axa absciselor).

Definiția 1

O variabilă aleatoare $X$ are o distribuție normală (distribuție Gauss) dacă densitatea distribuției sale este determinată de formula:

\[\varphi \left(x\right)=\frac(1)(\sqrt(2\pi )\sigma )e^(\frac(-((x-a))^2)(2(\sigma )^ 2))\]

Aici $aϵR$ este așteptarea matematică, iar $\sigma >0$ este abaterea standard.

Densitatea distribuției normale.

Să arătăm că asta funcţie este într-adevăr densitatea distribuției. Pentru a face acest lucru, verificați următoarea condiție:

Considera integrală improprie$\int\limits^(+\infty )_(-\infty )(\frac(1)(\sqrt(2\pi )\sigma )e^(\frac(-((x-a))^2)( 2(\sigma )^2))dx)$.

Să facem înlocuirea: $\frac(x-a)(\sigma )=t,\ x=\sigma t+a,\ dx=\sigma dt$.

Deoarece $f\left(t\right)=e^(\frac(-t^2)(2))$ este o funcție pară, atunci

Egalitatea este valabilă, deci funcția $\varphi \left(x\right)=\frac(1)(\sqrt(2\pi )\sigma )e^(\frac(-((x-a))^2)( 2 (\sigma )^2))$ este într-adevăr densitatea de distribuție a unei variabile aleatoare.

Luați în considerare unele dintre cele mai simple proprietăți ale funcției de densitate de probabilitate a distribuției normale $\varphi \left(x\right)$:

  1. Graficul funcției de densitate de probabilitate a distribuției normale este simetric față de dreapta $x=a$.
  2. Funcția $\varphi \left(x\right)$ atinge maximul la $x=a$, în timp ce $\varphi \left(a\right)=\frac(1)(\sqrt(2\pi )\sigma ) e^(\frac(-((a-a))^2)(2(\sigma )^2))=\frac(1)(\sqrt(2\pi )\sigma )$
  3. Funcția $\varphi \left(x\right)$ scade cu $x>a$ și crește cu $x
  4. Funcția $\varphi \left(x\right)$ are puncte de inflexiune la $x=a+\sigma $ și $x=a-\sigma $.
  5. Funcția $\varphi \left(x\right)$ se apropie asimptotic de axa $Ox$ ca $x\to \pm \infty $.
  6. Graficul schematic arată ca în felul următor(Fig. 1).

figura 1 1. Graficul normal al densității distribuției

Rețineți că dacă $a=0$, atunci graficul funcției este simetric față de axa $Oy$. Prin urmare, funcția $\varphi \left(x\right)$ este pară.

Funcția de distribuție normală de probabilitate.

Pentru a găsi funcția de distribuție a probabilității pentru o distribuție normală, folosim următoarea formulă:

Prin urmare,

Definiția 2

Funcția $F(x)$ se numește distribuție normală standard dacă $a=0,\ \sigma =1$, adică:

Aici $Ф\left(x\right)=\frac(1)(\sqrt(2\pi ))\int\limits^x_0(e^(\frac(-t^2)(2))dt)$ este funcția Laplace.

Definiția 3

Funcția $Ф\left(x\right)=\frac(1)(\sqrt(2\pi ))\int\limits^x_0(e^(\frac(-t^2)(2))dt)$ se numește integrală de probabilitate.

Caracteristicile numerice ale distribuției normale.

Așteptări matematice: $M\left(X\right)=a$.

Dispersia: $D\left(X\right)=(\sigma )^2$.

Distribuția pătratică medie: $\sigma \left(X\right)=\sigma $.

Exemplul 1

Exemplu rezolvarea problemelor asupra conceptului de distribuţie normală.

Sarcina 1: Lungimea căii $X$ este aleatorie valoare continuă. $X$ este distribuit conform legii distribuției normale, a cărei valoare medie este de $4$ kilometri, iar abaterea standard este de $100$ metri.

  1. Găsiți funcția de densitate de distribuție $X$.
  2. Construiți o diagramă schematică a densității distribuției.
  3. Găsiți funcția de distribuție a variabilei aleatoare $X$.
  4. Găsiți varianța.
  1. Pentru început, să ne imaginăm toate cantitățile dintr-o singură dimensiune: 100 m = 0,1 km

Din definiția 1, obținem:

\[\varphi \left(x\right)=\frac(1)(0,1\sqrt(2\pi ))e^(\frac(-((x-4))^2)(0,02 ))\]

(deoarece $a=4\ km,\ \sigma =0,1\ km)$

  1. Folosind proprietățile funcției de densitate de distribuție, avem că graficul funcției $\varphi \left(x\right)$ este simetric față de dreapta $x=4$.

Funcția atinge maximul în punctul $\left(a,\frac(1)(\sqrt(2\pi )\sigma )\right)=(4,\ \frac(1)(0,1\sqrt( 2\pi )))$

Graficul schematic arată astfel:

Figura 2.

  1. De definirea funcției distribuții $F\left(x\right)=\frac(1)(\sqrt(2\pi )\sigma )\int\limits^x_(-\infty )(e^(\frac(-((t-a)) )^2)(2(\sigma )^2))dt)$, avem:
\
  1. $D\left(X\right)=(\sigma )^2=0,01$.