Conexiune funcțională și dependență stocastică. Dependența este stocastică. Modelul stocastic al unei opere literare

Între diversele fenomene și trăsăturile lor, este necesar în primul rând să distingem 2 tipuri de relații: funcționale (determinate rigid) și statistice (determinate stocastic).

În conformitate cu o idee rigid deterministă a funcționării sistemelor economice, necesitatea și regularitatea se manifestă fără ambiguitate în fiecare fenomen individual, adică orice acțiune determină un rezultat strict definit; influențele aleatorii (neprevăzute în prealabil) sunt neglijate. Prin urmare, pentru dat condiții inițiale starea unui astfel de sistem poate fi determinată cu o probabilitate egală cu 1. O variație a acestei regularități este o legătură funcțională.

Conexiune caracteristică la cu semn X se numește funcțional dacă fiecare valoare posibilă a unei caracteristici independente X corespunde uneia sau mai multor valori strict definite ale caracteristicii dependente la. Definiția unei relații funcționale poate fi generalizată cu ușurință în cazul multor caracteristici X 1 ,X 2 …X n .

O trăsătură caracteristică a relațiilor funcționale este că, în fiecare caz individual, este cunoscută lista completă a factorilor care determină valoarea atributului dependent (rezultat), precum și mecanismul exact al influenței acestora, exprimat printr-o anumită ecuație.

Legătura funcțională poate fi reprezentată prin ecuația:

y i = (X i ) ,

Unde y i- semn eficient ( i = 1, …, n);

f(x i ) - funcţia cunoscută a conexiunii dintre semnele efective şi factorul;

X i- semnul factorului.

În viața socială reală, din cauza incompletității informațiilor unui sistem determinat rigid, poate apărea incertitudine, din cauza căreia acest sistem prin natura sa trebuie considerat ca unul probabilist, în timp ce relația dintre trăsături devine stocastică.

Conexiune stocastică este o relație între cantități, în care una dintre ele, o variabilă aleatorie la, răspunde la o modificare a unei alte valori X sau alte valori X 1 ,X 2 …X n(aleatoriu sau non-aleatoriu) prin modificarea legii distribuției. Acest lucru se datorează faptului că variabila dependentă (trăsătura rezultată), pe lângă cele considerate independente, este supusă influenței unui număr de factori necontabiliați sau necontrolați (aleatorii), precum și unor erori inevitabile în măsurare. a variabilelor. Deoarece valorile variabilei dependente sunt supuse variațiilor aleatorii, ele nu pot fi prezise cu suficientă acuratețe, ci doar indicate cu o anumită probabilitate.

O trăsătură caracteristică a conexiunilor stocastice este că ele apar în întreaga populație, și nu în fiecare dintre unitățile acesteia. Mai mult, nu se cunoaște nici lista completă a factorilor care determină valoarea caracteristicii efective, nici mecanismul exact al funcționării și interacțiunii acestora cu caracteristica efectivă. Există întotdeauna influența hazardului. Apariția unor valori diferite ale variabilei dependente - realizarea unei variabile aleatoare.

Model de conexiune stocastică poate fi reprezentat în formă generală prin ecuația:

ŷ i = (X i ) + i ,

Unde ŷ i- valoarea calculată a caracteristicii efective;

f(x i ) - o parte a trăsăturii efective, formată sub influența trăsăturilor factori cunoscute considerate (una sau mai multe), care sunt în legătură stocastică cu trăsătura;

i- o parte din caracteristica efectivă care a apărut ca urmare a acțiunii unor factori necontrolați sau necontabiliați, precum și măsurarea caracteristicilor, care este inevitabil însoțită de unele erori aleatorii.

Manifestarea relaţiilor stocastice este supusă acţiunii legea numerelor mari: suficient numere mari unități, caracteristicile individuale vor fi netezite, șansele se vor anula reciproc, iar dependența, dacă are o forță semnificativă, se va manifesta destul de clar.

corelație există acolo unde fenomenele interconectate sunt caracterizate doar de variabile aleatorii. Cu o astfel de conexiune, valoarea medie (așteptările matematice) a variabilei aleatoare a caracteristicii efective la se modifică în mod natural în funcţie de modificarea unei alte cantităţi X sau alte variabile aleatorii X 1 ,X 2 …X n. Corelația nu apare în fiecare caz individual, ci în întreaga populație în ansamblu. Doar cu un număr suficient de mare de cazuri, fiecare valoare a unei caracteristici aleatorii X va corespunde distribuției valorilor medii ale unei caracteristici aleatorii la. Prezența corelațiilor este inerentă multor fenomene sociale.

corelație- conceptul este mai restrâns decât conexiunea stocastică. Acesta din urmă se poate reflecta nu numai într-o modificare a valorii medii, ci și în variația unui atribut în funcție de altul, adică orice altă caracteristică a variației. Astfel, conexiunea de corelație este un caz special al conexiunii stocastice.

Legături directe și inverse.În funcție de direcția de acțiune, relațiile funcționale și stocastice pot fi directe și inverse. Cu o relație directă, direcția de schimbare a atributului rezultat coincide cu direcția de schimbare a factorului-semn, adică cu o creștere a semnului factorului, semnul rezultat crește și, invers, cu o scădere a semnul factorului, semnul rezultat scade și el. În caz contrar, există feedback-uri între cantitățile considerate. De exemplu, cu cât este mai mare calificarea lucrătorului (rangul), cu atât nivelul productivității muncii este mai mare - o relație directă. Și cu cât productivitatea muncii este mai mare, cu atât costul unitar de producție este mai mic - feedback.

Legături rectilinii și curbilinii. După expresia (forma) analitică, conexiunile pot fi rectilinie și curbilinie. Cu o relație în linie dreaptă cu o creștere a valorii atributului factorului, există o creștere continuă (sau scădere) a valorilor atributului rezultat. Matematic, o astfel de relație este reprezentată de ecuația unei drepte, iar grafic, de o dreaptă. De aici numele său mai scurt - conexiune liniară. În cazul relațiilor curbilinii cu o creștere a valorii unui atribut factor, creșterea (sau scăderea) atributului efectiv are loc în mod neuniform sau direcția schimbării acestuia este inversată. Geometric, astfel de conexiuni sunt reprezentate prin linii curbe (hiperbolă, parabolă etc.).

Relații cu un singur factor și cu mai mulți factori.În funcție de numărul de factori care acționează asupra atributului efectiv, relațiile diferă: unic (un factor) și multifactor (doi sau mai mulți factori). Relațiile cu un singur factor (simple) sunt de obicei numite perechi (deoarece se ia în considerare o pereche de caracteristici). De exemplu, corelația dintre profit și productivitatea muncii. În cazul unei relații multifactoriale (multiple), ele înseamnă că toți factorii acționează într-o manieră complexă, adică simultan și în interconexiune. De exemplu, corelația dintre productivitatea muncii și nivelul de organizare a muncii, automatizarea producției, calificările lucrătorilor, experiența de muncă, timpul de nefuncționare și alte caracteristici ale factorilor. Cu ajutorul corelației multiple, este posibil să acoperim întreg complexul de caracteristici ale factorilor și să reflectăm în mod obiectiv relațiile multiple existente.


Ideea fundamentală cu care se confruntă cercetătorul proceselor și fenomenelor socio-economice este înțelegerea naturii relațiilor dintre variabilele economice. Cererea emergentă pentru un anumit produs pe piață este considerată în funcție de preț, rentabilitatea activelor depinde de gradul de risc investițional, cheltuielile consumatorilor pot fi în funcție de venit.
În procesul de analiză statistică și de prognoză a fenomenelor socio-economice, este necesară descrierea cantitativă a celor mai semnificative relații. Pentru o reflectare fiabilă a esenței și naturii fenomenelor și proceselor, ar trebui identificate relațiile cauză-efect. Cauzalitatea este caracterizată printr-o succesiune temporală de cauză și efect: cauza precede întotdeauna efectul. Cu toate acestea, pentru o înțelegere corectă, coincidențele evenimentelor care nu au o relație cauzală ar trebui excluse.
Multe fenomene socio-economice sunt rezultatul unor cauze care acţionează simultan şi cumulativ. În astfel de cazuri, cauzele principale sunt separate de cele secundare, nesemnificative.
Există două tipuri de fenomene dependențe: funcționale, sau rigid determinată, și statistică, sau stocastic determinat. La dependenta functionala fiecare valoare nu este dependent variabila x corespunde în mod unic unei valori bine definite dependent variabila y. Acest dependenta poate fi descris ca o egalitate y \u003d f (x) . Un exemplu dependențe pot exista legi ale mecanicii care sunt valabile pentru fiecare unitate individuală a populației fără abateri aleatorii.
statistic, sau dependență stocastică, se manifestă numai în fenomene de masă, cu un număr mare de unităţi agregate. La stocastică dependențele pentru valorile date nu sunt dependent variabilei x i se poate da o serie de valori y împrăștiate aleatoriu pe interval. Fiecare valoare fixă ​​a argumentului corespunde unei anumite distribuții statistice a valorilor funcției. Acest lucru se datorează faptului că dependent variabila, pe lângă variabila distinsă x, este afectată și de alți factori necontrolați sau necontabilizați, precum și de faptul că erorile de măsurare sunt suprapuse. (2, p. 12). Din moment ce valorile dependent variabilele sunt supuse răspândirii aleatoare, nu pot fi prezise cu suficientă acuratețe, ci doar indicate cu o anumită probabilitate. Valori care apar dependent variabile sunt realizări ale unei variabile aleatorii.
Unilateral dependență stocastică o variabilă aleatoare din alta sau mai multe alte variabile aleatoare este considerată ca o regresie. O funcție care exprimă un singur sens dependență stocastică, se numește funcție de regresie sau pur și simplu regresie.
Există o diferență între dependenta functionalași regresie. Pe lângă faptul că variabila x dependenta functionala^=f(x) determină complet valoarea funcției^, funcția este inversabilă, adică. există funcție inversă x = f(y). Funcția de regresie nu are această proprietate. Numai în cazul limitativ când dependență stocastică intră în dependență funcțională, Puteți trece de la o ecuație de regresie la alta.
Formalizarea tipului de ecuație de regresie este inadecvată pentru scopurile asociate cu măsurători în economie și cu analiza anumitor forme dependențeîntre variabile. Rezolvarea unor astfel de probleme devine posibilă ca urmare a introducerii în relaţiile economice stocastică membru:
Când studiezi dependențe rețineți că funcția de regresie stabilește doar formal o corespondență între variabile, în timp ce acestea nu pot fi într-o relație cauzală. În acest caz, pot apărea regresii false din cauza coincidențelor aleatoare ale variațiilor variabilelor care nu au sens semnificativ. Prin urmare, un pas obligatoriu înainte de a selecta ecuația de regresie este analiza calitativa dependențe intre nu dependent variabila x și dependent variabila y pe baza ipotezelor preliminare.

Să fie necesar să se investigheze dependența și ambele cantități sunt măsurate în aceleași experimente. În acest scop, o serie de experimente sensuri diferiteîncercând să păstreze celelalte condiţii ale experimentului neschimbate.

Măsurarea fiecărei mărimi conține erori aleatorii (erorile sistematice nu vor fi luate în considerare aici); prin urmare, aceste cantități sunt aleatorii.

Conexiunea regulată a variabilelor aleatoare se numește stocastică. Vom lua în considerare două sarcini:

a) să stabilească dacă există (cu o anumită probabilitate) dependență de sau dacă valoarea lui nu depinde de;

b) dacă există dependență, descrieți-o cantitativ.

Prima sarcină se numește analiza varianței, iar dacă se ia în considerare o funcție a mai multor variabile, atunci analiza varianței multivariate. A doua sarcină se numește analiză de regresie. Dacă erorile aleatoare sunt mari, atunci pot masca dependența dorită și nu este ușor să o identifici.

Astfel, este suficient să luăm în considerare o variabilă aleatoare în funcție de ca parametru. Așteptarea matematică a acestei valori depinde de această dependență este cea dorită și se numește legea regresiei.

Analiza dispersiei. Să efectuăm o serie mică de măsurători la fiecare valoare și să determinăm.

În prima metodă, standardele de eșantionare ale unei singure măsurători sunt calculate pentru fiecare serie separat și pentru întregul set de măsurători:

unde este numărul total de măsurători și

sunt valorile medii pentru fiecare serie și, respectiv, pentru întregul set de măsurători.

Să comparăm varianța setului de măsurători cu variațiile serii individuale. Dacă se dovedește că la nivelul de fiabilitate ales este posibil să se calculeze pentru tot i, atunci există o dependență a lui z de.

Dacă nu există un exces semnificativ, atunci dependența nu poate fi detectată (cu acuratețea dată experimentului și metoda acceptată de procesare).

Dispersiile sunt comparate prin testul lui Fisher (30). Deoarece standardul s este determinat de numărul total de dimensiuni N, care este de obicei destul de mare, este aproape întotdeauna posibil să se utilizeze coeficienții Fisher din Tabelul 25.

A doua metodă de analiză este de a compara mediile la valori diferite între ele. Valorile sunt aleatorii și independente, cu propriile standarde de eșantionare egale cu

Prin urmare, ele sunt comparate conform schemei de măsurători independente descrisă în paragraful 3. Dacă diferențele sunt semnificative, adică depășesc intervalul de încredere, atunci se stabilește faptul dependenței de; dacă diferențele dintre toate cele 2 sunt nesemnificative, atunci dependența nu este detectabilă.

Analiza multivariată are unele particularități. Este recomandabil să măsurați valoarea în nodurile unei grile dreptunghiulare pentru a face mai convenabilă investigarea dependenței de un argument, fixând celălalt argument. Este prea laborios să se efectueze o serie de măsurători la fiecare nod al unei grile multidimensionale. Este suficient să se efectueze o serie de măsurători la mai multe noduri ale grilei pentru a estima varianța unei singure măsurători; în alte noduri, se poate limita la măsurători individuale. Analiza varianței se efectuează conform primei metode.

Observație 1. Dacă există multe măsurători, atunci în ambele metode, măsurătorile individuale sau serii se pot abate destul de puternic de la propriile lor, cu o probabilitate vizibilă. așteptări matematice. Acest lucru trebuie luat în considerare atunci când alegeți o probabilitate de încredere suficient de apropiată de 1 (așa cum sa făcut în stabilirea limitelor care separă erorile aleatoare admisibile de cele brute).

Analiza de regresie. Fie ca analiza varianței să indice că există o dependență a lui z de. Cum se cuantifică?

Pentru a face acest lucru, aproximăm dependența dorită printr-o funcție.Găsim valorile optime ale parametrilor prin metoda celor mai mici pătrate, rezolvând problema

unde sunt greutățile de măsurare alese invers proporțional cu pătratul erorii de măsurare la un punct dat (adică ). Această problemă a fost tratată în Capitolul II, § 2. Aici ne oprim doar asupra acelor caracteristici care sunt cauzate de prezența unor erori aleatoare mari.

Tipul este selectat fie din considerații teoretice despre natura dependenței, fie formal, prin compararea graficului cu graficele funcțiilor cunoscute. Dacă formula este selectată din considerente teoretice și transmite corect (din punct de vedere al teoriei) asimptoticele, atunci de obicei permite nu numai aproximarea bine a setului de date experimentale, ci și extrapolarea dependenței găsite la alte intervale de valori. O funcție selectată în mod formal poate descrie în mod satisfăcător experimentul, dar este rareori potrivită pentru extrapolare.

Problema (34) este cel mai ușor de rezolvat dacă este un polinom algebric.Totuși, o astfel de alegere formală a unei funcții este rareori satisfăcătoare. De obicei, formulele bune depind de parametrii neliniar (regresie transcendentală). Cel mai convenabil este să construiți o regresie transcendentală alegând o astfel de modificare de egalizare a variabilelor, astfel încât dependența să fie aproape liniară (vezi Capitolul II, § 1, itemul 8). Atunci este ușor să o aproximezi cu un polinom algebric: .

Se caută o modificare de egalizare a variabilelor folosind considerații teoretice și ținând cont de asimptotice.În continuare, vom presupune că o astfel de modificare a fost deja făcută.

Observația 2. La trecerea la variabile noi, problema celor mai mici pătrate (34) ia forma

unde noile ponderi sunt legate de relaţiile originale

Prin urmare, chiar dacă în declarația inițială (34) toate măsurătorile au avut aceeași acuratețe, atunci ponderile pentru variabilele de egalizare nu vor fi aceleași.

Analiza corelației. Este necesar să se verifice dacă modificarea variabilelor a fost într-adevăr de nivelare, adică dacă dependența este aproape de liniară. Acest lucru se poate face prin calcularea coeficientului de corelație de pereche

Este ușor să arăți că relația este întotdeauna valabilă

Dacă dependența este strict liniară (și nu conține erori aleatoare), atunci sau în funcție de semnul pantei dreptei. Cu cât este mai mică, cu atât dependența este mai mică similară cu liniară. Prin urmare, dacă , și numărul de măsurători N este suficient de mare, atunci variabilele de egalizare sunt alese satisfăcător.

Astfel de concluzii despre natura dependenței de coeficienții de corelație se numesc analiză de corelație.

Analiza corelației nu necesită luarea unei serii de măsurători în fiecare punct. Este suficient să faceți o măsurătoare în fiecare punct, dar apoi să luați mai multe puncte pe curba studiată, ceea ce se face adesea în experimente fizice.

Observația 3. Există criterii de apropiere, care permit să se indice dacă dependența este practic liniară. Nu ne oprim asupra lor, deoarece alegerea gradului polinomului de aproximare va fi luată în considerare mai jos.

Observația 4. Relația indică absența dependență liniară dar nu înseamnă absenţa vreunei dependenţe. Deci, dacă pe segment - atunci

Gradul optim de polinom a. Să substituim în problema (35) un polinom aproximativ de grad:

Apoi, valorile optime ale parametrilor satisfac sistemul ecuatii lineare (2.43):

și este ușor să le găsești. Dar cum să alegi gradul unui polinom?

Pentru a răspunde la această întrebare, să revenim la variabilele inițiale și să calculăm varianța formulei de aproximare cu coeficienții găsiți. Estimarea imparțială a acestei variații este

Evident, pe măsură ce gradul polinomului crește, dispersia (40) va scădea: cu cât se iau mai mulți coeficienți, cu atât punctele experimentale pot fi aproximate mai precis.

Dependența empirică stocastică

Relație între variabile aleatoare se numește dependență stocastică. Se manifestă printr-o modificare a legii de distribuție a unuia dintre ele (variabilă dependentă) când celelalte (argumente) se modifică.

Dependență empiric stochastică grafic, în sistemul de coordonate variabilă dependentă – argumente, este un set de puncte distribuite aleator, care reflectă tendința generală a comportamentului variabilei dependente atunci când argumentele se schimbă.

O dependență empirică stocastică de un argument se numește dependență de pereche, dacă există mai multe argumente - o dependență multivariată. Un exemplu de dependență liniară pereche este prezentat în fig. 1.()

Orez. 1.

Spre deosebire de dependența funcțională obișnuită, în care modificările valorii unui argument (sau mai multor argumente) corespund unei modificări a unei variabile dependente deterministe, într-o dependență stocastică, există o modificare distributie statistica variabilă dependentă aleatoare, în special, așteptarea matematică.

Sarcină modelare matematică(aproximații)

Construcția unei dependențe stocastice se numește altfel modelare matematică (aproximare) sau aproximare și constă în găsirea expresiei (formula) matematică a acesteia.

O formulă (funcție) stabilită empiric, care reflectă dependența adevărată nu întotdeauna cunoscută, dar existentă în mod obiectiv și care corespunde relației de bază, stabilă, recurentă dintre obiecte, fenomene sau proprietățile acestora, este considerată ca model matematic.

Relația stabilă a lucrurilor și adevărata lor dependență. fie că este modelat sau nu, există obiectiv, are expresie matematică, și este considerată drept lege sau o consecință a acesteia.

Dacă se cunoaște o lege adecvată sau o consecință a acesteia, atunci este firesc să le considerăm ca dependența analitică dorită. De exemplu, dependența empirică a puterii curente euîn circuit de la tensiune U si rezistenta la sarcina R rezultă din legea lui Ohm:

Din păcate, adevărata dependență a variabilelor în marea majoritate a cazurilor este a priori necunoscută, deci este nevoie să o detectăm pe baza considerațiilor generale și a conceptelor teoretice, adică construirea unui model matematic al regularității luate în considerare. Acest lucru ia în considerare faptul că variabilele date și incrementele lor pe fondul fluctuațiilor aleatoare reflectă proprietățile matematice ale dependenței adevărate dorite (comportamentul tangentelor, extremelor, rădăcinilor, asimptotelor etc.)

Funcția de aproximare aleasă într-un fel sau altul netezește (medii) fluctuațiile aleatorii ale valorilor empirice inițiale ale variabilei dependente și, prin urmare, suprimând componenta aleatoare, este o aproximare a componentei obișnuite și, prin urmare, a dependenței adevărate dorite. .

Modelul matematic al dependenţei empirice are o teoretică şi valoare practică:

vă permite să stabiliți adecvarea datelor experimentale la una sau alta lege cunoscută și să identificați noi modele;

· rezolvă pentru variabila dependentă problema interpolării într-un interval dat a valorilor argumentului și previziunii (extrapolării) în afara intervalului.

Cu toate acestea, în ciuda interesului teoretic mare de a găsi o formulă matematică pentru dependența cantităților, în practică este adesea suficient doar să se determine dacă există o legătură între ele și care este puterea acesteia.

Sarcină analiza corelației

Metoda de studiu a relației dintre mărimile în schimbare este analiza corelației.

Conceptul cheie al analizei corelației care descrie relația dintre variabile este corelația (din engleză corelație - acord, legătură, relație, raport, interdependență).

Analiza corelației este utilizată pentru a detecta o dependență stocastică și pentru a evalua puterea (semnificația) acesteia după mărimea coeficienților de corelație și a raportului de corelație.

Dacă se găsește o relație între variabile, atunci se spune că există o corelație sau că variabilele sunt corelate.

Indicatorii de etanșeitate a conexiunii (coeficient de corelație, raport de corelație) modulo se modifică de la 0 (în absența unei conexiuni) la 1 (când dependența stocastică degenerează într-una funcțională).

O relație stocastică este considerată semnificativă (reala) dacă estimarea absolută a coeficientului de corelație (raportul de corelație) este semnificativă, adică depășește 2-3 deviație standard estimări de coeficienți.

Rețineți că, în unele cazuri, poate fi găsită o relație între fenomene care nu sunt în relații evidente cauză-efect.

De exemplu, pentru unii zone rurale s-a relevat o relație stocastică directă între numărul de berze cuibărătoare și copiii născuți. Numărul de primăvară al berzelor vă permite să preziceți câți copii se vor naște în acest an, dar dependența, desigur, nu dovedește credința binecunoscută și este explicată prin procese paralele:

Nașterea copiilor este de obicei precedată de formarea și amenajarea de noi familii cu achiziționarea de case rurale și ferme;

· Oportunitățile sporite de cuibărit atrag păsările și le măresc numărul.

O astfel de corelație între caracteristici se numește o corelație falsă (imaginară), deși poate fi de importanță practică.

Adesea, teoria probabilității este percepută ca o ramură a matematicii care se ocupă de „calculul probabilităților”.

Și tot acest calcul se rezumă de fapt la o formulă simplă:

« Probabilitatea oricărui eveniment este egală cu suma probabilităților evenimentelor sale elementare". În practică, această formulă repetă „vraja” cunoscută nouă din copilărie:

« Masa unui obiect este egală cu suma maselor părților sale constitutive».

Aici vom discuta despre fapte nu atât de banale din teoria probabilității. În primul rând, vom vorbi despre dependentȘi independent evenimente.

Este important să înțelegem că aceiași termeni din diferite ramuri ale matematicii pot avea semnificații complet diferite.

De exemplu, când spun că aria unui cerc S depinde de raza lui R, atunci, desigur, ne referim la dependența funcțională

Conceptele de dependență și independență au un sens complet diferit în teoria probabilității.

Să începem cu un exemplu simplu pentru a ne familiariza cu aceste concepte.

Imaginează-ți că faci un experiment de aruncare a zarurilor în această cameră, iar colegul tău din camera alăturată aruncă și el o monedă. Să te intereseze evenimentul A – pierderea unui „doi” pentru tine și evenimentul B – pierderea „cozilor” pentru colegul tău. Bunul simț dictează: aceste evenimente sunt independente!

Deși nu am introdus încă conceptul de dependență/independență, este intuitiv clar că orice definiție rezonabilă a independenței trebuie aranjată în așa fel încât aceste evenimente să fie definite ca independente.

Acum să trecem la un alt experiment. Se aruncă un zar, evenimentul A - pierderea unui „doi”, evenimentul B - pierderea unui număr impar de puncte. Presupunând că osul este simetric, putem spune imediat că P(A) = 1/6. Acum imaginați-vă că vi se spune: „Ca rezultat al experimentului, a avut loc evenimentul B, numar impar puncte.” Ce se poate spune despre probabilitatea evenimentului A? Este clar că acum această probabilitate a devenit egală cu zero.

Pentru noi, cel mai important lucru este că s-a schimbat.

Revenind la primul exemplu, putem spune: informație faptul că evenimentul B s-a întâmplat în camera alăturată nu vă va afecta ideile despre probabilitatea evenimentului A. Această probabilitate Nu se va schimba din faptul că ai aflat ceva despre evenimentul B.

Ajungem la o concluzie firească și extrem de importantă -

dacă informații despre acel evenimentÎN întâmplat modifică probabilitatea evenimentului A , apoi evenimentele A ȘiÎN ar trebui considerat dependent, iar dacă nu se schimbă, atunci independent.

Aceste considerații ar trebui să primească o formă matematică, dependența și independența evenimentelor ar trebui determinate folosind formule.

Vom pleca de la următoarea teză: „Dacă A și B sunt evenimente dependente, atunci evenimentul A conține informații despre evenimentul B, iar evenimentul B conține informații despre evenimentul A”. De unde știi dacă este inclus sau nu? Răspunsul la această întrebare este teorie informație.

Din teoria informației, avem nevoie de o singură formulă care ne permite să calculăm cantitatea de informații reciproce I(A, B) pentru evenimentele A și B

Nu vom calcula cantitatea de informații pentru diverse evenimente și nu vom discuta această formulă în detaliu.

Este important pentru noi ca daca

atunci cantitatea de informații reciproce dintre evenimentele A și B este egală cu zero - evenimentele A și B independent. Dacă

atunci cantitatea de informații reciproce este evenimentele A și B dependent.

Apelul la conceptul de informație este aici de natură auxiliară și, ni se pare, ne permite să facem mai palpabile conceptele de dependență și independență a evenimentelor.

În teoria probabilității, dependența și independența evenimentelor sunt descrise mai formal.

În primul rând, avem nevoie de concept probabilitate condițională.

Probabilitatea condiționată a evenimentului A, cu condiția ca evenimentul B să fi avut loc (P(B) ≠ 0), se numește valoarea lui P(A|B), calculată prin formula

.

Urmând spiritul abordării noastre de a înțelege dependența și independența evenimentelor, ne putem aștepta ca probabilitatea condiționată să aibă proprietatea următoare: dacă evenimentele A și B independent , Acea

Aceasta înseamnă că informația că evenimentul B a avut loc nu afectează probabilitatea evenimentului A.

Așa cum este!

Dacă evenimentele A și B sunt independente, atunci

Avem pentru evenimente independente A și B

Și