Varianta caracteristicii alternative este determinată de formulă. Studierea formei distribuției unei caracteristici. Principalele caracteristici ale modelelor de distribuție. Regula de adunare a variațiilor

6. Varianta unei caracteristici alternative

Un caz special al unei caracteristici atributive (non-cantitative) este o caracteristică alternativă. Când unitățile unei populații fie au o caracteristică dată în curs de studiu, fie nu o au. Un exemplu de astfel de semne este: prezența produselor defecte, o diplomă academică de la cadrele didactice universitare, munca în specialitatea dobândită, venitul monetar pe cap de locuitor care depășește nivelul lor național, prezența copiilor în familie etc.

Dacă este prezentă o caracteristică alternativă, unității populației i se atribuie valoarea „1”. Dacă lipsește – „0”.

Următoarele sunt utilizate ca scale în calcule:

Ponderea unităților care posedă această caracteristică;

Proporția unităților care nu au această caracteristică

Atunci valoarea medie a atributului alternativ este:

varianța va lua forma:

Varianta caracteristicii alternative variază de la 0 la 0,25. Valoarea maximă de 0,25 este atinsă la 0,5

Exemplul 4.11. Într-un sondaj prin sondaj pe 300 de locuitori din Kursk, 60 dintre ei au vorbit pozitiv despre stocarea economiilor personale în băncile comerciale din oraș

Determinați nivelul mediu, dispersia și abaterea standard a unei caracteristici

Aplicarea practică a variației într-o caracteristică alternativă constă în principal în construirea intervalelor de încredere atunci când se efectuează observații prin eșantion.

7. Studiul formei de repartizare a caracteristicii. Principalele caracteristici ale modelelor de distribuție

O condiție indispensabilă pentru succesul construcțiilor, calculelor și concluziilor bazate pe serii de variații este omogenitatea populațiilor generalizate în acestea, stabilită pe baza unei analize teoretice aprofundate.

O ordine clar definită de modificări ale frecvențelor în conformitate cu modificările valorii unei caracteristici se numește un model de distribuție.

Cunoașterea tipului de model de distribuție (și, prin urmare, a formei curbei) este necesară în primul rând:

1. Să se determine condițiile tipice pentru obținerea materialului statistic primar. Astfel, apariția unei curbe multi-vertex sau semnificativ asimetrice indică o compoziție eterogenă a populației și necesitatea regrupării datelor pentru a identifica grupuri mai omogene.

2. Să asigure corectitudinea calculelor și previziunilor practice. Astfel, utilizarea formulei lui G. Sturgess pentru calcularea numărului optim de grupuri într-o serie de intervale, regula „trei sigma”, coeficientul de variație Vσ ca indicator al omogenității populației, metoda celor mai mici pătrate la modelare. corelarea fenomenelor, metodele de analiză a varianței și altele sunt valabile numai în condiții de normalitate și distribuții apropiate acesteia.

Modelele seriilor de variație, exprimate în tipul de distribuție a frecvențelor lor, apar clar pe grafice - o histogramă și un poligon de distribuție a frecvenței. Examinarea lor arată că în histogramă există un salt mare în distribuție, iar în poligon se dezvăluie o tranziție treptată de la un grup la altul. Linia întreruptă a poligonului netezește parțial sarcina histogramei și este o metodă mai generală de analiză a distribuției.

Odată cu o creștere a liniilor seriei de variație a intervalului și o scădere corespunzătoare a mărimii intervalelor sale, numărul de laturi ale poligonului de distribuție va crește, iar linia întreruptă va avea tendința de a se transforma într-o anumită curbă în limită. Această curbă se numește curbă de distribuție. În ea, are loc cea mai mare eliberare a datelor de influența factorilor aleatori. Ea dezvăluie și arată în cea mai generală formă natura variației, modelul de distribuție a frecvenței în cadrul unui set de fenomene cu o singură calitate.

Curbele de distribuție pot fi de diferite tipuri. În practica cercetării socio-economice, curba de distribuție normală este utilizată pe scară largă. Este o figură simetrică în formă de clopot cu un singur vârf, ale cărei ramuri din dreapta și din stânga scad uniform și simetric, apropiindu-se asimptotic de axa absciselor.

O caracteristică distinctivă a acestei curbe este coincidența mediei aritmetice, a modului și a medianei. Dacă întreaga zonă dintre curbă și axa x este considerată 100%, atunci 68,3% din frecvențe sunt în limite, 95,4% sunt în limite și 99,7% sunt în limite („regula trei sigma”).

Deși o distribuție normală sau simetrică corespunde naturii unui număr de fenomene, ea nu este tipică pentru fenomenele sociale, deoarece reflectă diferențe cauzate de influențe externe care nu sunt inerente unei evoluții, ci doar unui set fluctuant de unități. . Fenomenele sociale se caracterizează prin dezvoltare și dinamism. Prin urmare, seriile și curbele de distribuție a frecvenței fenomenelor sociale sunt, de regulă, asimetrice; în ele, frecvențele cresc la maxim și scad inegal de acolo. Prezența asimetriei, sau a asimetriei, în rândurile populațiilor omogene este cea care servește ca un indiciu indirect că procesul studiat trece printr-un stadiu activ de dezvoltare.

Seriile asimetrice și curbele corespunzătoare au diverse forme de distribuții, studiate prin statistici matematice. Astfel de forme sunt distribuția Poisson, distribuția Maxwell, distribuția Pearson etc. Aici, asimetria este în general considerată ca un singur tip de distribuție. În acest caz, se face o distincție între asimetriile din dreapta și din stânga (asimetrie).

Dacă ramura lungă a curbei este situată la dreapta vârfului, atunci asimetria se numește partea dreaptă; dacă această ramură este situată la stânga vârfului, se numește partea stângă. Cu asimetrie pe partea dreaptă cu asimetrie pe partea stângă. Prin urmare, diferența dintre ele, legată de , se numește coeficient K. Pearson și este folosită ca coeficient de asimetrie:

. (20)

Cu asimetria pe partea dreaptă acest coeficient este pozitiv, cu asimetria pe partea stângă este negativ. Dacă = 0, seria de variații este simetrică. Cu cât valoarea absolută a coeficientului este mai mare, cu atât este mai mare gradul de asimetrie.

Cel mai precis indicator al asimetriei distribuției este coeficientul de asimetrie, calculat prin formula

(21)

unde n este numărul de unități de populație. Ca și în cazul coeficientului Pearson, la > 0 există o asimetrie pe partea dreaptă, la< 0 левосторонняя. В симметричных распределениях = 0.

Cu cât valoarea || este mai mare, cu atât distribuția este mai asimetrică. A fost stabilită următoarea scală de evaluare a asimetriei:

|| - asimetria este nesemnificativă;

0,25 < || - асимметрия заметная (умеренная);

|| > 0,5 - asimetria este semnificativă.

Deoarece coeficienții sunt mărimi relative adimensionale, ei sunt adesea utilizați pentru analiza comparativă a asimetriei diferitelor serii de distribuție.

Natura asimetriei indică uneori direcția de dezvoltare. Când se studiază variația caracteristicilor în raport cu care există interes pentru creșterea acestora (respectarea standardelor, producția de produs etc.), asimetria din dreapta indică progresivitatea dezvoltării, că se îndreaptă către o creștere a indicatorului, iar asimetria din partea stângă indică prezența unui număr mare de zone întârziate.

Când se studiază variațiile caracteristicilor pentru care există interes în reducerea acestora (costul, intensitatea muncii, consumul de materii prime pe unitatea de producție etc.), asimetria din dreapta indică neajunsuri în dezvoltarea procesului studiat, stânga- asimetria laterală indică progresivitatea dezvoltării sale, indicând faptul că aceasta din urmă se îndreaptă spre o scădere a indicatorului. În distribuția lucrătorilor după vechime (vezi exemplul 4,9 = 5,75) există o asimetrie pe partea dreaptă, deoarece coeficientul de asimetrie este pozitiv: (5,955-5,75): 2,47 = 0,095. Această asimetrie pentru această serie este progresivă; indică dezvoltarea seriei în direcția creșterii indicatorului studiat.

Forma distribuției poate fi determinată aproximativ prin examinarea directă a datelor empirice ale seriei, mai ales dacă acestea sunt reprezentate printr-o histogramă și poligon. Pentru a asigura corectitudinea determinării aproximative a formei distribuției, datele empirice ale seriei sunt examinate pentru apropierea lor de distribuția teoretică, stabilită prin construirea curbei de distribuție corespunzătoare. Cu toate acestea, în multe cazuri, nici teoria, nici analiza directă a datelor empirice nu oferă răspunsuri la întrebarea privind forma distribuției. Apoi, se efectuează de obicei un studiu pentru a determina apropierea datelor empirice de o distribuție normală, deoarece distribuțiile cu asimetrie ușoară sau moderată în majoritatea cazurilor sunt de tip normal.

Pentru a face o judecată obiectivă cu privire la gradul în care o distribuție empirică corespunde uneia normale, statistica folosește o serie de criterii numite criterii de bunătate sau de conformitate.

Acestea includ criteriile lui Pearson, Romanovsky, Yastremsky, Kolmogorov, bazate pe utilizarea diferitelor concepte teoretice.

De exemplu, cel mai frecvent utilizat test Pearson de bunăstare a potrivirii („chi-pătrat”) este determinat de formula:

, (22)

unde sunt frecvențele empirice (frecvențele)

Frecvențe teoretice (frecvențe)

Pentru a aprecia apropierea distribuției empirice de cea teoretică, se determină probabilitatea ca acest criteriu să atingă o valoare dată. Dacă această probabilitate depășește 0,05, atunci abaterile frecvențelor reale de la cele teoretice sunt considerate aleatorii și nesemnificative. Dacă , atunci abaterile sunt considerate semnificative, iar distribuția empirică este considerată fundamental diferită de cea teoretică.

Pentru a caracteriza gradul de abatere al unei distribuții simetrice de la normal, se calculează indicatorul de curtoză. Acesta poate fi determinat aproximativ folosind coeficientul Lindbergh.


, (23)

unde este ponderea (în%) a numărului de variante aflate în interval egală cu jumătate din abaterea standard (în ambele direcții de la valoarea medie) în numărul total de variante dintr-o serie dată;

38,29 – ponderea (în %) a numărului de variante situate într-un interval egal cu jumătate din abaterea standard (în ambele direcții de la valoarea medie) în numărul total de variante ale unei serii de distribuție normală

Kurtoza poate fi pozitivă, negativă sau zero.

Pentru curbele cu vârf înalt, indicatorul de kurtoză are semn pozitiv, în timp ce pentru curbele cu vârf scăzut are semn negativ. Pentru o curbă de distribuție normală valoarea acesteia este zero.

Pentru a caracteriza mai precis gradul de abatere a unei distribuții simetrice de la normal, indicele de vârf (indicele de curtoză) (Ek) este calculat folosind formula:

(24)

Acesta, ca și coeficientul Lindbergh, poate fi pozitiv, negativ sau egal cu zero. Indicatorul de curtoză, ca și indicatorul de asimetrie, este un număr abstract. Valoarea limită a kurtozei negative este valoarea Ek= -2; magnitudinea curtozei pozitive este infinită.

Determinarea indicatorilor de asimetrie și curtoză nu are doar o semnificație descriptivă; de multe ori valorile acestora oferă anumite instrucțiuni pentru cercetarea ulterioară a fenomenelor studiate. De exemplu, apariția unei kurtoze negative semnificative poate indica eterogenitatea calitativă a populației studiate.

Tehnologiile moderne de calcul deschid oportunități largi pentru efectuarea de operații de calcul greoaie pentru analiza seriilor de variații. Dacă materialul este teoretic semnificativ și s-a înaintat o ipoteză rezonabilă cu privire la forma distribuției (aceasta din urmă, de altfel, poate verifica și un computer), dispozitivele de calcul pot calcula rapid diverși indicatori și criterii de generalizare, pot construi grafice etc. . Acest lucru este cu atât mai posibil cu cât indicatorii de variație sunt relativ simpli și bine formalizați.


Lista literaturii folosite

1. Vinogradova N.M., Evdokimova V.T., Khitarova E.M. şi altele.Teoria generală a statisticii: Manual / Ed. IG. Venetsky / - M.: Statistică, 1968 - 380 p.

2. Gusarov Viktor Maksimovici. Statistici: manual. un manual pentru studenții care studiază economie / V.M. Gusarov, E.I. Kuznetsova.- ed. a 2-a, revizuită. si suplimentare – M.: UNITATEA-DANA, 2007.- 479 p.

3. Gusarov, Viktor Maksimovici. Teoria generală a statisticii: Manual. un manual pentru studenții care studiază economie / V.M. Gusarov, S.M. Apoc. - Ed. a II-a, revăzută. si suplimentare – M.: UNITATEA-DANA, 2008.- 207 p.

4. Ilişev Anatoli Mihailovici. Teoria generală a statisticii: un manual pentru studenții care studiază economie și management / A.M. Ilyishev, - M.: UNITI-DANA, 2008. – 535 p.

5. Riauzov N.N. Teoria generală a statisticii: Manual pentru elevi. econ. specialist. universități - ed. a IV-a. refăcut si suplimentare – M.: Finanțe și Statistică, 1984.- 343 p.

6. Salin V.N., Churilova E.Yu. Un curs de teoria statisticii pentru formarea specialiștilor în profiluri financiare și economice: Manual. – M.: Finanțe și Statistică, 2006-480s

7. Metode statistice de analiză a factorilor de creștere a eficienței producției sociale. Tutorial. Ed. Ryauzova N.N. Akinshina M.K. - M. VZFEI. anii 1980-88

8. Statistici: Manual. indemnizatie / A.V. Bagat, M.M. Konkina, V.M. Simchera și colab.; Ed. V.M. Simchers. – M.: Finanțe și Statistică, 2005.- 368s

9. Statistici. Lucrări de laborator de calculatoare: Ghid pentru munca de laborator Nr. 1 „Analiza automată a priori a unei populații statistice în mediul MS Excel”. / G.P. Kozhevnikova, A.V. Golikova, A.M. Kamanina, A.M. Bobrov. Ed. prof. G.P. Kozhevnikova - M.: Manual universitar, 2005.-72 p.

10. Teoria statisticii: Manual / Ed. prof. R.A. Shmoilova – ed. a III-a, revizuită. – M.: Finanțe și Statistică, 1999.- 560 p.


cțiuni – raportare și observare special organizată. Raportarea este o formă de observație în care întreprinderile și organizațiile transmit informații constante care le caracterizează activitățile către autoritățile statistice și superioare. Raportarea este asigurată conform unui program prestabilit într-un interval de timp strict definit și conține cei mai importanți indicatori necesari în procesul de...

În fiecare an, datorită introducerii noilor tehnologii, abordarea științifică a afacerilor crește cu ajutorul Academiei Agricole din Irkutsk. 3. Analiza economică și statistică a costului ouălor 3.1. Observația statistică Observația statistică este o colectare sistematică, organizată științific și, de regulă, sistematică de date privind fenomenele și procesele sociale...

Înlocuire în formula de dispersie q= 1 - R, primim

Abaterea pătrată medie a trăsăturii alternative

Coeficientul de variație reprezintă raportul dintre abaterea standard și media aritmetică, exprimat ca procent:: V= σ / X‾ *100

Varianta totala σ 2 măsoară variația unei trăsături în întreaga populație sub influența tuturor factorilor care au determinat această variație. Este egal cu pătratul mediu al abaterilor valorilor individuale ale atributului x față de media generală Xși poate fi calculată ca varianță simplă

Varianta intergrup δ 2 caracterizează variaţia sistematică a caracteristicii rezultate, datorită influenţei factorului-semn, care formează baza grupului. Este egal cu pătratul mediu al abaterilor mediilor de grup (particulare) X‾i de la media generală X‾:

Varianta (parțială) în cadrul grupuluiσ 2 i reflectă variația aleatorie, adică parte a variației datorată influenței factorilor necontabilizați și independent de factorul-atribut care formează baza grupului. Este egală cu abaterea pătrată medie a valorilor individuale ale caracteristicii din cadrul grupului X din media aritmetică a acestui grup X)(media grupului) și poate fi calculată ca varianță simplă sau ca varianță ponderată conform formulelor, respectiv:

Pe baza variației în interiorul grupului pentru fiecare grup, de ex. bazat σ 2 i putem determina media generală a variațiilor în interiorul grupului:

Conform regula de adăugare a variațiilor varianța totală este egală cu suma mediei variațiilor în interiorul grupului și între grupuri:

Variante în cadrul grupului arată variații ale producției în fiecare grupă cauzate de toți factorii posibili (starea tehnică a echipamentului, disponibilitatea sculelor și materialelor, vârsta lucrătorilor, intensitatea muncii etc.), cu excepția diferențelor în categoria de calificare. Media variațiilor în cadrul grupului reflectă variația producției datorată tuturor factorilor, cu excepția calificărilor lucrătorilor, dar în medie pentru întreaga populație. Varianta intergrup caracterizează variaţia mediilor de grup datorită diferenţelor dintre grupurile de lucrători pe categorii de calificare. Varianta totala reflectă influența totală a tuturor factorilor posibili asupra variației generale a producției medii orare de produse de către toți lucrătorii din atelier.

Prin urmare, este utilizat pe scară largă în analiza statistică empiric coeficient de determinare(ή 2) - un indicator care reprezintă ponderea variației intergrupurilor în variația totală a caracteristicii rezultate și care caracterizează puterea influenței caracteristicii de grupare asupra formării variației generale:

ή 2 =δ 2 / σ 2 Coeficientul empiric de determinare arată proporția de variație a caracteristicii rezultate la sub influența unui semn factor X(restul variației totale la datorită variaţiilor altor factori). În absența unei conexiuni, coeficientul empiric este egal cu 0, iar în cazul unei conexiuni funcționale, este egal cu unu. Relație de corelație empirică este rădăcina pătrată a coeficientului empiric de determinare: v

ή=√ δ 2 / σ 2 arată legătura strânsă dintre grupare și caracteristicile de performanță.

Relație de corelație empirică ή , ca ή 2, poate lua valori de la 0 la 1. Dacă nu există nicio conexiune, atunci raportul de corelație este zero, adică. toate mijloacele grupului vor fi egale între ele, nu va exista nicio variație intergrup. Aceasta înseamnă că caracteristica de grupare nu afectează în niciun fel formarea variației generale. Dacă conexiunea este funcțională, atunci raportul de corelație va fi egal cu unu. În acest caz, varianța mediilor grupului este egală cu varianța totală, adică. nu va exista nicio variație în cadrul grupului. Aceasta înseamnă că caracteristica de grupare determină în întregime variația caracteristicii rezultate care este studiată.

Cu cât valoarea raportului de corelare este mai apropiată de unu, cu atât mai apropiată, cu atât mai aproape de dependența funcțională, legătura dintre caracteristici.

Seria dinamică

Una dintre cele mai importante sarcini ale statisticii este studiul modificărilor în timp ale indicatorilor analizați, adică a acestora. dinamica. Această problemă este rezolvată cu ajutorul analizei serie de dinamică(serie temporală).

Serii dinamice (sau serii temporale) – acestea sunt valorile numerice ale unui anumit indicator statistic la momente sau perioade succesive de timp (adică, aranjate în ordine cronologică).

Se numesc valorile numerice ale unuia sau altui indicator statistic care alcătuiesc seria dinamicii niveluri de serieși este de obicei notat prin literă y. Primul termen al seriei y 1 numit initial sau nivel de bază, Și ultimul y nfinal. Momentele sau perioadele de timp la care se referă nivelurile sunt desemnate de t.

Serii dinamice sunt de obicei prezentate sub forma unui tabel sau grafic, iar o scară de timp este construită de-a lungul axei absciselor t, iar de-a lungul axei ordonatelor este scara nivelurilor seriei y.

Conceptul de variație

Media dă o caracteristică generalizantă a întregului fenomen studiat.

Variația trăsăturii se numește diferența de valori individuale ale unei caracteristici în cadrul populației studiate.

Valoarea medie este o caracteristică abstractă, generalizantă a caracteristicii populației studiate, dar nu arată structura populației.

Valoarea medie nu oferă o idee despre modul în care valorile individuale ale caracteristicii studiate sunt grupate în jurul mediei, indiferent dacă sunt concentrate aproape de aceasta sau se abate semnificativ de la aceasta.

Dacă valorile individuale ale unei caracteristici sunt apropiate de media aritmetică, atunci în acest caz media reprezintă bine întreaga populație. Si invers.

Variabilitatea valorilor individuale se caracterizează prin indicatori de variație.

Termenul „variație” provine din latinescul variatio – schimbare, fluctuație, diferență. Cu toate acestea, nu toate diferențele sunt de obicei numite variație.

Sub Variațieîn statistică înțelegem astfel de modificări cantitative ale valorii caracteristicii studiate în cadrul unei populații omogene care sunt cauzate de influența intersectată a diverșilor factori. Variația unei trăsături se distinge în valori absolute și relative. Absolut – R, L, σ, σ 2.

Indicatori de variație

1 set 2 set
n=5 80, 100, 120, 200, 300 n=8 145, 150, 155, 160, 160, 162, 168, 180

80 100 120 x 200 300

Prin urmare, în acest caz este necesar să se determine variația trăsăturii, adică. raportul valorilor individuale ale unei serii unul față de celălalt.

Indicatori de variație

1. Intervalul de variație este diferența dintre valorile maxime și minime ale unei caracteristici.

R = X max - X min

R 1 = 300-80 = 220 R 2 = 180-145 = 35

Practică: pentru o populație omogenă, pentru controlul calității produselor.

2. Indicatori care iau în considerare abaterile tuturor opțiunilor de la media aritmetică.

a) Abaterea liniară medie

b) Abaterea standard

Abaterea liniară medie reprezintă media aritmetică a valorilor absolute ale abaterilor opțiunilor individuale de la medie.

pentru negrupate:

;

pentru grupate:

Practică: este folosit pentru a analiza:

1. Componența salariaților

2. Ritmul producției

3. Aprovizionarea uniformă cu materiale

Defect: acest indicator complică calculele de tip probabil și îngreunează utilizarea metodelor de statistică matematică

Abaterea pătratică medie (standard)- Acest

pentru date negrupate

pentru date grupate

Pentru distribuții moderat denaturate

Abaterea standard, ca și deviația liniară medie, este un indicator absolut și este exprimată în aceleași unități ca media aritmetică.

Indicatorii pătrați standard sau abateri liniare medii pentru două populații se dovedesc a fi incomparabili dacă caracteristicile în sine sunt diferite pentru aceste populații. Acești indicatori nu sunt comparabili pentru diferite caracteristici ale aceleiași populații. Acestea. când mediile din ambele populații sunt exprimate în aceleași unități de măsură și sunt aceleași, comparația este posibilă și va reflecta diferențe în variația trăsăturii.

Abaterea standard este o măsură a fiabilității mediei. Cu cât σ este mai mic, cu atât media aritmetică reflectă mai bine întreaga populație reprezentată.

3. Dispersia folosit pentru a măsura variabilitatea unei trăsături. Acest indicator reflectă mai obiectiv măsura variației

pentru negrupate

pentru grupate

O trăsătură distinctivă a acestui indicator este că, la pătrare, proporția abaterilor mici scade, iar cele mari cresc în cantitatea totală a abaterilor.

Acesta este, de asemenea, un indicator absolut

Varianta are o serie de proprietăți, dintre care unele fac mai ușor de calculat:

1. Varianta unei valori constante este 0

2. Dacă toate variantele valorilor caracteristice (x) ↓ cu același număr, atunci varianța nu scade

3. Dacă toate opțiunile sunt ↓ de același număr de ori (K ori), atunci varianța este ↓ K de 2 ori

X f X"

x de 100 de ori

Varianta σ este 0,909*10000=9090

Calculul indicilor de variație pentru caracteristicile cantitative a fost discutat mai sus, dar sarcina de a estima variația poate fi stabilită semne calitative. De exemplu, atunci când se studiază calitatea produselor fabricate, acestea pot fi împărțite în bune și defecte.

În acest caz, vorbim despre caracteristici alternative.

Varianta alternativă a trăsăturilor

Semne alternative se numesc acelea pe care unele unităţi ale populaţiei le posedă iar altele nu. De exemplu, prezența experienței de muncă pentru solicitanți, o diplomă academică pentru profesorii universitari etc. Prezența unei caracteristici în unitățile populației se notează în mod convențional cu 1, iar absența cu 0. x 1 =1, x 2 =0. Proporția unităților care posedă caracteristica (în populația totală) se notează cu p, iar proporția unităților care nu o posedă cu q. Acestea. p+q=1, q=1-p.

Să calculăm valoarea medie a caracteristicii alternative

; ;

Acestea. valoarea medie a unei caracteristici alternative este egală cu proporția de unități care posedă aceste caracteristici și proporția de unități care nu posedă aceste caracteristici.

Abaterea standard este egală cu B p =

Se verifică calitatea: 1000 de produse finite, 20 defecte.

Aflați procentul de defecte: (20/1000)*100%=0,02%

Dispersia are o serie de proprietăți, care simplifică calculul.

1. Dacă scădeți un număr constant A din toate valorile, atunci abaterea standard de la aceasta nu se va modifica.

23. Varianta alternativelor. Semn

Varianta alternativă a trăsăturilor (dacă într-o populație statistică o caracteristică se modifică în așa fel încât există doar două opțiuni care se exclud reciproc, atunci o astfel de variabilitate se numește alternativă) poate fi calculată folosind formula:

Înlocuind q = 1- p în această formulă de dispersie, obținem:


Coeficientul de creștere Ki este definit ca raportul dintre un nivel dat și nivelul anterior sau de bază; arată rata relativă de modificare a seriei. Dacă rata de creștere este exprimată în procente, se numește rata de creștere.

Rata de creștere de bază

Factor de creștere a lanțului

24. Studiul tendinței principale de dezvoltare

Una dintre cele mai importante sarcini ale statisticii este de a determina în dinamică tendința generală de dezvoltare a unui fenomen. Dezvoltarea unui fenomen în timp este influențată de diverși factori. Prin urmare, atunci când analizăm dinamica, vorbim despre tendința principală, care este destul de stabilă (sustenabilă) pe tot parcursul etapei de dezvoltare studiate. Principala tendință de dezvoltare (TENDINȚA) numită schimbare lină și stabilă a nivelului unui fenomen în timp, lipsită de fluctuații aleatorii. În acest scop, seriile de timp sunt procesate folosind metodele de mărire a intervalului, medie mobilă și aliniere analitică. Cea mai simplă metodă de studiere a tendinței principale în seriile de timp este mărirea intervalelor. Această metodă se bazează pe lărgirea perioadelor de timp, care includ nivelurile seriei de dinamică (în același timp, numărul de intervale este în scădere). Se poate realiza și identificarea tendinței principale folosind metoda mediei mobile. Esența lui constă în faptul că nivelul mediu se calculează dintr-un anumit număr, de obicei impar (3, 5, 7 etc.), al primelor niveluri ale seriei, apoi din același număr de niveluri, dar începând de la al doilea, mai departe – începând de la cel din mijloc etc. Astfel, media „alunecă” de-a lungul seriei de dinamică, mișcându-se cu un termen. Dezavantajul netezirii în serie este că seria netezită este „scurtată” în comparație cu seria reală și, prin urmare, informațiile se pierd. Pentru a oferi un model cantitativ care exprimă tendința principală de modificare a nivelurilor unei serii de timp în timp, se utilizează alinierea analitică a seriei de timp. Conținut principal metoda de aliniere analiticăîn seria de timp este că tendința generală de dezvoltare este calculată în funcție de timp:, unde nivelurile seriei de timp sunt calculate folosind ecuația analitică corespunzătoare la un moment dat.

^ Alinierea unui rând de dinamică într-o linie dreaptă:
. Parametrii a 0, a 1 conform metodei celor mai mici pătrate se găsesc prin rezolvarea următorului sistem de ecuații normale:
, unde y sunt nivelurile reale (empirice) ale seriei; t– timp (numărul ordinal al unei perioade sau al momentului de timp). Calculul parametrilor este mult simplificat dacă luăm ca început de timp intervalul central (momentul) (t = 0). Astfel, sistemul ia forma
. Astfel obținem:
;
.
25.Analyt.alignment prin metoda numelui Pătrat

Metoda celor mai mici pătrate folosit pentru o evaluare cantitativă mai precisă a dinamicii fenomenului studiat. Cea mai simplă și cel mai frecvent întâlnită în practică este o relație liniară descrisă de ecuația:

Y x = a + bX, sau Y teoretic. = Y medie + vX,

unde Y x - niveluri teoretice (calculate) ale seriei pentru fiecare perioadă;
a este indicatorul mediei aritmetice a nivelului seriei, calculat prin formula:
а=ΣУ fapt. /n;
в - parametru direct, coeficient care arată diferența dintre nivelurile teoretice ale seriei pentru perioade adiacente, se determină prin calcul folosind formula: в = Σ(ХУ fact)/ΣХ 2
unde n este numărul de niveluri ale seriei dinamice;
X - puncte temporare, numere naturale, introduse de la mijlocul (centrul) seriei la ambele capete.

Dacă există un rând impar, nivelul care ocupă poziția de mijloc este luat ca 0. De exemplu, cu 9 niveluri ale rândului: -4, -3, -2, -1, 0, +1, +2, +3 , +4.

Cu un număr par de niveluri într-o serie, două valori care ocupă poziția de mijloc sunt desemnate cu -1 și +1, iar toate celelalte - cu 2 intervale. De exemplu, cu 6 niveluri de rând: -5, -3, -1, +1, +3, +5.

Calculele sunt efectuate în următoarea secvență:


  1. Ele reprezintă nivelurile reale ale seriei temporale (U f) (vezi tabelul).

  2. Nivelurile reale ale seriei sunt însumate și se obține faptul suma Y.

  3. Găsiți puncte de timp condiționate (teoretice) ale seriei X, astfel încât suma lor (ΣХ) să fie egală cu 0.

  4. Punctele de timp teoretice sunt pătrate și însumate pentru a da EX 2 .

  5. Produsul lui X și Y este calculat și însumat pentru a obține ΣXY.

  6. Calculați parametrii dreptei:
    а = ΣУ fapt / n в = Σ(Х У fapt) / ΣX 2

  7. Prin substituirea succesivă a valorilor lui X în ecuația Y x = a + aY, se găsesc nivelurile aliniate ale lui Y x.

26.Analiza fluctuațiilor sezoniere

La compararea datelor trimestriale și lunare pentru multe fenomene socio-economice, se descoperă adesea fluctuații periodice care apar sub influența anotimpurilor în schimbare. În statistică se numesc fluctuații periodice care au o perioadă determinată și constantă egală cu un interval anual variatii sezoniere sau valuri sezoniere, seria temporală se numește seria temporală sezonieră. În statistică, există metode pentru studierea și măsurarea fluctuațiilor sezoniere. Cea mai simplă este construirea unor indicatori speciali numiți indici de sezonalitate (Is). Combinația acestor indicatori reflectă valul sezonier. Indici de sezonalitate - % din raportul dintre nivelurile reale (empirice) intragrup și nivelurile teoretice (calculate), servind drept bază pentru comparație. Pentru a identifica un val sezonier stabil, acestea sunt calculate folosind date de mai mulți ani (cel puțin 3), distribuite pe luni. Pentru fiecare lună se calculează valoarea medie a nivelului ( ), atunci nivelul mediu lunar este calculat pentru întreaga serie y¯. După care se determină indicatorul valului sezonier - indicele de sezonalitate Este ca procent din media pentru fiecare lună la nivelul mediu lunar global al seriei, %. Indicele de sezonalitate mediu pe 12 luni ar trebui să fie egal cu 100%, apoi suma indicilor ar trebui să fie 1200. Când nivelul prezintă o tendință ascendentă sau descendentă, abaterile de la un nivel mediu constant pot fi distorsionate de fluctuațiile sezoniere. În acest caz, datele reale sunt comparate cu datele aliniate, adică obținute prin aliniere analitică. Formulă:
.

27.I. interpolare și extrapolare

Când se studiază dinamica pe termen lung, uneori devine necesar să se determine niveluri necunoscute într-o serie de dinamică.

Interpolarea este calculul aproximativ al nivelurilor lipsă într-o perioadă omogenă când nivelurile adiacente de ambele părți sunt cunoscute.

Extrapolarea este calculul nivelului lipsă atunci când nivelul de pe o singură parte este cunoscut. Dacă nivelul este calculat către viitor, aceasta se numește extrapolare înainte; dacă este calculat către trecut, se numește extrapolare retrospectivă.

Atât interpolarea, cât și extrapolarea trebuie efectuate în timpul perioadei de valabilitate a unui model. Se presupune că modelul de dezvoltare găsit în cadrul seriei este păstrat.

Metodele de calcul a unui nivel necunoscut depind de natura modificării fenomenului studiat. Dacă schimbările de nivel sunt netede, nivelul lipsă poate fi determinat prin jumătatea sumei a două niveluri adiacente, prin creșterea medie absolută, prin rata medie de creștere.

Menținând în același timp creșteri post-absolute ale nivelurilor lipsă ale seriei dinamice având calculat: = +

Primul nivel

Dacă se presupun rate de creștere constante, nivelul lipsă al seriei se calculează folosind formula:

Dacă se observă fluctuații ascuțite în seria de dinamică, atunci este mai bine să folosiți creșterea medie absolută sau rata medie de creștere pentru întreaga perioadă de studiu, așa cum este indicat în formule.

Indicii sunt valori relative comparative care caracterizează modificări ale indicatorilor socio-economici complecși (indicatori formați din elemente nesumabile) în timp, în spațiu, față de plan.

Un indice este rezultatul unei comparații a doi indicatori cu același nume, în calculul cărora este necesar să se facă distincția între numărătorul raportului indicelui (nivelul comparat sau de raportare) și numitorul raportului indicelui (baza nivelul cu care se face comparaţia). Alegerea bazei depinde de scopul studiului. Dacă se studiază dinamica, atunci dimensiunea indicatorului din perioada anterioară perioadei de raportare poate fi luată ca valoare de bază. Dacă este necesar să se facă o comparație teritorială, atunci datele din alt teritoriu pot fi luate ca bază. Indicatorii planificați pot fi luați ca bază pentru comparație dacă este necesar să se utilizeze indici ca indicatori ai implementării planului.

Indicii formează cei mai importanți indicatori economici ai economiei naționale și ai sectoarelor sale individuale. Indicatorii de index fac posibilă analiza performanței întreprinderilor și organizațiilor care produc o mare varietate de produse sau sunt angajate în diferite tipuri de activități. Folosind indici, puteți urmări rolul factorilor individuali în formarea celor mai importanți indicatori economici și puteți identifica principalele rezerve de producție. Indicii sunt utilizați pe scară largă în compararea indicatorilor economici internaționali atunci când se determină standardele de viață, activitatea de afaceri, politica de prețuri etc.

Există două abordări de interpretare a capacităților indicatorilor de indici: generalizante (sintetice) și analitice, care la rândul lor sunt determinate de sarcini diferite.

29.Indici de agregare

Index general reflectă schimbări în toate elementele unui fenomen complex. Dacă indicii nu acoperă toate elementele, se numesc grup sau subindici. Există indici agregați și medii, al căror calcul constituie o tehnică specială de cercetare numită metoda indicilor. Când construiți indici generali: 1. trebuie să selectați elementele care ar trebui să fie combinate într-un singur index; 2. alegeți co-măsurătorul sau greutatea potrivită, adică atribut constant.Alegerea ponderii depinde de ce atribut este indexat - cantitativ sau calitativ. Forma principală a indicilor generali este forma agregată. Indicele formei agregate este construit folosind metoda sumei. Formularul agregat este utilizat dacă avem date element cu element în perioadele de raportare și de bază . Indicele mărfurilor:
; volum fizic in-s prod
; ^ Indicele prețurilor de consum este o măsură generală a inflației. Valoarea indexată în acesta va fi prețul produsului. Atunci când se construiește un indice de preț, numărul de bunuri vândute în perioada curentă (de raportare) este de obicei luat ca ponderi ale indicelui. Un indice de preț agregat cu ponderi de raportare a fost propus pentru prima dată de Paasche și îi poartă numele: Formula indicelui prețului agregat Paasche
, Unde
- costul real al produselor (cifra de afaceri) din perioada de raportare;
- costul condiționat al mărfurilor vândute în perioada de raportare la prețuri de bază.

formula pentru indicele prețului agregat Laspeyres:

30. Aritmemul mediu. si harmon.ind., legatura cu unitatea.

Forma principală a indicilor generali este forma agregată. Indicele formei agregate este construit folosind metoda sumei. Formularul agregat este utilizat dacă avem date element cu element în perioadele de raportare și de bază . Mulți indicatori statistici care caracterizează diverse aspecte ale fenomenelor sociale sunt într-o anumită legătură între ei (adesea sub forma unui produs). Statisticile caracterizează cantitativ aceste relații. Mulți indicatori economici sunt strâns corelați și se formează sisteme de indexare. Se acceptă următoarele practica analizei factoriale: dacă indicatorul efectiv = produsul factorilor volumetrici și calitativi, atunci factorul calitativ este fixat la nivelul perioadei de bază; dacă se determină influenţa unui indicator calitativ, atunci factorul de volum este fixat la nivelul perioadei de raportare. Să luăm în considerare construcția indicilor interrelaționați folosind exemplul indicilor de preț, volumul fizic al produselor (dacă vorbim de prețuri de vânzare) sau volumul fizic al cifrei de afaceri (dacă vorbim de prețuri cu amănuntul) și indicele costului produsului ( cifra de afaceri în prețuri reale). Volumul fizic și indicii prețurilor sunt factoriali în raport cu indicele costului produsului(cifra de afaceri în prețuri reale):
, sau
. Astfel, produsul dintre indicele prețurilor și indicele volumului fizic al producției dă un indice al valorii produsului (cifra de afaceri în prețuri reale). Sistemul de index vă permite să utilizați două valori de index cunoscute pentru a găsi valoarea unei a treia necunoscute. Indicele volumului fizic al producției: ;Pe lângă metoda agregată de calculare a indicilor generali, există o altă metodă, care constă în calcularea indicilor generali ca medie a indicilor individuali corespunzători. La calculul astfel indici medii ponderate recurs atunci când informaţiile disponibile nu permit calcularea indicelui agregat. Deci, dacă cantitățile de produse individuale produse în contoare naturale sunt necunoscute, dar sunt cunoscuți indici individuali
și costul de producție al perioadei de bază ( p 0 q 0 ), putem determina indicele mediu aritmetic al volumului fizic al producției. Baza inițială pentru construcție este forma agregată. Din datele disponibile se poate obține doar numitorul acestei formule. Pentru găsirea numărătorului se folosește formula pentru indicele volumului individual de producție, din care rezultă că q 1 = q 0 i q. Înlocuind această expresie în numărătorul formei agregate, obținem indicele general al volumului fizic sub forma indicele mediu aritmetic al volumului fizic al producției , unde ponderile reprezintă costul tipurilor individuale de produse în perioada de bază ( q 0 p 0 ):
.

σ p 2 =

Înlocuirea în formula varianței q = 1 - R, primim

σ p 2 =

Prin urmare , σ p 2 = pq- varianța unei caracteristici alternative este egală cu produsul dintre proporția de unități care posedă caracteristica și proporția de unități care nu posedă această caracteristică.

Deviație standard(σ ) egală cu rădăcina pătrată a varianței. Abatere standard simplă:

σ =

ponderat

σ =

Abaterea standard este o caracteristică generală a mărimii variației unei caracteristici în agregat; arată cât de mult se abate în medie opțiunile specifice de la valoarea lor medie; este o măsură absolută a variabilității unei caracteristici și se exprimă în aceleași unități ca și variantele, de aceea este bine interpretată din punct de vedere economic.

Abaterea standard a unei caracteristici alternative

σ p =

În practica statistică, este adesea nevoie de a compara variațiile diferitelor caracteristici. De exemplu, este de mare interes să comparăm variațiile vârstei lucrătorilor și ale calificărilor acestora, vechimea în muncă și salariile, costurile și profiturile, vechimea în muncă și productivitatea muncii etc. Pentru astfel de comparații, indicatorii variabilității absolute a caracteristicilor sunt nepotriviți: este imposibil să se compare variabilitatea experienței de muncă, exprimată în ani, cu variația salariilor, exprimată în ruble.

Pentru a efectua acest tip de comparații, precum și comparații ale variabilității aceleiași caracteristici în mai multe populații cu medii aritmetice diferite, se folosesc indicatori relativi de variație

Măsuri de variație relativă sunt definite ca raportul dintre indicatorii de variație absolută și media aritmetică.

Acest coeficient de oscilație, definit ca raportul dintre intervalul de variație și media aritmetică în procente
.

Coeficient liniar de variație determinată în mod similar, dar de abaterea liniară medie
.

Cel mai comun dintre acestea este coeficientul de variație.

Coeficientul de variație reprezintă raportul dintre abaterea standard și media aritmetică, exprimat ca procent:

Indicatorii relativi de variație caracterizează gradul de fluctuație a unei caracteristici în cadrul valorii medii. Prin valoarea, de exemplu, a coeficientului de variație, se poate determina gradul de omogenitate al populației studiate. Populația este considerată suficient de omogenă dacă coeficientul de variație nu depășește 33%. Au fost stabilite limite pentru a evalua calitatea și stabilitatea valorii medii. Cele mai bune valori pentru coeficientul de variație sunt
; Valorile de până la 50% sunt considerate acceptabile.

6.3. Proprietăți de dispersie și metode simplificate de calcul a acesteia.

Tehnica de calculare a dispersiei folosind formule este destul de complexă, iar pentru valori mari de opțiuni și frecvențe poate fi greoaie. Calculul poate fi simplificat folosind proprietățile dispersiei (demonstrabile în statistica matematică):

Prima proprietate - dacă toate valorile unei caracteristici sunt reduse cu aceeași cantitate constantă A, atunci varianța nu se va schimba;

σ 2 (Ha) X 2

Al doileaproprietate- dacă toate valorile unei caracteristici sunt reduse la același număr i ori, atunci dispersia va scădea în mod corespunzător cu i 2 o singura data.

σ 2 (X/ i ) = σ X 2 : i 2

A treia proprietate (proprietatea minimalității) - abaterea medie pătrată

din orice valoare A(diferit de media aritmetică) mai mult

varianța trăsăturii pe diferența pătrată dintre media aritmetică și valoare A

σ A 2 = σ X 2 +(X- A) 2

Folosind proprietățile dispersiei, obținem următoarele formula simplificata calcularea variaţiei în serii de variaţii cu intervale egale dupa metoda momentului:

σ 2=∙ (

- momentul de ordinul doi

- pătratul momentului de ordinul întâi

Pe baza ultimei proprietăți a dispersiei, formula de dispersie simplificată pentru orice serie (discretă, interval cu intervale egale și inegale), formula de dispersie va lua forma:

6.4. Tipuri de dispersii.

Variația unei caracteristici se datorează diverșilor factori, unii dintre acești factori pot fi identificați dacă populația statistică este împărțită în grupuri în funcție de orice caracteristică. Apoi, împreună cu studierea variației unei trăsături în întreaga populație în ansamblu, devine posibil să se studieze variația pentru fiecare dintre grupurile sale constitutive, precum și între aceste grupuri. În cel mai simplu caz, când populația este împărțită în grupuri în funcție de un singur factor, studiul variației se realizează prin calculul și analiza a trei tipuri de variații: general, intergrup și intragrup.

Varianta totala σ 2 măsoară variația unei trăsături în întreaga populație sub influența tuturor factorilor care au determinat această variație. Este egală cu abaterea pătrată medie a valorilor individuale ale atributului X din media totală și poate fi calculată ca varianță simplă sau varianță ponderată.

Varianta intergrup δ 2 caracterizează variaţia sistematică a ordinii rezultante, datorită influenţei factorului-atribut care formează baza grupului. Este egală cu deviația pătrată medie a mediilor de grup (parțiale).
, din media totală

și poate fi calculată ca varianță simplă sau cum varianță ponderată conform formulelor, respectiv:

Dispersia intergrupurilor reflectă variația caracteristicii care formează baza grupării.

Varianta în cadrul grupului (privat) (în fiecare grup) σ i 2 , reflectă variația aleatorie, adică parte a variației datorată influenței factorilor necontabilizați și independent de factorul-atribut care formează baza grupului. Este egală cu abaterea pătrată medie a valorilor individuale ale caracteristicii din cadrul grupului X din media aritmetică a acestui grup , (media grupului) și poate fi calculată ca varianță simplă sau cum varianță ponderată conform formulelor, respectiv:

Pe baza variațiilor în interiorul grupului pentru fiecare grup, de ex. bazat σ i 2 poate fi determinat media variațiilor în cadrul grupului:

Conform regula de adăugare a variațiilor varianța totală este egală cu suma mediei variațiilor în interiorul grupului și între grupuri:

Folosind regula de adăugare a variațiilor, puteți determina întotdeauna a treia varianță, necunoscută, din două variații cunoscute și, de asemenea, puteți judeca puterea influenței caracteristicii de grupare.

Ponderea de variație a unei caracteristici de grupare în agregat este caracterizată de coeficientul empiric de determinare
.