Alcătuiește o serie variațională și statistică. Seria de variații. Distribuția statistică a eșantionului. Principalele caracteristici ale seriei de variații. Testul t al studentului asociat

Serii de variații: definiție, tipuri, caracteristici principale. Metoda de calcul
modă, mediană, medie aritmetică în studii medicale și statistice
(Afișați un exemplu condiționat).

O serie variațională este o serie de valori numerice ale trăsăturii studiate, care diferă unele de altele prin mărimea lor și sunt aranjate într-o anumită succesiune (în ordine crescătoare sau descrescătoare). Fiecare valoare numerică a seriei se numește variantă (V), iar numerele care arată cât de des apare cutare sau cutare variantă în componența acestei serii se numesc frecvență (p).

Numărul total de cazuri de observații, din care constă seria de variații, se notează cu litera n. Diferența de semnificație a caracteristicilor studiate se numește variație. Dacă semnul variabil nu are o măsură cantitativă, variația se numește calitativă, iar seria de distribuție se numește atributivă (de exemplu, distribuția după rezultatul bolii, starea de sănătate etc.).

Dacă un semn variabil are o expresie cantitativă, o astfel de variație se numește cantitativă, iar seria de distribuție se numește variațională.

Serii variaționale se împart în discontinue și continue - după natura trăsăturii cantitative, simple și ponderate - în funcție de frecvența de apariție a variantei.

Într-o serie variațională simplă, fiecare variantă apare o singură dată (p=1), într-una ponderată, aceeași variantă apare de mai multe ori (p>1). Exemple de astfel de serii vor fi discutate mai târziu în text. Dacă atributul cantitativ este continuu, i.e. între valori întregi există valori fracționale intermediare, seria variațională se numește continuă.

De exemplu: 10.0 - 11.9

14,0 - 15,9 etc.

Dacă semnul cantitativ este discontinuu, i.e. valorile sale individuale (opțiunile) diferă între ele printr-un număr întreg și nu au valori fracționale intermediare, seria de variații se numește discontinuă sau discretă.

Folosind datele din exemplul anterior despre ritmul cardiac

pentru 21 de elevi, vom construi o serie de variații (Tabelul 1).

tabelul 1

Distribuția studenților la medicină în funcție de frecvența pulsului (bpm)

Astfel, a construi o serie variațională înseamnă a sistematiza, eficientiza valorile numerice existente (opțiuni), adică. aranjați într-o anumită succesiune (în ordine crescătoare sau descrescătoare) cu frecvențele corespunzătoare. În exemplul luat în considerare, opțiunile sunt aranjate în ordine crescătoare și sunt exprimate ca numere întregi discontinue (discrete), fiecare opțiune apare de mai multe ori, i.e. avem de-a face cu o serie variațională ponderată, discontinuă sau discretă.

De regulă, dacă numărul de observații din populaţia statistică nu depășește 30, atunci este suficient să plasați toate valorile trăsăturii studiate într-o serie variațională în ordine crescătoare, ca în tabel. 1, sau în ordine descrescătoare.

La în număr mare observații (n>30), numărul de variante care apar poate fi foarte mare, în acest caz se alcătuiește un interval sau o serie variațională grupată, în care, pentru a simplifica prelucrarea ulterioară și a clarifica natura distribuției, variantele sunt combinate în grupuri. .

De obicei, numărul de opțiuni de grup variază de la 8 la 15.

Trebuie să fie cel puțin 5, pentru că. în caz contrar, va fi o mărire prea aspră, excesivă, care distorsionează imaginea generală a variației și afectează foarte mult acuratețea valorilor medii. Când numărul de opțiuni de grup este mai mare de 20-25, acuratețea calculării valorilor medii crește, dar caracteristicile variației atributului sunt distorsionate semnificativ, iar procesarea matematică devine mai complicată.

La compilarea unei serii grupate, este necesar să se țină cont

− grupurile de variante trebuie plasate într-o anumită ordine (crescător sau descrescător);

- intervalele din grupele de variante sa fie aceleasi;

− valorile limitelor intervalelor nu trebuie să coincidă, deoarece nu va fi clar în ce grupuri să atribuie opțiuni individuale;

- este necesar să se țină cont de caracteristicile calitative ale materialului colectat la stabilirea limitelor intervalelor (de exemplu, la studierea greutății adulților, este acceptabil un interval de 3-4 kg, iar pentru copii în primele luni de viață nu trebuie să depășească 100 g.)

Să construim o serie grupată (interval) care caracterizează datele privind frecvența pulsului (numărul de bătăi pe minut) pentru 55 de studenți la medicină înainte de examen: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Pentru a construi o serie grupată, aveți nevoie de:

1. Determinați valoarea intervalului;

2. Determinați mijlocul, începutul și sfârșitul grupurilor de opțiuni serie de variații.

● Valoarea intervalului (i) este determinată de numărul de grupuri așteptate (r), al căror număr este stabilit în funcție de numărul de observații (n) conform unui tabel special

Numărul de grupuri în funcție de numărul de observații:

În cazul nostru, pentru 55 de elevi, este posibil să se alcătuiască de la 8 până la 10 grupe.

Valoarea intervalului (i) este determinată de următoarea formulă -

i = Vmax-Vmin/r

În exemplul nostru, valoarea intervalului este 82-58/8= 3.

Dacă valoarea intervalului este un număr fracționar, rezultatul trebuie rotunjit la un număr întreg.

Există mai multe tipuri de medii:

medie aritmetică,

● medie geometrică,

● medie armonică,

● rădăcină medie pătrată,

● mediu progresiv,

● mediană

În statistica medicală, mediile aritmetice sunt cel mai des folosite.

Media aritmetică (M) este o valoare generalizantă care determină valoarea tipică care este caracteristică întregii populații. Principalele metode de calcul a lui M sunt: ​​metoda mediei aritmetice și metoda momentelor (abaterile condiționate).

Metoda mediei aritmetice este utilizată pentru a calcula media aritmetică simplă și media aritmetică ponderată. Alegerea metodei de calcul a valorii medii aritmetice depinde de tipul seriei de variații. În cazul unei serii variaționale simple, în care fiecare variantă apare o singură dată, media aritmetică simplă este determinată de formula:

unde: М – valoarea medie aritmetică;

V este valoarea caracteristicii variabilei (opțiuni);

Σ - indică acţiunea - însumare;

n- numărul total observatii.

Un exemplu de calcul al mediei aritmetice este simplu. Frecvența respiratorie (numărul de respirații pe minut) la 9 bărbați cu vârsta de 35 de ani: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Pentru a determina nivelul mediu al frecvenței respiratorii la bărbații în vârstă de 35 de ani, este necesar:

1. Construiți o serie variațională, plasând toate opțiunile în ordine crescătoare sau descrescătoare. Am obținut o serie variațională simplă, deoarece valorile variantei apar o singură dată.

M = ∑V/n = 171/9 = 19 respirații pe minut

Concluzie. Frecvența respiratorie la bărbații în vârstă de 35 de ani este în medie de 19 respirații pe minut.

Dacă valorile individuale ale unei variante sunt repetate, nu este nevoie să scrieți fiecare variantă într-o linie; este suficient să enumerați dimensiunile variantei care apar (V) și apoi să indicați numărul repetărilor lor (p ). o astfel de serie variațională, în care opțiunile sunt, parcă, ponderate în funcție de numărul de frecvențe care le corespund, se numește serie variațională ponderată, iar valoarea medie calculată este media ponderată aritmetică.

Media ponderată aritmetică este determinată de formula: M= ∑Vp/n

unde n este numărul de observații egal cu suma frecvențelor - Σр.

Un exemplu de calcul a mediei ponderate aritmetice.

Durata invalidității (în zile) la 35 de pacienți cu afecțiuni respiratorii acute (IRA) tratați de un medic local în primul trimestru al anului curent a fost: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 zile .

Metodologia de determinare a duratei medii a invalidității la pacienții cu infecții respiratorii acute este următoarea:

1. Să construim o serie variațională ponderată, deoarece valorile variantelor individuale se repetă de mai multe ori. Pentru a face acest lucru, puteți aranja toate opțiunile în ordine crescătoare sau descrescătoare cu frecvențele corespunzătoare.

În cazul nostru, opțiunile sunt în ordine crescătoare.

2. Calculați media ponderată aritmetică folosind formula: M = ∑Vp/n = 233/35 = 6,7 zile

Distribuția pacienților cu infecții respiratorii acute în funcție de durata dizabilității:

Durata incapacității de muncă (V) Număr de pacienți (p) vp
∑p = n = 35 ∑Vp = 233

Concluzie. Durata dizabilității la pacienții cu boli respiratorii acute a fost în medie de 6,7 zile.

Modul (Mo) este cea mai comună variantă din seria de variații. Pentru distribuția prezentată în tabel, modul corespunde variantei egale cu 10, apare mai des decât altele - de 6 ori.

Distribuția pacienților după durata șederii într-un pat de spital (în zile)

V
p

Uneori este dificil să se determine valoarea exactă a modului, deoarece pot exista mai multe observații în datele studiate care apar „cel mai des”.

Mediana (Me) este un indicator neparametric care împarte seria de variații în două jumătăți egale: același număr de opțiuni este situat de ambele părți ale medianei.

De exemplu, pentru distribuția prezentată în tabel, mediana este 10 deoarece pe ambele părți ale acestei valori se află pe a 14-a opțiune, adică numărul 10 ocupă o poziție centrală în această serie și este mediana acestuia.

Având în vedere că numărul de observații din acest exemplu este par (n=34), mediana poate fi determinată după cum urmează:

Eu = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Aceasta înseamnă că mijlocul seriei cade pe a șaptesprezecea opțiune, care corespunde unei mediane de 10. Pentru distribuția prezentată în tabel, media aritmetică este:

M = ∑Vp/n = 334/34 = 10,1

Deci, pentru 34 de observații din tabel. 8, avem: Mo=10, Me=10, media aritmetică (M) este 10,1. În exemplul nostru, toți cei trei indicatori s-au dovedit a fi egali sau apropiați unul de celălalt, deși sunt complet diferiți.

Media aritmetică este suma rezultată a tuturor influențelor; la formarea ei iau parte toate variantele, fără excepție, inclusiv cele extreme, adesea atipice pentru un anumit fenomen sau mulțime.

Modul și mediana, spre deosebire de media aritmetică, nu depind de valoarea tuturor valorilor individuale ale atributului variabil (valorile variantelor extreme și gradul de împrăștiere al seriei). Media aritmetică caracterizează întreaga masă de observații, modul și mediana caracterizează volumul

Metoda de grupare vă permite, de asemenea, să măsurați variație(variabilitate, fluctuație) semnelor. Cu un număr relativ mic de unități de populație, variația se măsoară pe baza unei serii ordonate de unități care alcătuiesc populația. Rândul este numit clasat dacă unitățile sunt aranjate în caracteristică ascendentă (descrescătoare).

Cu toate acestea, seriile clasate sunt mai degrabă orientative atunci când este necesar Caracteristici comparative variatii. În plus, în multe cazuri se are de-a face cu agregate statistice formate dintr-un număr mare de unități, care sunt practic greu de reprezentat sub forma unei serii specifice. În acest sens, pentru familiarizarea generală inițială cu datele statistice și mai ales pentru a facilita studiul variației semnelor, fenomenele și procesele studiate sunt de obicei combinate în grupuri, iar rezultatele grupării sunt întocmite sub formă de tabele de grup. .

Dacă în tabelul de grupuri sunt doar două coloane - grupuri în funcție de caracteristica selectată (opțiuni) și numărul de grupuri (frecvențe sau frecvențe), se numește aproape de distribuție.

Interval de distribuție - cel mai simplu tip de grupare structurală în funcție de un atribut, afișat într-un tabel de grup cu două coloane care conțin variante și frecvențe ale atributului. În multe cazuri, cu o astfel de grupare structurală, i.e. odata cu alcatuirea seriilor de distributie incepe studiul materialului statistic initial.

Gruparea structurală sub forma unei serii de distribuție poate fi transformată într-o adevărată grupare structurală dacă grupurile selectate sunt caracterizate nu numai prin frecvențe, ci și prin alți indicatori statistici. Scopul principal al seriei de distribuție este de a studia variația caracteristicilor. Teoria distribuției seriilor este dezvoltată în detaliu prin statistici matematice.

Serii de distribuție sunt împărțite în atributiv(gruparea după caracteristici atributive, de exemplu, împărțirea populației pe sex, naționalitate, stare civilă etc.) și variațională(gruparea după caracteristici cantitative).

Seria de variații este un tabel de grup care conține două coloane: o grupare de unități în funcție de un atribut cantitativ și numărul de unități din fiecare grup. Intervalele din seria de variații sunt de obicei formate egale și închise. Seria de variații este următoarea grupare a populației ruse în termeni de venit mediu în numerar pe cap de locuitor (Tabelul 3.10).

Tabelul 3.10

Distribuția populației Rusiei în funcție de venitul mediu pe cap de locuitor în perioada 2004-2009

Grupuri de populație după venitul mediu pe cap de locuitor, rub./lună

Populația din grup, în % din total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Peste 25.000,0

Toată populația

Serii variaționale, la rândul lor, sunt împărțite în discrete și interval. Discret serii de variații combină variante de caracteristici discrete care variază în limite înguste. Un exemplu de serie de variații discrete este distribuția familiilor rusești în funcție de numărul de copii pe care îi au.

Interval seria variațională combină variante fie ale caracteristicilor continue, fie ale caracteristicilor discrete care se schimbă într-o gamă largă. Seria de intervale este seria variațională a distribuției populației ruse în ceea ce privește venitul în numerar mediu pe cap de locuitor.

Serii variaționale discrete nu sunt folosite foarte des în practică. Între timp, compilarea lor nu este dificilă, întrucât componența grupurilor este determinată de variantele specifice pe care le posedă de fapt caracteristicile grupării studiate.

Serii variaționale de intervale sunt mai răspândite. La compilarea lor, se pune problema dificilă a numărului de grupuri, precum și a mărimii intervalelor care ar trebui stabilite.

Principiile pentru rezolvarea acestei probleme sunt expuse în capitolul privind metodologia de construire a grupărilor statistice (vezi paragraful 3.3).

Seriile de variații sunt un mijloc de colaps sau comprimare a diverselor informații într-o formă compactă; ele pot fi folosite pentru a face o judecată destul de clară asupra naturii variației, pentru a studia diferențele de semne ale fenomenelor incluse în setul studiat. Dar esenţial seria de variații este aceea că pe baza lor se calculează caracteristici generalizate speciale ale variației (vezi capitolul 7).

Un exemplu de rezolvare a unui test de statistică matematică

Sarcina 1

Datele inițiale : elevii unui anumit grup format din 30 de persoane au promovat examenul la cursul „Informatică”. Notele primite de elevi formează următoarea serie de numere:

I. Compune o serie variațională

m X

w X

m X nak

w X nak

Total:

II. Reprezentarea grafică a informațiilor statistice.

III. Caracteristicile numerice ale probei.

1. Media aritmetică

2. Media geometrică

3. Moda

4. Mediană

222222333333333 | 3 34444444445555

5. Varianta eșantionului

7. Coeficientul de variație

8. Asimetrie

9. Coeficient de asimetrie

10. Kurtoză

11. Coeficientul de kurtoză

Sarcina 2

Datele inițiale : elevii unui anumit grup au scris un test final. Grupul este format din 30 de persoane. Scorurile obținute de elevi formează următoarea serie de numere

Soluţie

I. Deoarece semnul ia multe valori diferite, vom construi o serie de variații de interval pentru el. Pentru a face acest lucru, setăm mai întâi valoarea intervalului h. Să folosim formula Sturger

Să facem o scară de intervale. În acest caz, pentru limita superioară a primului interval vom lua valoarea determinată de formula:

Limitele superioare ale intervalelor ulterioare sunt determinate de următoarea formulă recursivă:

, Apoi

Terminăm de construit scara intervalelor, deoarece limita superioară a următorului interval a devenit mai mare sau egală cu valoarea maximă a eșantionului
.

II. Afișare grafică a seriei de variații de interval

III. Caracteristicile numerice ale probei

Pentru a determina caracteristicile numerice ale eșantionului, vom compila un tabel auxiliar

Sumă:

1. Media aritmetică

2. Media geometrică

3. Moda

4. Mediană

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Varianta eșantionului

6. Eșantion de abatere standard

7. Coeficientul de variație

8. Asimetrie

9. Coeficient de asimetrie

10. Kurtoză

11. Coeficientul de kurtoză

Sarcina 3

Condiție : valoarea diviziunii scalei ampermetrului este 0,1 A. Citirile sunt rotunjite la cea mai apropiata diviziune intreaga. Găsiți probabilitatea ca o eroare mai mare de 0,02 A să fie făcută în timpul citirii.

Soluţie.

Eroarea de rotunjire poate fi considerată o variabilă aleatorie X, care este distribuit uniform în intervalul dintre două diviziuni întregi adiacente. Densitatea distribuției uniforme

,

Unde
- lungimea intervalului care contine valorile posibile X; în afara acestui interval
În această problemă, lungimea intervalului care conține valorile posibile X, este egal cu 0,1, deci

Eroarea de citire va depăși 0,02 dacă este inclusă în intervalul (0,02; 0,08). Apoi

Răspuns: R=0,6

Sarcina 4

Date inițiale: așteptarea matematică și abaterea standard a unei caracteristici distribuite normal X sunt 10 și, respectiv, 2. Aflați probabilitatea ca în urma testului X va lua valoarea cuprinsă în intervalul (12, 14).

Soluţie.

Să folosim formula

Și frecvențele teoretice

Soluţie

Pentru X, așteptările sale matematice M(X) și varianța D(X). Soluţie. Găsiți funcția de distribuție F(x) variabilă aleatorie... Eroare de eșantionare). Hai să compunem variațională rând Lățimea intervalului va fi: Pentru fiecare valoare rând Să calculăm câte...

  • Rezolvare: ecuație separabilă

    Soluţie

    În formularul Pentru a găsi un privat solutii ecuație neomogenă Compune sistem Să rezolvăm sistemul rezultat... ; +47; +61; +10; -8. Construiți interval variațională rând. Dați estimări statistice ale mediei...

  • Soluție: Să calculăm ratele de creștere absolute în lanț și de bază, ratele de creștere, ratele de creștere. Valorile obținute sunt rezumate în tabelul 1

    Soluţie

    Volumul producției. Soluţie: Media aritmetică a intervalului variațională rând calculat în felul următor: pentru... Eroare marginală de eșantionare cu o probabilitate de 0,954 (t=2) va fi: Δ w = t*μ = 2*0,0146 = 0,02927 Să definim limitele...

  • Soluţie. semn

    Soluţie

    Despre a cui experiență de muncă și s-a ridicat la probă. Durata medie de muncă pentru eșantionul ... din ziua de muncă a acestor angajați și s-a ridicat la probă. Durata medie pentru eșantion... 1,16, nivelul de semnificație α = 0,05. Soluţie. variațională rând din această probă are forma: 0,71 ...

  • Curriculum de lucru în biologie pentru clasele 10-11 Compilat de Polikarpova S. V

    lucru program de antrenament

    Cele mai simple scheme de încrucișare» 5 L.r. " Soluţie elementar sarcini genetice» 6 L.r. " Soluţie probleme genetice elementare” 7 L.r. „..., 110, 115, 112, 110. Compune variațională rând, a desena variațională curba, găsiți valoarea medie a caracteristicii...

  • Condiție:

    Există date despre componența pe vârstă a lucrătorilor (ani): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

      1. Construiți o serie de distribuție pe intervale.
      2. Construiți o reprezentare grafică a seriei.
      3. Determinați grafic modul și mediana.

    Soluţie:

    1) Conform formulei Sturgess, populația trebuie împărțită în 1 + 3.322 lg 30 = 6 grupe.

    Vârsta maximă este de 38 de ani, iar cea minimă de 18 ani.

    Lățimea intervalului Deoarece capetele intervalelor trebuie să fie numere întregi, vom împărți populația în 5 grupuri. Lățimea intervalului - 4.

    Pentru a facilita calculele, să aranjam datele în ordine crescătoare: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29 , 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.

    Distribuția pe vârstă a lucrătorilor

    Grafic, o serie poate fi afișată ca histogramă sau poligon. Histograma - diagramă cu bare. Baza coloanei este lățimea intervalului. Înălțimea barei este egală cu frecvența.

    Un poligon (sau poligon de distribuție) este un grafic al frecvențelor. Pentru a o construi conform histogramei, conectăm punctele de mijloc ale laturilor superioare ale dreptunghiurilor. Închidem poligonul pe axa x la distanțe egale cu jumătate din intervalul de la valorile x extreme.

    Modul (Mo) este valoarea trăsăturii studiate, care apare cel mai frecvent într-o anumită populație.

    Pentru a determina modul din histogramă, trebuie să selectați cel mai înalt dreptunghi, să trageți o linie de la vârful din dreapta al acestui dreptunghi până la colțul din dreapta sus al dreptunghiului anterior și să trageți o linie de la vârful din stânga al dreptunghiului modal până la vârful stâng al următorului dreptunghi. Din punctul de intersecție al acestor drepte, trageți o perpendiculară pe axa x. Abscisa va fi la modă. Mo ≈ 27,5. Aceasta înseamnă că cea mai frecventă vârstă la această populație este 27-28 de ani.

    Mediana (Me) este valoarea trăsăturii studiate, care se află la mijlocul unei serii de variații ordonate.

    Găsim mediana prin cumulat. Cumulate - grafic al frecvențelor acumulate. Abscisele sunt variante ale unei serii. Ordonatele sunt frecvențele acumulate.

    Pentru a determina mediana pentru cumulat, găsim de-a lungul axei ordonatelor un punct corespunzător la 50% din frecvențele acumulate (în cazul nostru, 15), trasăm o linie dreaptă prin el, paralelă cu axa Ox și trasăm o perpendiculară pe axa x din punctul de intersecție cu cumulul. Abscisa este mediana. Eu ≈ 25,9. Aceasta înseamnă că jumătate dintre lucrătorii acestei populații au sub 26 de ani.

    Serii de distribuție statistică- aceasta este o distribuție ordonată a unităților de populație în grupuri în funcție de un anumit atribut variabil.
    În funcție de trăsătura care stă la baza formării unei serii de distribuție, există serie de distribuție de atribute și variații.

    Prezența unei trăsături comune este baza pentru formarea unei populații statistice, care este rezultatul unei descrieri sau măsurători aspecte comune obiecte de cercetare.

    Subiectul de studiu în statistică sunt caracteristici în schimbare (variabile) sau caracteristici statistice.

    Tipuri de caracteristici statistice.

    Seriile de distribuție sunt numite serii de atribute. construit pe temeiuri de calitate. Atributiv- acesta este un semn care are un nume (de exemplu, o profesie: croitoreasă, profesor etc.).
    Se obișnuiește să se aranjeze seria de distribuție sub formă de tabele. În tabel. 2.8 prezintă o serie de atribute de distribuție.
    Tabelul 2.8 - Distribuția tipurilor de asistență juridică oferite de avocați cetățenilor uneia dintre regiunile Federației Ruse.

    Seria de variații sunt valori caracteristice (sau intervale de valori) și frecvențele acestora.
    Serii de variații sunt serii de distribuție construit pe o bază cantitativă. Orice serie variațională constă din două elemente: variante și frecvențe.
    Variantele sunt valori individuale ale unei caracteristici pe care aceasta le ia într-o serie de variații.
    Frecvențele sunt numerele de variante individuale sau fiecare grup al seriei de variații, adică. acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor determină dimensiunea întregii populații, volumul acesteia.
    Frecvențele se numesc frecvențe, exprimate în fracții de unitate sau ca procent din total. În consecință, suma frecvențelor este egală cu 1 sau 100%. Seria variațională ne permite să evaluăm forma legii de distribuție pe baza datelor reale.

    În funcție de natura variației trăsăturii, există serie de variații discrete și interval.
    Un exemplu de serie variațională discretă este dat în tabel. 2.9.
    Tabelul 2.9 - Distribuția familiilor după numărul de camere ocupate în apartamente individuale în 1989 în Federația Rusă.

    Prima coloană a tabelului prezintă variante ale unei serii variaționale discrete, a doua coloană conține frecvențele seriei variaționale, iar a treia coloană conține indicatorii de frecvență.

    Seria de variații

    În populația generală, o anumită trăsătură cantitativă este investigată. Din el se extrage aleatoriu o mostră de volum n, adică numărul de elemente din eșantion este n. La prima etapă prelucrare statistică legume şi fructe variind mostre, adică ordonarea numerelor x 1 , x 2 , …, x n Ascendent. Fiecare valoare observată x i numit opțiune. Frecvență m i este numărul de observații ale valorii x iîn probă. Frecvența relativă (frecvența) w i este raportul de frecvență m i la dimensiunea eșantionului n: .
    Când se studiază o serie variațională, se folosesc și conceptele de frecvență cumulativă și frecvență cumulativă. Lăsa X oarecare număr. Apoi numărul de opțiuni , ale căror valori sunt mai mici X, se numește frecvență acumulată: pentru x i n se numeste frecventa acumulata w i max .
    Un atribut se numește variabil discret dacă valorile sale individuale (variantele) diferă unele de altele printr-o cantitate finită (de obicei un număr întreg). O serie variațională a unei astfel de caracteristici se numește serie variațională discretă.

    Tabelul 1. Vedere generală a seriei variaționale discrete de frecvențe

    Valori caracteristicex i x 1 x2 x n
    Frecvențelem i m 1 m2 m n

    Un atribut se numește variabil continuu dacă valorile sale diferă unele de altele printr-o cantitate arbitrar mică, adică semnul poate lua orice valoare într-un anumit interval. O serie de variații continue pentru o astfel de trăsătură se numește serie de intervale.

    Tabelul 2. Vedere generală a seriei de variație a intervalului de frecvențe

    Tabelul 3. Imagini grafice ale seriei de variații

    RândPoligon sau histogramăFuncția de distribuție empirică
    Discret
    interval
    Privind rezultatele observațiilor, se determină câte valori ale variantelor au căzut în fiecare interval specific. Se presupune că fiecare interval aparține unuia dintre capetele sale: fie în toate cazurile stânga (mai des), fie în toate cazurile dreptului, iar frecvențele sau frecvențele arată numărul de opțiuni conținute în limitele indicate. Diferențele a i – a i +1 se numesc intervale parțiale. Pentru a simplifica calculele ulterioare, seria de variații de interval poate fi înlocuită cu una condițional discretă. În acest caz, valoarea medie i-al-lea interval este luat ca opțiune x i, și frecvența intervalului corespunzătoare m i- pentru frecventa acestui interval.
    Pentru reprezentarea grafică a seriilor variaționale, cel mai des sunt utilizate poligonul, histograma, curba cumulativă și funcția de distribuție empirică.

    În tabel. 2.3 (Gruparea populației Rusiei în funcție de mărimea venitului mediu pe cap de locuitor în aprilie 1994) este prezentată serie de variații de interval.
    Este convenabil să se analizeze seria de distribuție folosind o reprezentare grafică, care face, de asemenea, posibilă aprecierea formei distribuției. O reprezentare vizuală a naturii modificării frecvențelor seriei variaționale este dată de poligon și histogramă.
    Poligonul este utilizat la afișarea unor serii variaționale discrete.
    Să descriem, de exemplu, grafic distribuția fondului de locuințe pe tipuri de apartamente (Tabelul 2.10).
    Tabel 2.10 - Distribuția fondului de locuințe din mediul urban pe tip de apartamente (cifre condiționate).


    Orez. Poligon de distribuție a locuințelor


    Pe axa y, pot fi reprezentate nu numai valorile frecvențelor, ci și frecvențele seriei de variații.
    Histograma este luată pentru a afișa seria variației intervalului. La construirea unei histograme, valorile intervalelor sunt reprezentate pe axa absciselor, iar frecvențele sunt reprezentate prin dreptunghiuri construite pe intervalele corespunzătoare. Înălțimea coloanelor în cazul intervalelor egale ar trebui să fie proporțională cu frecvențele. O histogramă este un grafic în care o serie este prezentată ca bare adiacente una cu cealaltă.
    Să descriem grafic seria de distribuție a intervalelor prezentată în tabel. 2.11.
    Tabel 2.11 - Distribuția familiilor după mărimea spațiului de locuit per persoană (cifre condiționate).
    N p / p Grupuri de familii după mărimea spațiului de locuit per persoană Numărul de familii cu o anumită dimensiune a spațiului de locuit Numărul cumulat de familii
    1 3 – 5 10 10
    2 5 – 7 20 30
    3 7 – 9 40 70
    4 9 – 11 30 100
    5 11 – 13 15 115
    TOTAL 115 ----


    Orez. 2.2. Histograma distribuției familiilor după mărimea spațiului de locuit per persoană


    Folosind datele seriei acumulate (Tabelul 2.11), construim distribuţie cumulativă.


    Orez. 2.3. Distribuția cumulativă a familiilor în funcție de dimensiunea spațiului de locuit per persoană


    Reprezentarea unei serii variaționale sub formă de cumulat este eficientă în special pentru seriile variaționale ale căror frecvențe sunt exprimate ca fracții sau procente din suma frecvențelor seriei.
    Dacă schimbăm axele în reprezentarea grafică a seriei variaționale sub formă de cumulat, atunci obținem ogivu. Pe fig. 2.4 prezintă o ogivă construită pe baza datelor din tabel. 2.11.
    O histogramă poate fi convertită într-un poligon de distribuție prin găsirea punctelor medii ale laturilor dreptunghiurilor și apoi conectând aceste puncte cu linii drepte. Poligonul de distribuție rezultat este prezentat în fig. 2,2 linie punctată.
    La construirea unei histograme a distribuției unei serii variaționale cu intervale inegale, de-a lungul axei ordonatelor, nu se aplică frecvențe, ci densitatea de distribuție a caracteristicii în intervalele corespunzătoare.
    Densitatea de distribuție este frecvența calculată pe unitatea de lățime a intervalului, adică câte unități din fiecare grup sunt pe unitatea de valoare a intervalului. Un exemplu de calcul al densității de distribuție este prezentat în tabel. 2.12.
    Tabel 2.12 - Distribuția întreprinderilor după numărul de angajați (cifrele sunt condiționate)
    N p / p Grupuri de întreprinderi după numărul de angajați, pers. Numărul de întreprinderi Dimensiunea intervalului, pers. Densitatea de distribuție
    A 1 2 3=1/2
    1 până la 20 15 20 0,75
    2 20 – 80 27 60 0,25
    3 80 – 150 35 70 0,5
    4 150 – 300 60 150 0,4
    5 300 – 500 10 200 0,05
    TOTAL 147 ---- ----

    Pentru o reprezentare grafică a variației pot fi utilizate și serii curba cumulativă. Cu ajutorul cumulatului (curba sumelor) se afișează o serie de frecvențe acumulate. Frecvențele acumulate sunt determinate prin însumarea secvențială a frecvențelor pe grupuri și arată câte unități ale populației au valori caracteristice nu mai mari decât valoarea considerată.


    Orez. 2.4. Ogiva repartizarea familiilor în funcție de mărimea spațiului de locuit per persoană

    Când se construiește cumulul unei serii de variații de interval, variantele seriei sunt reprezentate de-a lungul axei absciselor, iar frecvențele acumulate de-a lungul axei ordonatelor.

    Serii cu variații continue

    O serie variațională continuă este o serie construită pe baza unui semn statistic cantitativ. Exemplu. Durata medie a bolilor condamnaților (zile per persoană) în perioada toamnă-iarnă în anul curent a fost:
    7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
    7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
    10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5