Matemaattisen tilaston aihe. Todennäköisyystilastollisten menetelmien perusteet epävarmuuksien kuvaamiseen Matemaattisen tilaston aihe ja menetelmät

Matemaattisella tilastolla tarkoitetaan "matematiikan osaa, joka on omistettu matemaattisille menetelmille tilastotietojen keräämiseksi, systematisoimiseksi, käsittelemiseksi ja tulkitsemiseksi sekä niiden käyttämiseksi tieteellisiin tai käytännön johtopäätöksiin. Matemaattisen tilaston säännöt ja menettelytavat perustuvat todennäköisyysteoriaan, jonka avulla on mahdollista arvioida kussakin tehtävässä saatujen johtopäätösten tarkkuutta ja luotettavuutta käytettävissä olevan tiedon perusteella. tilastollinen materiaali» . Samaan aikaan tilastotiedolla tarkoitetaan tietoa missä tahansa enemmän tai vähemmän laajassa kokoelmassa olevien esineiden määrästä, joilla on tietyt ominaisuudet.

Ratkaistavien ongelmien tyypin mukaan matemaattiset tilastot jaetaan yleensä kolmeen osaan: tietojen kuvaus, estimointi ja hypoteesien testaus.

Käsiteltävän tilastotiedon tyypin mukaan matemaattiset tilastot on jaettu neljään alueeseen:

— yksiulotteiset tilastot (tilastot satunnaismuuttujia), jossa havainnointitulos on kuvattu oikea numero;

- moniulotteinen tilastollinen analyysi, jossa kohteen havainnoinnin tulosta kuvataan useilla numeroilla (vektorilla);

- tilastot satunnaisia ​​prosesseja ja aikasarjat, joissa havainnon tulos on funktio;

— ei-numeeristen kohteiden tilastot, joissa havainnoinnin tulos on luonteeltaan ei-numeerinen, esimerkiksi joukko ( geometrinen kuvio), tilaus tai saatu mittauksen tuloksena laadullisesti.

Historiallisesti ensimmäisinä ilmestyivät jotkin ei-numeeristen esineiden tilastoalueet (erityisesti viallisten tuotteiden prosenttiosuuden arvioinnin ja sitä koskevien hypoteesien testaamisen ongelmat) ja yksiulotteiset tilastot. Matemaattinen laitteisto on heille yksinkertaisempi, joten he yleensä osoittavat esimerkillään matemaattisen tilaston pääideat.

Vain ne tietojenkäsittelytavat, esim. matemaattiset tilastot ovat näyttöön perustuvia, jotka perustuvat relevanttien todellisten ilmiöiden ja prosessien todennäköisyysmalleihin. Puhumme kuluttajakäyttäytymismalleista, riskien esiintymisestä, teknisten laitteiden toiminnasta, kokeen tulosten saamisesta, sairauden kulusta jne. Todellisen ilmiön todennäköisyysmallia tulisi pitää rakennettuna, jos tarkasteltavat suureet ja niiden väliset suhteet ilmaistaan ​​todennäköisyysteorian avulla.

Vastaavuus todellisuuden todennäköisyysmalliin, ts. sen riittävyyttä perustellaan erityisesti tilastollisilla hypoteesien testausmenetelmillä.

Uskomattomat tietojenkäsittelymenetelmät ovat tutkivia, niitä voidaan käyttää vain alustavassa tiedon analysoinnissa, koska niillä ei voida arvioida saatujen johtopäätösten tarkkuutta ja luotettavuutta rajallisen tilastoaineiston perusteella.

Todennäköisyyspohjainen ja tilastolliset menetelmät ovat sovellettavissa aina, kun on mahdollista rakentaa ja perustella todennäköisyysmalli ilmiöstä tai prosessista. Niiden käyttö on pakollista, kun otantatiedoista tehdyt johtopäätökset siirretään koko perusjoukolle (esimerkiksi näytteestä kokonaiseen tuoteerään).

Tietyillä sovellusalueilla käytetään sekä laajasti sovellettavia todennäköisyystilastollisia menetelmiä että erityisiä menetelmiä. Esimerkiksi tuotannonhallinnan tilastollisille tuotteiden laadunhallinnan menetelmille omistetussa osiossa käytetään sovellettua matemaattista tilastoa (mukaan lukien kokeiden suunnittelu). Sen menetelmien avulla tehdään tilastollinen analyysi teknisten prosessien tarkkuudesta ja stabiilisuudesta sekä tilastollinen laadun arviointi. Erityisiä menetelmiä ovat tuotteiden laadun tilastollisen hyväksynnän valvonnan menetelmät, teknisten prosessien tilastollinen säätely, luotettavuuden arviointi ja valvonta jne.

Tällaisia ​​sovellettavia todennäköisyysstatistiikan tieteenaloja kuten luotettavuusteoria ja jonoteoria ovat laajalti käytössä. Ensimmäisen sisältö selviää otsikosta, toinen käsittelee järjestelmien, kuten puhelinkeskuksen, tutkimusta, joka vastaanottaa puheluita satunnaisina aikoina - puhelimissaan numeroita valitsevien tilaajien vaatimuksia. Näiden vaatimusten palvelun kesto, ts. keskustelujen kestoa mallinnetaan myös satunnaismuuttujilla. Neuvostoliiton tiedeakatemian kirjeenvaihtajajäsen A.Ya antoi suuren panoksen näiden tieteenalojen kehittämiseen. Khinchin (1894-1959), Ukrainan SSR:n tiedeakatemian akateemikko B.V. Gnedenko (1912-1995) ja muut kotimaiset tiedemiehet.

Jokainen tutkimus satunnaisten ilmiöiden alalla on aina juurtunut kokeeseen, kokeelliseen dataan. Numeerisia tietoja, jotka kerätään tutkittaessa jonkin kohteen mitä tahansa ominaisuutta, kutsutaan tilastollinen. Tilastotiedot ovat tutkimuksen lähtömateriaali. Jotta niillä olisi tieteellistä tai käytännöllistä arvoa, ne on käsiteltävä matemaattisten tilastojen menetelmillä.

Matemaattiset tilastot- Tämä tieteenala, jonka aiheena on menetelmien kehittäminen massasatunnaisten ilmiöiden havainnoinnin tuloksena saatujen tilastollisten kokeellisten tietojen tallentamiseksi, kuvaamiseksi ja analysoimiseksi.

Matemaattisten tilastojen päätehtävät ovat:

    satunnaismuuttujan tai satunnaismuuttujien järjestelmän jakautumislain määrittäminen;

    hypoteesien uskottavuuden testaus;

    tuntemattomien jakautumisparametrien määrittäminen.

Kaikki matemaattisten tilastojen menetelmät perustuvat todennäköisyysteoriaan. Kuitenkin ratkaistavien ongelmien spesifisyydestä johtuen matemaattinen tilasto on erotettu todennäköisyysteoriasta itsenäiseksi kenttään. Jos todennäköisyysteoriassa katsotaan ilmiön malli annetuksi ja lasketaan tämän ilmiön mahdollinen todellinen kulku (kuva 1), niin matemaattisessa tilastossa valitaan sopiva todennäköisyysmalli tilastotietojen perusteella (kuva 2).

Kuva 1. Todennäköisyysteorian yleinen ongelma

Kuva 2. Matemaattisten tilastojen yleinen ongelma

Tieteellisenä tieteenalana matemaattiset tilastot kehittyivät yhdessä todennäköisyysteorian kanssa. Tämän tieteen matemaattinen laite rakennettiin 1800-luvun jälkipuoliskolla.

2. Yleinen perusjoukko ja otos.

Tilastollisten menetelmien tutkimiseksi esitellään yleis- ja otantapopulaatioiden käsitteet. Yleensä alle yleinen väestö on satunnaismuuttuja X, jossa on jakaumafunktio
. Tietyn satunnaismuuttujan X näytejoukko tai tilavuuden n näyte on joukko
riippumattomat havainnot tästä määrästä, missä kutsutaan satunnaismuuttujan X näytearvoksi tai toteutukseksi. Täten, voidaan pitää numeroina (jos koe suoritetaan ja näyte on otettu) ja satunnaismuuttujina (ennen koetta), koska ne vaihtelevat näytteestä toiseen.

Esimerkki 1. Puun rungon paksuuden riippuvuuden määrittämiseksi sen korkeudesta valittiin 200 puuta. Tässä tapauksessa otoskoko on n=200.

Esimerkki 2 Lastulevyjen sahauksen tuloksena pyörösahalla saatiin 15 arvoa tietystä leikkaustyöstä. Tässä tapauksessa n = 15.

D
Jotta voimme luotettavasti arvioida sitä yleisen populaation ominaisuutta, josta olemme kiinnostuneita näytetietojen perusteella, otoksen objektien on esitettävä se oikein, eli otoksen on oltava edustaja(edustaja). Otoksen edustavuus saavutetaan yleensä kohteiden satunnaisella valinnalla: jokaiselle yleisen perusjoukon kohteelle tarjotaan yhtä suuri todennäköisyys joutua otokseen kaikkien muiden kanssa.

Kuva 3. Otoksen edustavuuden osoittaminen


Sisältö.

1. Esittely:
- Miten todennäköisyys- ja matemaattisia tilastoja käytetään? - sivu 2
- Mitä on "matemaattinen tilasto"? - sivu 3
2) Esimerkkejä todennäköisyysteorian ja matemaattisten tilastojen soveltamisesta:
- Valinta. - sivu 4
- Arviointitehtävät. – sivu 6
- Todennäköisyys-tilastolliset menetelmät ja optimointi. – sivu 7
3) Johtopäätös.

Johdanto.

Miten todennäköisyys- ja matemaattisia tilastoja käytetään? Nämä tieteenalat ovat todennäköisyystilastollisten päätöksentekomenetelmien perusta. Niiden matemaattisen laitteiston käyttämiseksi on tarpeen ilmaista päätöksentekoongelmat todennäköisyys-tilastollisina malleina. Tietyn todennäköisyysstatistisen päätöksentekomenetelmän soveltaminen koostuu kolmesta vaiheesta:
- siirtyminen taloudellisesta, johtamisesta, teknologisesta todellisuudesta abstraktiin matemaattiseen ja tilastolliseen järjestelmään, ts. todennäköisyyspohjaisen mallin rakentaminen valvontajärjestelmästä, teknologisesta prosessista, päätöksentekomenettelystä, erityisesti tilastollisen valvonnan tulosten perusteella jne.
- laskelmien tekeminen ja johtopäätösten tekeminen puhtaasti matemaattisin keinoin todennäköisyysmallin puitteissa;
- matemaattisten ja tilastollisten päätelmien tulkinta suhteessa todelliseen tilanteeseen ja asianmukaisen päätöksen tekeminen (esimerkiksi tuotteen laadun vaatimustenmukaisuudesta tai poikkeavuudesta asetettujen vaatimusten kanssa, tarpeesta mukauttaa teknistä prosessia jne.), erityisesti johtopäätökset (erissä olevien tuoteyksiköiden osuudesta, ohjattujen prosessiparametrien jakamista koskevista erityislaeista jne.).

Matemaattisessa tilastossa käytetään todennäköisyysteorian käsitteitä, menetelmiä ja tuloksia. Tarkastellaan pääkysymyksiä todennäköisyyspohjaisten päätöksentekomallien rakentamisessa taloudellisissa, johtamis-, teknologisissa ja muissa tilanteissa. Todennäköisyystilastollisia päätöksentekomenetelmiä koskevien normatiivis-teknisten ja ohje-metodisten asiakirjojen aktiivinen ja oikea käyttö edellyttää ennakkotietoa. On siis tiedettävä, millä ehdoilla yhtä tai toista asiakirjaa tulee soveltaa, mitä lähtötietoa sen valintaan ja soveltamiseen tarvitaan, mitä päätöksiä tietojenkäsittelyn tulosten perusteella tulisi tehdä jne.

Mitä on "matemaattinen tilasto"? Matemaattisella tilastolla tarkoitetaan "matematiikan osaa, joka on omistettu matemaattisille menetelmille tilastotietojen keräämiseksi, systematisoimiseksi, käsittelemiseksi ja tulkitsemiseksi sekä niiden käyttämiseksi tieteellisiin tai käytännön johtopäätöksiin. Matemaattisen tilaston säännöt ja menettelytavat perustuvat todennäköisyysteoriaan, jonka avulla on mahdollista arvioida kussakin tehtävässä saatujen johtopäätösten tarkkuutta ja luotettavuutta käytettävissä olevan tilastoaineiston perusteella. Samaan aikaan tilastotiedolla tarkoitetaan tietoa missä tahansa enemmän tai vähemmän laajassa kokoelmassa olevien esineiden määrästä, joilla on tietyt ominaisuudet.

Ratkaistavien ongelmien tyypin mukaan matemaattiset tilastot jaetaan yleensä kolmeen osaan: tietojen kuvaus, estimointi ja hypoteesien testaus.

Käsiteltävän tilastotiedon tyypin mukaan matemaattiset tilastot on jaettu neljään alueeseen:

Yksiulotteinen tilasto (satunnaismuuttujien tilasto), jossa havainnon tulosta kuvataan reaaliluvulla;

Monimuuttujatilastollinen analyysi, jossa kohteen havainnoinnin tulosta kuvataan useilla numeroilla (vektorilla);

Satunnaisprosessien ja aikasarjojen tilastot, joissa havainnon tulos on funktio;

Luonteeltaan ei-numeeristen kohteiden tilastot, joissa havainnon tulos on luonteeltaan ei-numeerinen, esimerkiksi se on joukko (geometrinen kuvio), järjestys tai saatu mittauksen tuloksena kvalitatiivisella attribuutilla.

Esimerkkejä todennäköisyysteorian ja matemaattisten tilastojen soveltamisesta.
Tarkastellaanpa useita esimerkkejä, joissa todennäköisyystilastolliset mallit ovat hyvä työkalu johtamis-, teollisuus-, talous- ja kansantaloudellisten ongelmien ratkaisemiseen. Joten esimerkiksi eränä käytettävän kolikon tulee olla "symmetrinen", ts. kun se heitetään, keskimäärin puolet tapauksista vaakunan pitäisi pudota ulos ja puolessa tapauksissa - hila (hännät, numero). Mutta mitä tarkoittaa "keskimääräinen"? Jos käytät jokaisessa sarjassa useita 10 heiton sarjoja, tulee usein sarjoja, joissa kolikko putoaa 4 kertaa vaakunan kanssa. Symmetrisen kolikon osalta tämä tapahtuu 20,5 prosentissa sarjasta. Ja jos 100 000 heittoa kohden on 40 000 vaakunaa, voidaanko kolikkoa pitää symmetrisenä? Päätöksentekomenettely perustuu todennäköisyysteoriaan ja matemaattisiin tilastoihin.

Tarkasteltava esimerkki ei ehkä vaikuta riittävän vakavalta. Se ei kuitenkaan ole. Arvontaa käytetään laajalti teollisten toteutettavuuskokeiden järjestämisessä, esimerkiksi käsiteltäessä laakereiden laatuindeksin (kitkamomentin) mittaustuloksia riippuen erilaisista teknologisista tekijöistä (säästöympäristön vaikutus, laakereiden valmistusmenetelmät ennen mittausta, laakerin kuorman vaikutus mittausprosessissa jne.). Oletetaan, että on tarpeen verrata laakerien laatua riippuen niiden varastoinnin tuloksista erilaisissa säilytysöljyissä, ts. koostumuksen A ja B öljyissä. Tällaista koetta suunniteltaessa herää kysymys, mitkä laakerit tulisi sijoittaa öljykoostumukseen A ja mitkä - öljykoostumukseen B, mutta siten, että vältetään subjektiivisuus ja varmistetaan päätöksen objektiivisuus.

Näyte
Vastaus tähän kysymykseen saadaan arvalla. Samanlainen esimerkki voidaan antaa minkä tahansa tuotteen laadunvalvonnasta. Sen päättämiseksi, täyttääkö tarkastettu tuote-erä asetetut vaatimukset, siitä otetaan näyte. Näytekontrollin tulosten perusteella tehdään johtopäätös koko erästä. Tässä tapauksessa on erittäin tärkeää välttää subjektiivisuutta näytteen muodostuksessa, eli on välttämätöntä, että jokaisella valvotun erän tuoteyksiköllä on sama todennäköisyys tulla valituksi näytteeseen. Tuotantoolosuhteissa tuotantoyksiköiden valinta otokseen ei yleensä tapahdu arvalla, vaan erityisillä satunnaislukutaulukoilla tai tietokoneiden satunnaislukugeneraattoreiden avulla.
Samanlaisia ​​ongelmia vertailun objektiivisuuden varmistamisessa syntyy verrattaessa erilaisia ​​tuotannon organisointijärjestelmiä, palkitsemista, tarjouskilpailuja, ehdokkaita valittaessa avoimia paikkoja jne. Kaikkialla tarvitset arpajaisia ​​tai vastaavia menettelyjä. Selitetään esimerkkinä vahvin ja toiseksi vahvin joukkue turnauksen järjestämisessä olympiajärjestelmän mukaisesti (häviäjä putoaa). Anna vahvemman joukkueen aina voittaa heikomman. On selvää, että vahvimmasta joukkueesta tulee ehdottomasti mestari. Toiseksi vahvin joukkue pääsee finaaliin, jos ja vain, jos sillä ei ole pelejä tulevan mestarin kanssa ennen finaalia. Jos tällainen peli on suunniteltu, toiseksi vahvin joukkue ei pääse finaaliin. Turnauksen suunnittelija voi joko "pudottaa" turnauksesta toiseksi vahvimman joukkueen etuajassa, pudottamalla sen ensimmäisessä tapaamisessa johtajan kanssa, tai varmistaa sille toisen sijan varmistaen kohtaamiset heikompien joukkueiden kanssa finaaliin asti. Subjektiivisuuden välttämiseksi arpaa. 8 joukkueen turnauksessa todennäköisyys, että kaksi vahvinta joukkuetta kohtaavat finaalissa, on 4/7. Näin ollen todennäköisyydellä 3/7 toiseksi vahvin joukkue lähtee turnauksesta etuajassa.
Kaikissa tuoteyksiköiden mittauksissa (käyttäen jarrusatulaa, mikrometriä, ampeerimittaria jne.) on virheitä. Jotta saadaan selville, onko järjestelmässä virheitä, on tarpeen tehdä toistuvia mittauksia tuotantoyksiköstä, jonka ominaisuudet tunnetaan (esimerkiksi standardinäyte). On syytä muistaa, että systemaattisen virheen lisäksi on olemassa myös satunnainen virhe.

Siksi herää kysymys, miten mittaustuloksista saadaan selville, onko järjestelmässä virhe. Jos huomioidaan vain, onko seuraavan mittauksen aikana saatu virhe positiivinen vai negatiivinen, tämä ongelma voidaan vähentää edelliseen. Verrataan todellakin mittausta kolikon heittämiseen, positiivista virhettä - vaakunan menettämiseen, negatiivista - hilaan (nollavirhettä riittävällä määrällä asteikon jakoja ei tapahdu melkein koskaan). Tällöin systemaattisen virheen puuttumisen tarkistaminen vastaa kolikon symmetrian tarkistamista.

Näiden näkökohtien tarkoituksena on vähentää systemaattisen virheen puuttumisen tarkistamisen ongelma kolikon symmetrian tarkistamiseen. Yllä oleva päättely johtaa niin sanottuun "merkkien kriteeriin" matemaattisessa tilastossa.
"Sign testi" - tilastollinen testi, jonka avulla voit testata nollahypoteesia, että näyte noudattaa binomijakaumaa parametrilla p=1/2. Etumerkkitestiä voidaan käyttää ei-parametrisena tilastollisena testinä testatakseen hypoteesia, että mediaani on yhtä suuri kuin annettu arvo (erityisesti nolla), sekä siirtymän puuttumista (ei käsittelyvaikutusta) kahdessa yhdistetyssä näytteessä. Sen avulla voit myös testata hypoteesin jakautumissymmetriasta, mutta tälle on tehokkaampia kriteerejä - yhden näytteen Wilcoxon-testi ja sen modifikaatiot.

Matemaattisten tilastojen menetelmiin perustuvien teknisten prosessien tilastollisessa säätelyssä kehitetään prosessien tilastollisen valvonnan sääntöjä ja suunnitelmia, joiden tarkoituksena on havaita ajoissa teknisten prosessien häiriö ja ryhtyä toimenpiteisiin niiden säätämiseksi ja sellaisten tuotteiden vapautumisen estämiseksi, jotka eivät täytä asetettuja vaatimuksia. Näillä toimenpiteillä pyritään vähentämään tuotantokustannuksia ja huonolaatuisten tuotteiden toimittamisesta aiheutuvia menetyksiä. Tilastollisen hyväksynnän valvonnassa, joka perustuu matemaattisten tilastojen menetelmiin, laaditaan laadunvalvontasuunnitelmat analysoimalla näytteitä tuote-eristä. Vaikeus on siinä, että pystytään rakentamaan oikein todennäköisyystilastollisia päätöksentekomalleja, joiden pohjalta voidaan vastata edellä esitettyihin kysymyksiin. Matemaattisessa tilastossa tätä varten on kehitetty todennäköisyysmalleja ja hypoteesien testausmenetelmiä, erityisesti hypoteeseja, joiden mukaan viallisten tuotantoyksiköiden osuus on tietty luku p0, esimerkiksi p0 = 0,23.

Arviointitehtävät.
Useissa johtamis-, teollisissa, taloudellisissa, kansantaloudellisissa tilanteissa syntyy erityyppisiä ongelmia - ongelmia todennäköisyysjakaumien ominaisuuksien ja parametrien arvioinnissa.

Harkitse esimerkkiä. Anna erän N sähkölamppua tulla ohjaukseen. Tästä erästä valittiin satunnaisesti n sähkölampun näyte. Useita luonnollisia kysymyksiä herää. Miten näyteelementtien testaustuloksista voidaan määrittää sähkölamppujen keskimääräinen käyttöikä ja millä tarkkuudella tämä ominaisuus voidaan arvioida? Miten tarkkuus muuttuu, jos otetaan suurempi näyte? Millä tuntimäärällä T voidaan taata, että vähintään 90 % sähkölampuista kestää T tuntia tai enemmän?

Oletetaan, että testattaessa n sähkölampun näytettä X sähkölamppu osoittautui vialliseksi. Sitten herää seuraavat kysymykset. Mitkä rajat voidaan määrittää viallisten sähkölamppujen määrälle D erässä, vikatasolle D/N jne.?

Tai teknisten prosessien tarkkuuden ja stabiilisuuden tilastollisessa analyysissä on tarpeen arvioida sellaisia ​​laatuindikaattoreita kuin säädellyn parametrin keskiarvo ja sen leviämisaste tarkasteltavassa prosessissa. Todennäköisyysteorian mukaan sitä on suositeltavaa käyttää satunnaismuuttujan keskiarvona odotettu arvo, ja hajanaisuuden tilastollisena ominaisuutena - dispersio, keskihajonta tai variaatiokerroin. Tämä herättää kysymyksen: kuinka nämä tilastolliset ominaisuudet voidaan arvioida otantatiedoista ja millä tarkkuudella tämä voidaan tehdä? Vastaavia esimerkkejä on monia. Tässä oli tärkeää näyttää, miten todennäköisyysteoriaa ja matemaattista tilastoa voidaan käyttää tuotannon ohjauksessa tehtäessä päätöksiä tilastollisen tuotteen laadunhallinnan alalla.

Todennäköisyysstatistiset menetelmät ja optimointi. Optimoinnin idea läpäisee nykyaikaiset sovelletut matemaattiset tilastot ja muut tilastolliset menetelmät. Nimittäin kokeiden suunnittelumenetelmät, tilastollinen hyväksyntävalvonta, teknisten prosessien tilastollinen ohjaus jne. Toisaalta päätösteorian optimointiformulaatiot, esimerkiksi sovellettu tuotteen laadun ja standardivaatimusten optimoinnin teoria, mahdollistavat todennäköisyys-tilastollisten menetelmien, ensisijaisesti sovelletun matemaattisen tilaston, laajan käytön.

Tuotannonhallinnassa erityisesti tuotteiden laatua ja standardivaatimuksia optimoitaessa on erityisen tärkeää soveltaa tilastollisia menetelmiä alkuvaiheessa tuotteen elinkaari, ts. tutkimusvaiheessa kokeellisen suunnittelukehityksen valmistelu (lupaavien vaatimusten kehittäminen tuotteille, esisuunnittelu, kokeellisen suunnittelun kehittämistehtävä). Tämä johtuu tuotteen elinkaaren alkuvaiheessa saatavilla olevan tiedon rajallisuudesta ja tarpeesta ennustaa tulevaisuuden teknisiä mahdollisuuksia ja taloudellista tilannetta. Tilastollisia menetelmiä tulee soveltaa optimointiongelman ratkaisun kaikissa vaiheissa - muuttujia skaalattaessa, matemaattisia malleja kehitettäessä tuotteiden ja järjestelmien toimintaan, tehtäessä teknisiä ja taloudellisia kokeita jne.

Optimointiongelmissa, mukaan lukien tuotteiden laadun ja standardivaatimusten optimointi, käytetään kaikkia tilastointialueita. Nimittäin satunnaismuuttujien tilastot, monimuuttujatilastoanalyysi, satunnaisprosessien ja aikasarjojen tilastot, ei-numeeristen objektien tilastot. Tiettyjen tietojen analysointiin käytettävä tilastollinen menetelmä on valittava suositusten mukaisesti.

Johtopäätös.
SISÄÄN
jne.................

Todennäköisyysteoria ja matemaattinen tilastointi ovat tietojenkäsittelyn todennäköisyysstatististen menetelmien perusta. Ja käsittelemme ja analysoimme dataa ensisijaisesti päätöksentekoa varten. Nykyaikaisen matemaattisen laitteiston käyttämiseksi on välttämätöntä ilmaista tarkasteltavat ongelmat todennäköisyys-tilastollisina malleina.

Tietyn todennäköisyystilastollisen menetelmän soveltaminen koostuu kolmesta vaiheesta:

Siirtyminen taloudellisesta, johtamis-, teknologisesta todellisuudesta abstraktiin matemaattiseen ja tilastolliseen kaavioon, ts. todennäköisyyspohjaisen mallin rakentaminen valvontajärjestelmästä, teknologisesta prosessista, päätöksentekomenettelystä, erityisesti tilastollisen valvonnan tulosten perusteella jne.

Laskelmien tekeminen ja johtopäätösten tekeminen puhtaasti matemaattisin keinoin todennäköisyysmallin puitteissa;

Matemaattisten ja tilastollisten päätelmien tulkinta suhteessa todelliseen tilanteeseen ja asianmukaisen päätöksen tekeminen (esimerkiksi tuotteen laadun vaatimustenmukaisuudesta tai poikkeavuudesta asetettujen vaatimusten kanssa, tarpeesta mukauttaa teknistä prosessia jne.), erityisesti johtopäätökset (virheellisten tuoteyksiköiden suhteesta erässä, tietyntyyppisistä teknisistä laeista ohjattujen prosessien parametrien jakamiseen, jne.).

Matemaattisessa tilastossa käytetään todennäköisyysteorian käsitteitä, menetelmiä ja tuloksia. Seuraavaksi tarkastellaan pääkysymyksiä todennäköisyysmallien rakentamisessa taloudellisissa, johtamis-, teknologisissa ja muissa tilanteissa. Korostamme, että todennäköisyys-tilastollisia menetelmiä koskevien normatiivis-teknisten ja ohje-metodisten asiakirjojen aktiivinen ja oikea käyttö edellyttää ennakkotietoa. On siis tiedettävä, millä ehdoilla yhtä tai toista asiakirjaa tulee soveltaa, mitä lähtötietoa sen valintaan ja soveltamiseen tarvitaan, mitä päätöksiä tietojenkäsittelyn tulosten perusteella tulisi tehdä jne.

Sovellusesimerkkejä todennäköisyysteoria ja matemaattinen tilasto. Tarkastellaanpa useita esimerkkejä, joissa todennäköisyystilastolliset mallit ovat hyvä työkalu johtamis-, teollisuus-, talous- ja kansantaloudellisten ongelmien ratkaisemiseen. Joten esimerkiksi A. N. Tolstoin romaanissa "Kävely piinausten läpi" (osa 1) sanotaan: "työpaja antaa kaksikymmentäkolme prosenttia avioliitosta, sinä pidät tästä luvusta", Strukov kertoi Ivan Iljitšille.

Kuinka ymmärtää nämä sanat tehdasjohtajien keskustelussa? Yksi tuotantoyksikkö ei voi olla 23 % viallinen. Se voi olla joko hyvä tai viallinen. Ehkä Strukov tarkoitti, että suuri erä sisältää noin 23 % viallisia yksiköitä. Sitten herää kysymys, mitä "noin" tarkoittaa? Olkoon 30 100 testatusta tuoteyksiköstä viallinen, tai 1 000 - 300 tai 100 000 - 30 000 jne., pitäisikö Strukovia syyttää valehtelusta?

Tai toinen esimerkki. Eränä käytettävän kolikon on oltava "symmetrinen". Kun se heitetään, keskimäärin puolessa tapauksista vaakunan (kotka) pitäisi pudota ulos ja puolessa tapauksista - ristikko (hännät, numero). Mutta mitä tarkoittaa "keskimääräinen"? Jos käytät jokaisessa sarjassa useita 10 heiton sarjoja, tulee usein sarjoja, joissa kolikko putoaa 4 kertaa vaakunan kanssa. Symmetrisen kolikon osalta tämä tapahtuu 20,5 prosentissa sarjasta. Ja jos 100 000 heittoa kohden on 40 000 vaakunaa, voidaanko kolikkoa pitää symmetrisenä? Päätöksentekomenettely perustuu todennäköisyysteoriaan ja matemaattisiin tilastoihin.

Esimerkki ei ehkä vaikuta tarpeeksi vakavalta. Se ei kuitenkaan ole. Arpoja käytetään laajalti teollisten toteutettavuuskokeiden järjestämisessä. Esimerkiksi käsiteltäessä laakereiden laatuindeksin (kitkamomentin) mittaustuloksia, riippuen erilaisista teknologisista tekijöistä (säästöympäristön vaikutus, laakereiden valmistusmenetelmät ennen mittausta, laakerin kuorman vaikutus mittausprosessissa jne.). Oletetaan, että on tarpeen verrata laakerien laatua riippuen niiden varastoinnin tuloksista erilaisissa säilytysöljyissä, ts. koostumusöljyissä A Ja SISÄÄN. Tällaista koetta suunniteltaessa herää kysymys, mitkä laakerit tulisi sijoittaa öljykoostumukseen A, ja mitkä - koostumusöljyssä SISÄÄN, mutta siten, että vältetään subjektiivisuus ja varmistetaan päätöksen objektiivisuus. Vastaus tähän kysymykseen saadaan arvalla.

Samanlainen esimerkki voidaan antaa minkä tahansa tuotteen laadunvalvonnasta. Sen päättämiseksi, täyttääkö tarkastettu tuote-erä asetetut vaatimukset, siitä otetaan näyte. Näytekontrollin tulosten perusteella tehdään johtopäätös koko erästä. Tässä tapauksessa on erittäin tärkeää välttää subjektiivisuutta otoksen muodostuksessa, ts. on välttämätöntä, että jokaisella valvotun erän tuoteyksiköllä on sama todennäköisyys tulla valituksi otokseen. Tuotantoolosuhteissa tuotantoyksiköiden valinta otokseen ei yleensä tapahdu arvalla, vaan erityisillä satunnaislukutaulukoilla tai tietokoneiden satunnaislukugeneraattoreiden avulla.

Samanlaisia ​​ongelmia vertailun objektiivisuuden varmistamisessa syntyy verrattaessa erilaisia ​​tuotannon organisointijärjestelmiä, palkitsemista, tarjouskilpailuja, ehdokkaita valittaessa avoimia paikkoja jne. Kaikkialla tarvitset arpajaisia ​​tai vastaavia menettelyjä.

Olkoon tarpeen tunnistaa vahvin ja toiseksi vahvin joukkue järjestettäessä turnausta olympiajärjestelmän mukaisesti (häviäjä putoaa). Oletetaan, että vahvempi joukkue voittaa aina heikomman. On selvää, että vahvimmasta joukkueesta tulee ehdottomasti mestari. Toiseksi vahvin joukkue pääsee finaaliin, jos ja vain, jos sillä ei ole pelejä tulevan mestarin kanssa ennen finaalia. Jos tällainen peli on suunniteltu, toiseksi vahvin joukkue ei pääse finaaliin. Turnauksen suunnittelija voi joko "pudottaa" turnauksesta toiseksi vahvimman joukkueen etuajassa, pudottamalla sen ensimmäisessä tapaamisessa johtajan kanssa, tai varmistaa sille toisen sijan varmistaen kohtaamiset heikompien joukkueiden kanssa finaaliin asti. Subjektiivisuuden välttämiseksi arpaa. 8 joukkueen turnauksessa todennäköisyys, että kaksi vahvinta joukkuetta kohtaavat finaalissa, on 4/7. Näin ollen todennäköisyydellä 3/7 toiseksi vahvin joukkue lähtee turnauksesta etuajassa.

Kaikissa tuoteyksiköiden mittauksissa (käyttäen jarrusatulaa, mikrometriä, ampeerimittaria jne.) on virheitä. Jotta saadaan selville, onko järjestelmässä virheitä, on tarpeen tehdä toistuvia mittauksia tuotantoyksiköstä, jonka ominaisuudet tunnetaan (esimerkiksi standardinäyte). On syytä muistaa, että systemaattisen virheen lisäksi on olemassa myös satunnainen virhe.

Siksi herää kysymys, miten mittaustuloksista saadaan selville, onko järjestelmässä virhe. Jos huomioidaan vain, onko seuraavan mittauksen aikana saatu virhe positiivinen vai negatiivinen, niin tämä ongelma voidaan vähentää jo harkittuun. Verrataan todellakin mittausta kolikon heittämiseen, positiivista virhettä - vaakunan menettämiseen, negatiivista - hilaan (nollavirhettä riittävällä määrällä asteikon jakoja ei tapahdu melkein koskaan). Tällöin systemaattisen virheen puuttumisen tarkistaminen vastaa kolikon symmetrian tarkistamista.

Joten järjestelmällisen virheen puuttumisen tarkistamisen ongelma rajoittuu kolikon symmetrian tarkistamisen ongelmaksi. Yllä oleva päättely johtaa niin sanottuun "merkkien kriteeriin" matemaattisessa tilastossa.

Matemaattisten tilastojen menetelmiin perustuvien teknisten prosessien tilastollisessa säätelyssä kehitetään prosessien tilastollisen valvonnan sääntöjä ja suunnitelmia, joiden tarkoituksena on havaita ajoissa teknisten prosessien häiriö ja ryhtyä toimenpiteisiin niiden säätämiseksi ja sellaisten tuotteiden vapautumisen estämiseksi, jotka eivät täytä asetettuja vaatimuksia. Näillä toimenpiteillä pyritään vähentämään tuotantokustannuksia ja huonolaatuisten tuotteiden toimittamisesta aiheutuvia menetyksiä. Tilastollisen hyväksynnän valvonnassa, joka perustuu matemaattisten tilastojen menetelmiin, laaditaan laadunvalvontasuunnitelmat analysoimalla näytteitä tuote-eristä. Vaikeus piilee siinä, että pystytään rakentamaan oikein todennäköisyys-tilastollisia päätöksentekomalleja. Matemaattisessa tilastossa tätä varten on kehitetty todennäköisyysmalleja ja menetelmiä hypoteesien testaamiseen, erityisesti hypoteeseihin, että viallisten tuotantoyksiköiden osuus on tietty määrä R 0 , Esimerkiksi, R 0 = 0,23 (muistakaa Strukovin sanat A. N. Tolstoin romaanista).

Arviointitehtävät. Useissa johtamis-, teollisissa, taloudellisissa, kansantaloudellisissa tilanteissa syntyy erityyppisiä ongelmia - ongelmia todennäköisyysjakaumien ominaisuuksien ja parametrien arvioinnissa.

Harkitse esimerkkiä. Päästä juhliin N sähkölamput Tästä erästä näyte n sähkölamput Useita luonnollisia kysymyksiä herää. Kuinka määrittää sähkölamppujen keskimääräinen käyttöikä näyteelementtien testaustulosten perusteella, millä tarkkuudella tämä ominaisuus voidaan arvioida? Miten tarkkuus muuttuu, jos otetaan suurempi näyte? Millä tuntimäärällä T on mahdollista taata, että vähintään 90 % sähkölampuista kestää T vai enemmän tunteja?

Oletetaan, että kun testataan näytettä tilavuudella n hehkulamput ovat viallisia X sähkölamput Mitä rajoja numerolle voidaan määrittää D vialliset sähkölamput erässä viallisuustason mukaan D/ N ja niin edelleen.?

Tai teknisten prosessien tarkkuuden ja stabiilisuuden tilastollisessa analyysissä on tarpeen arvioida sellaisia ​​laatuindikaattoreita kuin säädellyn parametrin keskiarvo ja sen leviämisaste tarkasteltavassa prosessissa. Todennäköisyysteorian mukaan on suositeltavaa käyttää sen matemaattista odotusta satunnaismuuttujan keskiarvona ja varianssia, keskihajontaa tai variaatiokerrointa hajauttamisen tilastollisena ominaisuutena. Herää kysymyksiä: kuinka arvioida nämä tilastolliset ominaisuudet näytetiedoista, millä tarkkuudella tämä voidaan tehdä?

Vastaavia esimerkkejä on monia. Tässä oli tärkeää näyttää, kuinka todennäköisyysteoriaa ja matemaattista tilastoa voidaan käyttää suunnittelu- ja johtamisongelmissa.

Nykyaikainen matemaattisen tilaston käsite. Matemaattisella tilastolla tarkoitetaan "matematiikan osaa, joka on omistettu matemaattisille menetelmille tilastotietojen keräämiseksi, systematisoimiseksi, käsittelemiseksi ja tulkitsemiseksi sekä niiden käyttämiseksi tieteellisiin tai käytännön johtopäätöksiin. Matemaattisen tilaston säännöt ja menettelytavat perustuvat todennäköisyysteoriaan, jonka avulla on mahdollista arvioida kussakin tehtävässä saatujen johtopäätösten tarkkuutta ja luotettavuutta käytettävissä olevan tilastoaineiston perusteella. Samaan aikaan tilastotiedolla tarkoitetaan tietoa missä tahansa enemmän tai vähemmän laajassa kokoelmassa olevien esineiden määrästä, joilla on tietyt ominaisuudet.

Ratkaistavien ongelmien tyypin mukaan matemaattiset tilastot jaetaan yleensä kolmeen osaan: tietojen kuvaus, estimointi ja hypoteesien testaus.

Käsiteltävän tilastotiedon tyypin mukaan matemaattiset tilastot on jaettu neljään alueeseen:

Yksiulotteinen tilasto (satunnaismuuttujien tilasto), jossa havainnon tulosta kuvataan reaaliluvulla;

Monimuuttujatilastollinen analyysi, jossa kohteen havainnoinnin tulosta kuvataan useilla numeroilla (vektorilla);

Satunnaisprosessien ja aikasarjojen tilastot, joissa havainnon tulos on funktio;

Luonteeltaan ei-numeeristen kohteiden tilastot, joissa havainnon tulos on luonteeltaan ei-numeerinen, esimerkiksi se on joukko (geometrinen kuvio), järjestys tai saatu mittauksen tuloksena kvalitatiivisella attribuutilla.

Historiallisesti ensimmäisinä ilmestyivät jotkin ei-numeeristen esineiden tilastoalueet (erityisesti viallisten tuotteiden prosenttiosuuden arvioinnin ja sitä koskevien hypoteesien testaamisen ongelmat) ja yksiulotteiset tilastot. Matemaattinen laitteisto on heille yksinkertaisempi, joten he yleensä osoittavat esimerkillään matemaattisen tilaston pääideat.

Vain ne tietojenkäsittelytavat, esim. matemaattiset tilastot ovat näyttöön perustuvia, jotka perustuvat relevanttien todellisten ilmiöiden ja prosessien todennäköisyysmalleihin. Puhumme kuluttajakäyttäytymismalleista, riskien esiintymisestä, teknisten laitteiden toiminnasta, kokeen tulosten saamisesta, sairauden kulusta jne. Todellisen ilmiön todennäköisyysmallia tulisi pitää rakennettuna, jos tarkasteltavat suureet ja niiden väliset suhteet ilmaistaan ​​todennäköisyysteorian avulla. Vastaavuus todellisuuden todennäköisyysmalliin, ts. sen riittävyyttä perustellaan erityisesti tilastollisilla hypoteesien testausmenetelmillä.

Uskomattomat tietojenkäsittelymenetelmät ovat tutkivia, niitä voidaan käyttää vain alustavassa tiedon analysoinnissa, koska niillä ei voida arvioida saatujen johtopäätösten tarkkuutta ja luotettavuutta rajallisen tilastoaineiston perusteella.

Probabilistisia ja tilastollisia menetelmiä voidaan soveltaa aina, kun on mahdollista rakentaa ja perustella todennäköisyysmalli ilmiöstä tai prosessista. Niiden käyttö on pakollista, kun otantatiedoista tehdyt johtopäätökset siirretään koko perusjoukolle (esimerkiksi näytteestä kokonaiseen tuoteerään).

Tietyillä sovellusalueilla käytetään sekä laajasti sovellettavia todennäköisyystilastollisia menetelmiä että erityisiä menetelmiä. Esimerkiksi tuotannonhallinnan tilastollisille tuotteiden laadunhallinnan menetelmille omistetussa osiossa käytetään sovellettua matemaattista tilastoa (mukaan lukien kokeiden suunnittelu). Sen menetelmien avulla tehdään tilastollinen analyysi teknisten prosessien tarkkuudesta ja stabiilisuudesta sekä tilastollinen laadun arviointi. Erityisiä menetelmiä ovat tuotteiden laadun tilastollisen hyväksynnän valvonnan menetelmät, teknisten prosessien tilastollinen säätely, luotettavuuden arviointi ja valvonta jne.

Tällaisia ​​sovellettavia todennäköisyysstatistiikan tieteenaloja kuten luotettavuusteoria ja jonoteoria ovat laajalti käytössä. Ensimmäisen sisältö selviää otsikosta, toinen käsittelee järjestelmien, kuten puhelinkeskuksen, tutkimusta, joka vastaanottaa puheluita satunnaisina aikoina - puhelimissaan numeroita valitsevien tilaajien vaatimuksia. Näiden vaatimusten palvelun kesto, ts. keskustelujen kestoa mallinnetaan myös satunnaismuuttujilla. Neuvostoliiton tiedeakatemian kirjeenvaihtajajäsen A.Ya antoi suuren panoksen näiden tieteenalojen kehittämiseen. Khinchin (1894-1959), Ukrainan SSR:n tiedeakatemian akateemikko B.V. Gnedenko (1912-1995) ja muut kotimaiset tiedemiehet.

Lyhyesti matemaattisen tilaston historiasta. Matemaattinen tilasto tieteenä alkaa kuuluisan saksalaisen matemaatikon Carl Friedrich Gaussin (1777-1855) teoksista, joka todennäköisyysteoriaan perustuen tutki ja perusteli pienimmän neliösumman menetelmää, jonka hän loi vuonna 1795 ja sovelsi tähtitieteellisen tiedon käsittelyyn (pieniplaneetan Ceresin kiertoradan tarkentamiseksi). Yksi suosituimmista todennäköisyysjakaumista, normaali, on usein nimetty hänen mukaansa, ja satunnaisprosessien teoriassa pääasiallinen tutkimuskohde on Gaussin prosessit.

XIX vuosisadan lopussa. - 1900-luvun alku. Englannin tutkijat, pääasiassa K. Pearson (1857-1936) ja R. A. Fisher (1890-1962), antoivat suuren panoksen matemaattisiin tilastoihin. Erityisesti Pearson kehitti khin neliötestin tilastollisten hypoteesien testaamiseen, ja Fisher kehitti varianssianalyysin, kokeiden suunnittelun teorian ja maksimitodennäköisyyden menetelmän parametrien arvioimiseksi.

1900-luvun 30-luvulla. Puolalainen Jerzy Neumann (1894-1977) ja englantilainen E. Pearson kehittivät yleisen teorian tilastollisten hypoteesien testaamisesta, ja Neuvostoliiton matemaatikot akateemikko A.N. Kolmogorov (1903-1987) ja Neuvostoliiton tiedeakatemian kirjeenvaihtaja N.V. Smirnov (1900-1966) loivat ei-parametrisen tilaston perustan. 1900-luvun 40-luvulla. Romanialainen A. Wald (1902-1950) rakensi johdonmukaisen tilastollisen analyysin teorian.

Matemaattiset tilastot kehittyvät tällä hetkellä nopeasti. Viimeisten 40 vuoden aikana voidaan siis erottaa neljä täysin uutta tutkimusaluetta:

Matemaattisten menetelmien kehittäminen ja käyttöönotto kokeiden suunnittelua varten;

Ei-numeeristen kohteiden tilastojen kehittäminen itsenäisenä suunnana sovelletussa matemaattisessa tilastossa;

Tilastollisten menetelmien kehittäminen, jotka kestävät pieniä poikkeamia käytetystä todennäköisyysmallista;

Tietojen tilastolliseen analysointiin suunniteltujen tietokoneohjelmistopakettien luomistyön laaja kehitys.

Todennäköisyysstatistiset menetelmät ja optimointi. Optimoinnin idea läpäisee nykyaikaiset sovelletut matemaattiset tilastot ja muut tilastolliset menetelmät. Nimittäin kokeiden suunnittelumenetelmät, tilastollinen hyväksyntävalvonta, teknisten prosessien tilastollinen ohjaus jne. Toisaalta päätösteorian optimointiformulaatiot, esimerkiksi sovellettu tuotteen laadun ja standardivaatimusten optimoinnin teoria, mahdollistavat todennäköisyys-tilastollisten menetelmien, ensisijaisesti sovelletun matemaattisen tilaston, laajan käytön.

Tuotannonohjauksessa erityisesti tuotteiden laatua ja standardivaatimuksia optimoitaessa on erityisen tärkeää soveltaa tilastollisia menetelmiä tuotteen elinkaaren alkuvaiheessa, ts. tutkimusvaiheessa kokeellisen suunnittelukehityksen valmistelu (lupaavien vaatimusten kehittäminen tuotteille, esisuunnittelu, kokeellisen suunnittelun kehittämistehtävä). Tämä johtuu tuotteen elinkaaren alkuvaiheessa saatavilla olevan tiedon rajallisuudesta ja tarpeesta ennustaa tulevaisuuden teknisiä mahdollisuuksia ja taloudellista tilannetta. Tilastollisia menetelmiä tulee soveltaa optimointiongelman ratkaisun kaikissa vaiheissa - muuttujia skaalattaessa, matemaattisia malleja kehitettäessä tuotteiden ja järjestelmien toimintaan, tehtäessä teknisiä ja taloudellisia kokeita jne.

Optimointiongelmissa, mukaan lukien tuotteiden laadun ja standardivaatimusten optimointi, käytetään kaikkia tilastointialueita. Nimittäin satunnaismuuttujien tilastot, monimuuttujatilastoanalyysi, satunnaisprosessien ja aikasarjojen tilastot, ei-numeeristen objektien tilastot. Suosituksia tilastollisen menetelmän valinnasta tiettyjen tietojen analysointiin on laadittu.

Johdanto

2. Matemaattisen tilaston peruskäsitteet

2.1 Otannan peruskäsitteet

2.2 Näytteenotto

2.3 Empiirinen jakaumafunktio, histogrammi

Johtopäätös

Bibliografia

Johdanto

Matemaattinen tilasto on tiedettä matemaattisista menetelmistä systematisoida ja käyttää tilastotietoja tieteellisten ja käytännön johtopäätösten tekemiseen. Matemaattiset tilastot perustuvat monilla aloillaan todennäköisyysteoriaan, jonka avulla voidaan arvioida rajallisesta tilastoaineistosta tehtyjen johtopäätösten luotettavuutta ja tarkkuutta (esimerkiksi arvioida tarvittava otoskoko, jotta saadaan vaaditun tarkkuuden tulokset otantatutkimuksessa).

Todennäköisyysteoriassa otetaan huomioon tietyn jakauman satunnaismuuttujat tai satunnaiskokeet, joiden ominaisuudet tunnetaan täysin. Todennäköisyysteorian aiheena ovat näiden suureiden (jakaumien) ominaisuudet ja suhteet.

Mutta usein koe on musta laatikko, joka antaa vain joitain tuloksia, joiden mukaan on tehtävä johtopäätös itse kokeen ominaisuuksista. Tarkkailijalla on joukko numeerisia (tai ne voidaan tehdä numeerisiksi) tuloksia, jotka on saatu toistamalla sama satunnaiskoe samoissa olosuhteissa.

Tässä tapauksessa herää esimerkiksi seuraavat kysymykset: Jos tarkkailemme yhtä satunnaismuuttujaa, kuinka voimme tehdä tarkimman johtopäätöksen sen jakautumisesta sen arvojoukosta useissa kokeissa?

Esimerkki tällaisesta koesarjasta on sosiologinen tutkimus, joukko taloudellisia indikaattoreita tai lopuksi vaakuna- ja häntäsarja tuhannen kolikonheiton aikana.

Kaikki edellä mainitut tekijät johtavat merkityksellisyys ja työaiheen tärkeys nykyisessä vaiheessa, tavoitteena matemaattisen tilaston peruskäsitteiden syvällinen ja kattava tutkiminen.

Tältä osin tämän työn tarkoituksena on systematisoida, kerätä ja lujittaa tietoa matemaattisen tilaston käsitteistä.

1. Matemaattisen tilaston aihe ja menetelmät

Matemaattinen tilastotiede on tiedettä matemaattisista menetelmistä massahavaintojen (mittausten, kokeiden) aikana saadun tiedon analysoimiseksi. Havaintotulosten matemaattisesta luonteesta riippuen matemaattiset tilastot jaetaan lukutilastoihin, monimuuttujatilastoanalyysiin, funktioiden (prosessien) ja aikasarjojen analysointiin sekä ei-numeeristen kohteiden tilastoihin. Merkittävä osa matemaattisista tilastoista perustuu todennäköisyysmalleihin. Varaa yhteiset tehtävät tietojen kuvaus, estimointi ja hypoteesien testaus. He harkitsevat myös tarkempia tehtäviä, jotka liittyvät otantatutkimusten tekemiseen, riippuvuuksien palauttamiseen, luokittelujen (typologioiden) rakentamiseen ja käyttöön.

Tietojen kuvaamiseksi rakennetaan taulukoita, kaavioita ja muita visuaalisia esityksiä, esimerkiksi korrelaatiokenttiä. Todennäköisyysmalleja ei yleensä käytetä. Jotkut tietojen kuvausmenetelmät perustuvat kehittyneeseen teoriaan ja nykyaikaisten tietokoneiden ominaisuuksiin. Näitä ovat erityisesti klusterianalyysi, jolla pyritään tunnistamaan keskenään samankaltaisia ​​esineryhmiä, sekä moniulotteinen skaalaus, joka mahdollistaa kohteiden visualisoinnin tasossa vääristäen niiden välisiä etäisyyksiä vähiten.

Estimointi- ja hypoteesitestausmenetelmät perustuvat todennäköisyyspohjaisiin tiedonmuodostusmalleihin. Nämä mallit on jaettu parametrisiin ja ei-parametrisiin. Parametrisissa malleissa oletetaan, että tutkittavat kohteet kuvataan jakautumisfunktioilla, jotka riippuvat pienestä määrästä (1-4) numeerisia parametreja. Ei-parametrisissa malleissa jakaumafunktioiden oletetaan olevan mielivaltaisia ​​jatkuvia. Matemaattisessa tilastossa jakauman parametrit ja ominaisuudet (matemaattinen odotus, mediaani, varianssi, kvantiilit jne.), tiheydet ja jakauman funktiot, muuttujien väliset riippuvuudet (perustuu lineaarisiin ja ei-parametrisiin korrelaatiokertoimiin sekä funktioiden parametriset tai ei-parametriset estimaatit, jotka ilmaisevat todellisia arvoja.) estimaatteja käytetään.

Matemaattisessa tilastossa yleinen teoria hypoteesien testaus ja iso luku tiettyjen hypoteesien testaamiseen tarkoitetut menetelmät. Hypoteeseja tarkastellaan parametrien ja ominaisuuksien arvoista, homogeenisuuden tarkistamisesta (eli ominaisuuksien tai jakautumisfunktioiden yhteensopivuudesta kahdessa näytteessä), empiirisen jakaumafunktion yhteensopivuudesta tietyn jakaumafunktion tai tällaisten funktioiden parametriperheen kanssa, jakauman symmetriasta jne.

Erittäin tärkeä on otantatutkimusten tekemiseen liittyvä matemaattisen tilaston osio, jossa on erilaisten otantajärjestelmien ominaisuudet ja sopivien menetelmien rakentaminen hypoteesien arvioimiseen ja testaamiseen.

Riippuvuuden palautumisongelmia on tutkittu aktiivisesti yli 200 vuoden ajan siitä lähtien, kun K. Gauss kehitti pienimmän neliösumman menetelmän vuonna 1794. Tällä hetkellä merkityksellisimpiä ovat menetelmät, joilla etsitään informatiivista muuttujien osajoukkoa ja ei-parametriset menetelmät.

Menetelmien kehittäminen datan approksimaatioon ja kuvausulottuvuuden pienentämiseen aloitettiin yli 100 vuotta sitten, kun K. Pearson loi pääkomponenttimenetelmän. Myöhemmin kehitettiin tekijäanalyysi ja lukuisia epälineaarisia yleistyksiä.

Erilaisia ​​luokittelujen (typologioiden) konstruointimenetelmiä (klusterianalyysi), analysointia ja käyttöä (diskriminanttianalyysi) kutsutaan myös muodontunnistuksen menetelmiksi (opettajan kanssa ja ilman), automaattiseksi luokitteluksi jne.

Matemaattiset menetelmät tilastoissa perustuvat joko summien käyttöön (perustuu todennäköisyysteorian keskirajalauseeseen) tai eroindikaattoreihin (etäisyydet, metriikka), kuten ei-numeeristen kohteiden tilastoissa. Yleensä vain asymptoottiset tulokset perustellaan tiukasti. Nykyään tietokoneilla on suuri rooli matemaattisissa tilastoissa. Niitä käytetään sekä laskelmissa että simulaatiomallinnuksessa (erityisesti näytteenottomenetelmissä ja asymptoottisten tulosten soveltuvuuden tutkimisessa).

Matemaattisen tilaston peruskäsitteet

2.1 Otantamenetelmän peruskäsitteet

Antaa olla satunnaismuuttuja havaittu satunnaisessa kokeessa. Oletetaan, että todennäköisyysavaruus on annettu (eikä kiinnosta meitä).

Oletetaan, että suoritettuamme tämän kokeen kerran samoissa olosuhteissa, saimme luvut , , , - tämän satunnaismuuttujan arvot ensimmäisessä, toisessa jne. kokeiluja. Satunnaismuuttujalla on jokin jakauma , joka on meille osittain tai kokonaan tuntematon.

Tarkastellaanpa lähemmin näytteeksi kutsuttua joukkoa.

Jo suoritettujen kokeiden sarjassa näyte on joukko numeroita. Mutta jos tämä koesarja toistetaan uudelleen, tämän joukon sijasta saamme uuden numerosarjan. Numeron sijaan ilmestyy toinen numero - yksi satunnaismuuttujan arvoista. Eli (ja , ja jne.) - muuttuja, joka voi saada samat arvot kuin satunnaismuuttuja ja yhtä usein (samalla todennäköisyydellä). Siksi ennen koetta - satunnaismuuttuja, joka jakautuu tasaisesti :n kanssa, ja kokeen jälkeen - luku, jonka havaitsemme tässä ensimmäisessä kokeessa, ts. yksi satunnaismuuttujan mahdollisista arvoista.

Tilavuusnäyte on joukko riippumattomia ja tasaisesti jakautuneita satunnaismuuttujia ("kopioita"), joilla on jakauma, kuten ja .

Mitä tarkoittaa "otoksen perusteella tehdä johtopäätös jakautumisesta"? Jakaumaa luonnehtii jakautumisfunktio, tiheys tai taulukko, joukko numeeriset ominaisuudet- , , jne. Otoksen perusteella on kyettävä rakentamaan approksimaatiot kaikille näille ominaisuuksille.

.2 Näytteenotto

Harkitse otoksen toteuttamista yhdelle perustulokselle - numerosarjalle , , . Sopivaan todennäköisyysavaruuteen otamme käyttöön satunnaismuuttujan, joka ottaa arvot, , todennäköisyyksillä in (jos osa arvoista osuu yhteen, lisäämme todennäköisyydet vastaavan määrän kertoja). Todennäköisyysjakaumataulukko ja satunnaismuuttujan jakaumafunktio näyttävät tältä:

Suuren jakautumista kutsutaan empiiriseksi tai näytejakaumaksi. Lasketaan suuren matemaattinen odotus ja varianssi ja otetaan käyttöön näiden suureiden merkintä:

Samalla tavalla laskemme tilaushetken

Yleisessä tapauksessa merkitsemme määrää

Jos konstruoitaessa kaikkia esittämiämme ominaisuuksia, katsomme otosta , , satunnaismuuttujien joukoksi, niin näistä ominaisuuksista itsestään - , , , , - tulee satunnaismuuttujia. Näitä otosjakauman ominaisuuksia käytetään arvioimaan (likimääräisesti) todellisen jakauman vastaavat tuntemattomat ominaisuudet.

Syy jakauman ominaisuuksien käyttämiseen todellisen jakauman (tai ) ominaisuuksien arvioimiseen on näiden jakaumien läheisyys suurille .

Harkitse esimerkiksi tavallisen nopan heittämistä. Antaa - pisteiden määrä, jotka putosivat -. heitolla, . Oletetaan, että yksi otoksesta esiintyy kerran, kaksi esiintyy kerran ja niin edelleen. Sitten satunnaismuuttuja ottaa arvot 1 , , 6 vastaavasti todennäköisyyksillä , . Mutta nämä kasvusuhteet lähestyvät lain mukaan suuria lukuja. Toisin sanoen suuruusjakauma jossain mielessä lähestyy niiden pisteiden todellista jakautumista, jotka putoavat, kun oikeaa noppaa heitetään.

Emme täsmennä, mitä otoksen läheisyydellä ja todellisilla jakaumilla tarkoitetaan. Seuraavissa kappaleissa tarkastellaan lähemmin jokaista edellä esiteltyä ominaisuutta ja tarkastellaan sen ominaisuuksia, mukaan lukien sen käyttäytyminen otoskoon kasvaessa.

.3 Empiirinen jakaumafunktio, histogrammi

Koska tuntematonta jakaumaa voidaan kuvata esimerkiksi sen jakaumafunktiolla, rakennamme otoksesta "estimaation" tälle funktiolle.

Määritelmä 1.

Kutsutaan tilavuusnäytteeseen rakennettua empiiristä jakaumafunktiota satunnainen toiminto, jokaiselle yhtäläiselle

Muistutus: satunnainen toiminto

kutsutaan tapahtuman indikaattoriksi. Jokaiselle tämä on satunnaismuuttuja, jolla on Bernoulli-jakauma parametrilla . Miksi?

Toisin sanoen millä tahansa arvolla, joka on yhtä suuri kuin satunnaismuuttujan todellinen todennäköisyys, on pienempi kuin , otoselementtien osuus on arvioitu.

Jos otoselementit , , lajitellaan nousevaan järjestykseen (jokaisella perustuloksella), saadaan uusi satunnaismuuttujien joukko, jota kutsutaan variaatiosarjaksi:

Elementtiä , kutsutaan variaatiosarjan :nneksi jäseneksi tai :nnen kertaluvun tilastoksi .

Esimerkki 1

Näyte:

Muutosrivi:

Riisi. 1. Esimerkki 1

Empiirisessä jakaumafunktiossa on hyppyjä näytepisteissä, hyppyarvo pisteessä on , missä on otoselementtien lukumäärä, jotka vastaavat .

Variaatiosarjalle on mahdollista rakentaa empiirinen jakaumafunktio:

Toinen jakauman ominaisuus on taulukko (diskreeteille jakaumille) tai tiheys (absoluuttisesti jatkuville jakaumille). Taulukon tai tiheyden empiirinen eli valikoiva analogi on ns. histogrammi.

Histogrammi perustuu ryhmiteltyihin tietoihin. Satunnaismuuttujan arvioitu arvoalue (tai näytedatan alue) jaetaan otoksesta riippumatta tiettyyn määrään intervalleja (ei välttämättä samoja). Olkoon , , rivin intervalleja, joita kutsutaan ryhmittelyväleiksi . Merkitään väliin kuuluvien näyteelementtien lukumäärällä:

(1)

Jokaiselle välille rakennetaan suorakulmio, jonka pinta-ala on verrannollinen. Kaikkien suorakulmioiden kokonaispinta-alan on oltava yhtä suuri kuin yksi. Antaa olla välin pituus. Yllä olevan suorakulmion korkeus on

Saatua kuvaa kutsutaan histogrammiksi.

Esimerkki 2

Saatavilla variaatiosarja(katso esimerkki 1):

Tässä on siis desimaalilogaritmi, ts. kun otos kaksinkertaistetaan, ryhmittelyvälien määrä kasvaa yhdellä. Huomaa, että mitä enemmän ryhmittelyvälejä, sitä parempi. Mutta jos otamme aikavälien lukumäärän, esimerkiksi luokkaa , niin kasvun myötä histogrammi ei lähesty tiheyttä.

Seuraava väite pitää paikkansa:

Jos näyteelementtien jakautumistiheys on jatkuva funktio, niin sillä niin, että histogrammin todennäköisyydellä on pisteittäinen konvergenssi tiheyteen.

Joten logaritmin valinta on järkevä, mutta ei ainoa mahdollinen.

Johtopäätös

Matemaattinen (tai teoreettinen) tilasto perustuu todennäköisyysteorian menetelmiin ja käsitteisiin, mutta tietyssä mielessä se ratkaisee käänteisiä ongelmia.

Jos havaitsemme kahden (tai useamman) merkin samanaikaisen ilmentymisen, ts. meillä on joukko useiden satunnaismuuttujien arvoja - mitä voidaan sanoa niiden riippuvuudesta? Onko hän siellä vai ei? Ja jos on, mikä tämä riippuvuus on?

Usein on mahdollista tehdä joitain oletuksia "mustaan ​​laatikkoon" piilotetusta jakaumasta tai sen ominaisuuksista. Tässä tapauksessa kokeellisten tietojen mukaan on vahvistettava tai kumottava nämä oletukset ("hypoteesit"). Samalla on muistettava, että vastaus "kyllä" tai "ei" voidaan antaa vain tietyllä varmuudella, ja mitä kauemmin voimme jatkaa kokeilua, sitä tarkempia johtopäätöksiä voidaan tehdä. Suotuisin tilanne tutkimukselle on, kun voi varmuudella väittää havaitun kokeen tietyt ominaisuudet - esimerkiksi toiminnallinen riippuvuus havaittujen suureiden välillä, jakauman normaalista, sen symmetriasta, tiheyden esiintymisestä jakaumassa tai sen diskreetistä luonteesta jne.

Joten on järkevää muistaa (matemaattiset) tilastot, jos

on sattumanvarainen koe, jonka ominaisuuksia ei tunneta osittain tai kokonaan,

Pystymme toistamaan tämän kokeen samoissa olosuhteissa muutaman (tai paremmin minkä tahansa) määrän.

Bibliografia

1. Baumol U. Talousteoria ja toimintatutkimus. – M.; Tiede, 1999.

2. Bolshev L.N., Smirnov N.V. Matemaattisten tilastojen taulukot. Moskova: Nauka, 1995.

3. Borovkov A.A. Matemaattiset tilastot. Moskova: Nauka, 1994.

4. Korn G., Korn T. Matematiikan käsikirja tutkijoille ja insinööreille. - Pietari: Lan Publishing House, 2003.

5. Korshunov D.A., Chernova N.I. Kokoelma matemaattisten tilastojen tehtäviä ja harjoituksia. Novosibirsk: Matematiikan instituutin kustantamo. S.L. Sobolev SB RAS, 2001.

6. Peheletsky I.D. Matematiikka: oppikirja opiskelijoille. - M.: Akatemia, 2003.

7. Sukhodolsky V.G. Luennot päällä korkeampaa matematiikkaa humanistisia tieteitä varten. - St. Petersburg Publishing House of St. Petersburg valtion yliopisto. 2003

8. Feller V. Johdatus todennäköisyysteoriaan ja sen sovelluksiin. - M.: Mir, T.2, 1984.

9. Harman G., Moderni tekijäanalyysi. - M.: Tilastot, 1972.


Harman G., Moderni tekijäanalyysi. - M.: Tilastot, 1972.