Математикалық статистика пәні. Белгісіздіктерді сипаттаудың ықтималдық-статистикалық әдістерінің негіздері Математикалық статистиканың пәні мен әдістері

Математикалық статистика «статистикалық деректерді жинаудың, жүйелеудің, өңдеудің және түсіндірудің, сондай-ақ оларды ғылыми немесе практикалық қорытындылар үшін пайдаланудың математикалық әдістеріне арналған математиканың бөлімі» деп түсініледі. Математикалық статистиканың ережелері мен процедуралары ықтималдық теориясына негізделген, бұл қолда бар мәліметтерге сүйене отырып, әрбір есеп бойынша алынған қорытындылардың дұрыстығы мен сенімділігін бағалауға мүмкіндік береді. статистикалық материал» . Сонымен қатар, статистикалық деректер белгілі бір сипаттамаларға ие кез келген азды-көпті жинақтағы объектілердің саны туралы ақпаратты білдіреді.

Шешілетін есептердің түріне сәйкес математикалық статистика әдетте үш бөлімге бөлінеді: деректерді сипаттау, бағалау және гипотезаны тексеру.

Өңделетін статистикалық деректер түріне қарай математикалық статистика төрт салаға бөлінеді:

— бір өлшемді статистика (статистика кездейсоқ айнымалылар), онда бақылау нәтижесі сипатталады нақты сан;

- объектіні бақылау нәтижесі бірнеше сандармен (вектормен) сипатталатын көпөлшемді статистикалық талдау;

- статистика кездейсоқ процестержәне бақылау нәтижесі функция болатын уақытша қатарлар;

— бақылау нәтижесі сандық емес сипатта болатын объектілердің статистикасы, мысалы, жиынтық ( геометриялық фигура), тапсырыс беру немесе сапалық негізде өлшеу нәтижесінде алынған.

Тарихи тұрғыдан сандық емес сипаттағы объектілер статистикасының кейбір бағыттары (атап айтқанда, ақаулы өнімдердің пайызын бағалау және ол туралы гипотезаларды тексеру мәселелері) және бір өлшемді статистика бірінші болып пайда болды. Математикалық аппарат олар үшін қарапайым, сондықтан олар өз мысалдарымен әдетте математикалық статистиканың негізгі идеяларын көрсетеді.

Тек деректерді өңдеудің сол әдістері, яғни. Математикалық статистика - нақты құбылыстар мен процестердің ықтималдық үлгілеріне негізделген дәлелді деректер. Біз тұтынушылардың мінез-құлқының модельдері, тәуекелдердің пайда болуы, технологиялық жабдықтың жұмыс істеуі, эксперимент нәтижелерін алу, аурудың ағымы және т.б. Нақты құбылыстың ықтималдық моделі, егер қарастырылатын шамалар мен олардың арасындағы байланыстар ықтималдықтар теориясы тұрғысынан өрнектелсе, құрастырылған деп санау керек.

Шындықтың ықтималдық моделіне сәйкестік, яғни. оның сәйкестігі, атап айтқанда, гипотезаларды тексерудің статистикалық әдістерінің көмегімен негізделеді.

Деректерді өңдеудің керемет әдістері барлау болып табылады, оларды тек алдын ала деректерді талдау кезінде қолдануға болады, өйткені олар шектеулі статистикалық материалдар негізінде алынған қорытындылардың дәлдігі мен сенімділігін бағалауға мүмкіндік бермейді.

Ықтималдық және статистикалық әдістерқұбылыстың немесе процестің ықтималдық моделін құру және негіздеу мүмкіндігі бар жерде қолданылады. Іріктеме деректерінен жасалған қорытындылар бүкіл жиынтыққа (мысалы, үлгіден өнімнің бүкіл партиясына) тасымалданған кезде оларды пайдалану міндетті болып табылады.

Қолданудың нақты салаларында кең қолданудың ықтималдық-статистикалық әдістері де, нақтылары да қолданылады. Мысалы, өнім сапасын басқарудың статистикалық әдістеріне арналған өндірісті басқару бөлімінде қолданбалы математикалық статистика (тәжірибелерді жобалауды қоса) қолданылады. Оның әдістерінің көмегімен технологиялық процестердің дәлдігі мен тұрақтылығына статистикалық талдау және сапаны статистикалық бағалау жүргізіледі. Нақты әдістерге өнім сапасын статистикалық қабылдау бақылау әдістері, технологиялық процестерді статистикалық реттеу, сенімділікті бағалау және бақылау және т.б.

Сенімділік теориясы және кезек теориясы сияқты қолданбалы ықтималдық-статистикалық пәндер кеңінен қолданылады. Олардың біріншісінің мазмұны тақырыптан түсінікті болса, екіншісі кездейсоқ уақытта қоңырауларды қабылдайтын телефон станциясы сияқты жүйелерді - абоненттердің өз телефондарына нөмір теретін талаптарын зерттеумен айналысады. Осы талаптардың қызмет көрсету ұзақтығы, яғни. әңгімелесу ұзақтығы да кездейсоқ айнымалылар арқылы модельденеді. Бұл пәндердің дамуына үлкен үлес қосты КСРО Ғылым академиясының корреспондент-мүшесі А.Я. Хинчин (1894-1959), Украина КСР Ғылым академиясының академигі Б.В.Гнеденко (1912-1995) және басқа да отандық ғалымдар болды.

Кездейсоқ құбылыстар саласындағы әрбір зерттеу әрқашан эксперименттен, эксперименттік деректерден тұрады. Қандай да бір объектінің қандай да бір белгісін зерттеу кезінде жиналатын сандық мәліметтер деп аталады статистикалық. Статистикалық мәліметтер зерттеудің бастапқы материалы болып табылады. Олардың ғылыми немесе практикалық маңызы болуы үшін математикалық статистика әдістерімен өңделуі керек.

Математикалық статистика- Бұл ғылыми пән, оның пәні жаппай кездейсоқ құбылыстарды бақылау нәтижесінде алынған статистикалық эксперименттік мәліметтерді тіркеу, сипаттау және талдау әдістерін жасау болып табылады.

Математикалық статистиканың негізгі міндеттері:

    кездейсоқ шаманың немесе кездейсоқ шамалар жүйесінің таралу заңын анықтау;

    гипотезалардың орындылығын тексеру;

    белгісіз таралу параметрлерін анықтау.

Математикалық статистиканың барлық әдістері ықтималдық теориясына негізделген. Бірақ шешілетін есептердің ерекшелігіне байланысты математикалық статистика ықтималдық теориясынан дербес салаға бөлінеді. Егер ықтималдық теориясында құбылыстың моделі берілген деп есептелсе және осы құбылыстың мүмкін болатын нақты барысы есептелсе (1-сурет), онда математикалық статистикада статистикалық мәліметтер негізінде сәйкес ықтималдық моделі таңдалады (2-сурет).

1-сурет. Ықтималдықтар теориясының жалпы мәселесі

2-сурет. Математикалық статистиканың жалпы мәселесі

Ғылыми пән ретінде математикалық статистика ықтималдық теориясымен бірге дамыды. Бұл ғылымның математикалық аппараты 19 ғасырдың екінші жартысында салынған.

2. Жалпы жиынтық және іріктеу.

Статистикалық әдістерді зерттеу үшін жалпы және таңдамалы популяция ұғымдары енгізіледі. Жалпы, астында жалпы халықтарату функциясы бар X кездейсоқ шама ретінде түсініледі
. Таңдамалы жиын немесе берілген X кездейсоқ шамасына арналған n көлемінің үлгісі жиын болып табылады
осы шаманың тәуелсіз бақылаулары, мұнда таңдама мәні немесе Х кездейсоқ шамасының жүзеге асуы деп аталады. Осылайша, сандар (тәжірибе жүргізілсе және үлгі алынған болса) және кездейсоқ шама (тәжірибеге дейін) ретінде қарастырылуы мүмкін, өйткені олар үлгіден үлгіге дейін өзгереді.

1-мысал. Ағаш діңінің қалыңдығының биіктігіне тәуелділігін анықтау үшін 200 ағаш таңдалды. Бұл жағдайда таңдау көлемі n=200 болады.

2-мысалДөңгелек арадағы бөлшектер тақталарын аралау нәтижесінде нақты кесу жұмысының 15 мәні алынды. Бұл жағдайда n=15.

D
Іріктеме деректері бойынша бізді қызықтыратын жалпы топтаманың ерекшелігін сенімді түрде бағалау үшін таңдаманың объектілері оны дұрыс көрсетуі керек, яғни таңдама болуы керек өкілі(өкіл). Іріктеменің репрезентативтілігіне әдетте объектілерді кездейсоқ іріктеу арқылы қол жеткізіледі: жалпы жиынтықтың әрбір объектісі басқаларымен бірге іріктеуге қосылудың тең ықтималдығымен қамтамасыз етіледі.

3-сурет. Үлгінің репрезентативтілігін көрсету


Мазмұны.

1. Кіріспе:
- Ықтималдық пен математикалық статистика қалай қолданылады? - 2 бет
- «Математикалық статистика» дегеніміз не? - 3 бет
2) Ықтималдық теориясы мен математикалық статистиканы қолдану мысалдары:
- Таңдау. - 4 бет
- Бағалау тапсырмалары. – 6 бет
- Ықтималдық-статистикалық әдістер және оңтайландыру. – 7 бет
3) Қорытынды.

Кіріспе.

Ықтималдық пен математикалық статистика қалай қолданылады? Бұл пәндер ықтималдық-статистикалық шешім қабылдау әдістерінің негізі болып табылады. Олардың математикалық аппаратын пайдалану үшін ықтималдық-статистикалық модельдер арқылы шешім қабылдау есептерін өрнектеу қажет. Нақты ықтималдық-статистикалық шешім қабылдау әдісін қолдану үш кезеңнен тұрады:
- экономикалық, басқарушылық, технологиялық шындықтан абстрактілі математикалық-статистикалық схемаға көшу, яғни. басқару жүйесінің, технологиялық процестің, шешім қабылдау процедурасының, атап айтқанда статистикалық бақылау нәтижелерінің негізінде ықтималдық моделін құру және т.б.
- ықтималдық модель шеңберінде таза математикалық құралдармен есептеулер жүргізу және қорытындылар алу;
- нақты жағдайға байланысты математикалық-статистикалық қорытындыларды түсіндіру және тиісті шешім қабылдау (мысалы, өнім сапасының белгіленген талаптарға сәйкестігі немесе сәйкессіздігі, технологиялық процесті түзету қажеттілігі және т.б. туралы), атап айтқанда, қорытындылар (сериядағы ақаулы бірліктердің үлесі туралы, бақылаудың нақты түрі бойынша технологиялық процестің параметрлері бойынша).

Математикалық статистика ықтималдықтар теориясының ұғымдарын, әдістерін және нәтижелерін пайдаланады. Экономикалық, басқарушылық, технологиялық және басқа жағдайларда шешім қабылдаудың ықтималдық үлгілерін құрудың негізгі мәселелерін қарастырайық. Шешім қабылдаудың ықтималдық-статистикалық әдістері бойынша нормативтік-техникалық және нұсқаулық-әдістемелік құжаттарды белсенді және дұрыс пайдалану үшін алдын ала білім қажет. Сонымен, сол немесе басқа құжат қандай жағдайларда қолданылуы керек, оны таңдау және қолдану үшін қандай бастапқы ақпарат болуы керек, деректерді өңдеу нәтижелері бойынша қандай шешімдер қабылдау керек және т.б.

«Математикалық статистика» дегеніміз не? Математикалық статистика «статистикалық деректерді жинаудың, жүйелеудің, өңдеудің және түсіндірудің, сондай-ақ оларды ғылыми немесе практикалық қорытындылар үшін пайдаланудың математикалық әдістеріне арналған математиканың бөлімі» деп түсініледі. Математикалық статистиканың ережелері мен процедуралары ықтималдық теориясына негізделген, бұл қолда бар статистикалық материал негізінде әрбір мәселе бойынша алынған қорытындылардың дәлдігі мен сенімділігін бағалауға мүмкіндік береді. Сонымен қатар, статистикалық деректер белгілі бір сипаттамаларға ие кез келген азды-көпті жинақтағы объектілердің саны туралы ақпаратты білдіреді.

Шешілетін есептердің түріне сәйкес математикалық статистика әдетте үш бөлімге бөлінеді: деректерді сипаттау, бағалау және гипотезаны тексеру.

Өңделетін статистикалық деректер түріне қарай математикалық статистика төрт салаға бөлінеді:

Бақылау нәтижесі нақты санмен сипатталатын бір өлшемді статистика (кездейсоқ шамалар статистикасы);

Көп өлшемді статистикалық талдау, мұнда объектіні бақылау нәтижесі бірнеше сандармен (вектор) сипатталады;

Кездейсоқ процестер мен уақыт қатарларының статистикасы, мұнда бақылау нәтижесі функция болып табылады;

Бақылау нәтижесі сандық емес сипатта болатын, мысалы, жиынтық (геометриялық фигура), реттілік немесе сапалық атрибут бойынша өлшеу нәтижесінде алынған объектілердің сандық емес сипаттағы статистикасы.

Ықтималдықтар теориясы мен математикалық статистиканы қолдану мысалдары.
Ықтималдық-статистикалық модельдер басқарушылық, өндірістік, экономикалық және ұлттық экономикалық мәселелерді шешудің жақсы құралы болып табылатын бірнеше мысалдарды қарастырайық. Мәселен, мысалы, лот ретінде пайдаланылатын монета «симметриялы» болуы керек, яғни. оны лақтырған кезде орта есеппен жарты жағдайда елтаңба, ал жартысында тор (құйрық, сан) түсуі керек. Бірақ «орташа» деген нені білдіреді? Егер сіз әр серияда 10 лақтырылатын көптеген серияларды өткізсеңіз, онда монета елтаңбамен 4 рет түсіп кететін сериялар жиі болады. Симметриялық монета үшін бұл серияның 20,5% -ында болады. Ал егер 100 000 лақтыру үшін 40 000 елтаңба болса, монетаны симметриялы деп санауға бола ма? Шешім қабылдау процедурасы ықтималдық теориясы мен математикалық статистикаға негізделген.

Қарастырылып отырған мысал жеткілікті маңызды емес болып көрінуі мүмкін. Алайда олай емес. Өнеркәсіптік техникалық-экономикалық тәжірибелерді ұйымдастыруда, мысалы, әртүрлі технологиялық факторларға (сақтау ортасының әсері, мойынтіректерді өлшеуге дейін дайындау әдістері, өлшеу процесіндегі мойынтірек жүктемесінің әсері және т. Подшипниктердің сапасын әртүрлі консервіленген майларда сақтау нәтижелеріне байланысты салыстыру қажет делік, яғни. А және В құрамды майларда. Мұндай тәжірибені жоспарлағанда, қандай подшипниктер май құрамында А, ал қайсысын - мұнай құрамында В, бірақ субъективтілікті болдырмайтын және шешімнің объективтілігін қамтамасыз ететіндей етіп орналастыру керек деген сұрақ туындайды.

Үлгі
Бұл сұрақтың жауабын жеребе тарту арқылы алуға болады. Осыған ұқсас мысалды кез келген өнімнің сапасын бақылау арқылы келтіруге болады. Өнімнің тексерілген партиясы белгіленген талаптарға сәйкес келетіндігін анықтау үшін одан сынама алынады. Үлгіні бақылау нәтижелері бойынша бүкіл партия туралы қорытынды жасалады. Бұл жағдайда үлгіні қалыптастыруда субъективтілікке жол бермеу өте маңызды, яғни бақыланатын партиядағы өнімнің әрбір бірлігі үлгіде іріктелу ықтималдығы бірдей болуы қажет. Өндіріс жағдайында іріктеудегі өнім бірліктерін таңдау әдетте лот бойынша емес, кездейсоқ сандардың арнайы кестелері бойынша немесе компьютерлік кездейсоқ сандар генераторларының көмегімен жүзеге асырылады.
Салыстырудың объективтілігін қамтамасыз етудің ұқсас мәселелері өндірісті ұйымдастырудың әртүрлі схемаларын салыстыру, еңбекақы төлеу, конкурстар мен конкурстарды өткізу, бос лауазымдарға үміткерлерді таңдау және т.б. Барлық жерде лотерея немесе ұқсас процедуралар қажет. Олимпиадалық жүйе бойынша турнирді ұйымдастыруда ең күшті және екінші күшті команданы анықтау мысалында түсіндіріп көрейік (жеңілген адам шығарылады). Күшті команда әрқашан әлсізді жеңе берсін. Мықты команда міндетті түрде чемпион болатыны анық. Екінші мықты команда финалға дейін болашақ чемпионмен ойыны болмаған жағдайда ғана финалға шығады. Егер мұндай ойын жоспарланса, екінші мықты команда финалға шықпайды. Турнирді жоспарлаған адам турнирден ең күшті екінші команданы мерзімінен бұрын «нокаутқа түсіріп», көшбасшымен бірінші кездесуде оны түсіре алады немесе финалға дейін әлсіз командалармен кездесуді қамтамасыз ете отырып, екінші орынды қамтамасыз ете алады. Субъективтілікке жол бермеу үшін жеребе тартыңыз. 8 командалық турнир үшін екі мықты команданың финалда кездесу ықтималдығы 4/7 құрайды. Сәйкесінше, 3/7 ықтималдығымен екінші мықты команда турнирден мерзімінен бұрын кетеді.
Өнім бірліктерін кез келген өлшеуде (штангенциркуль, микрометр, амперметр және т.б. пайдалану) қателер болады. Жүйелі қателердің бар-жоғын анықтау үшін сипаттамалары белгілі (мысалы, стандартты үлгі) өнім бірлігін қайталап өлшеу қажет. Жүйелі қателіктен басқа кездейсоқ қате де болатынын есте ұстаған жөн.

Сондықтан өлшеу нәтижелерінен жүйелі қателік бар-жоғын қалай анықтауға болады деген сұрақ туындайды. Келесі өлшеу кезінде алынған қатенің оң немесе теріс екенін ғана ескерсек, онда бұл мәселені алдыңғыға дейін азайтуға болады. Шынында да, өлшеуді монета лақтырумен, оң қатені - елтаңбаның жоғалуымен, теріс - тормен салыстырайық (масштабтың бөлінулерінің жеткілікті санымен нөлдік қате ешқашан болмайды). Сонда жүйелі қатенің жоқтығын тексеру монетаның симметриясын тексерумен бірдей.

Бұл ойлардың мақсаты жүйелі қатенің жоқтығын тексеру мәселесін монетаның симметриясын тексеру мәселесіне дейін азайту болып табылады. Жоғарыда келтірілген пайымдаулар математикалық статистикадағы «белгілер критерийі» деп аталатынға әкеледі.
«Белгі сынағы» – р=1/2 параметрімен таңдама биномдық үлестірімге бағынатыны туралы нөлдік гипотезаны тексеруге мүмкіндік беретін статистикалық тест. Белгі сынағы медиананың берілген мәнге (атап айтқанда, нөлге) тең екендігі туралы гипотезаны тексеру үшін параметрлік емес статистикалық сынақ ретінде, сондай-ақ екі қосылған үлгіде жылжудың (өңдеу әсері жоқ) болмауын тексеру үшін пайдаланылуы мүмкін. Ол сонымен қатар таралу симметриясының гипотезасын тексеруге мүмкіндік береді, дегенмен бұл үшін анағұрлым күшті критерийлер бар - бір үлгідегі Вилкоксон сынағы және оның модификациялары.

Технологиялық процестерді статистикалық реттеуде математикалық статистика әдістеріне негізделген технологиялық процестердің бұзылуын уақтылы анықтауға және оларды түзету және белгіленген талаптарға сәйкес келмейтін өнімдерді шығаруды болдырмауға бағытталған шараларды қабылдауға бағытталған процестерді статистикалық бақылаудың ережелері мен жоспарлары әзірленеді. Бұл шаралар өндіріс шығындарын және сапасыз өнімді жеткізуден болатын ысыраптарды азайтуға бағытталған. Статистикалық қабылдау бақылауымен математикалық статистика әдістеріне сүйене отырып, өнім партияларынан үлгілерді талдау арқылы сапаны бақылау жоспарлары жасалады. Қиындық шешім қабылдаудың ықтималдық-статистикалық модельдерін дұрыс құра білуде жатыр, оның негізінде жоғарыда қойылған сұрақтарға жауап беруге болады. Математикалық статистикада бұл үшін болжамды сынау әдістері мен ықтималдық үлгілері әзірленді, атап айтқанда, ақаулы өндіріс бірліктерінің үлесі белгілі р0 санына тең, мысалы, p0 = 0,23 болатын гипотезалар.

Бағалау тапсырмалары.
Бірқатар басқарушылық, өндірістік, экономикалық, ұлттық экономикалық жағдайларда басқа типтегі мәселелер туындайды - ықтималдық үлестірімінің сипаттамалары мен параметрлерін бағалау мәселелері.

Мысал қарастырайық. Басқаруға N электр лампаларының партиясы келсін. Осы топтамадан n электр шамының үлгісі кездейсоқ таңдалды. Бірқатар табиғи сұрақтар туындайды. Үлгі элементтерін сынау нәтижелері бойынша электр шамдарының орташа қызмет ету мерзімін қалай анықтауға болады және бұл сипаттаманы қандай дәлдікпен бағалауға болады? Үлкенірек үлгі алынса, дәлдік қалай өзгереді? Электр шамдарының кем дегенде 90%-ы Т немесе одан да көп сағат жұмыс істейтініне қанша сағат T кепілдік беруге болады?

n электр шамының үлгісін сынау кезінде X электр шамдары ақаулы болып шықты делік. Сонда мынадай сұрақтар туындайды. Партиядағы ақаулы электр шамдарының D санына, ақаулық D/N деңгейіне және т.б. қандай шектерді көрсетуге болады?

Немесе технологиялық процестердің дәлдігі мен тұрақтылығын статистикалық талдауда бақыланатын параметрдің орташа мәні және оның қарастырылатын процесте таралу дәрежесі сияқты сапа көрсеткіштерін бағалау қажет. Ықтималдық теориясына сәйкес оны кездейсоқ шаманың орташа мәні ретінде қолданған жөн. күтілетін мән, ал таралудың статистикалық сипаттамасы ретінде – дисперсия, стандартты ауытқу немесе вариация коэффициенті. Бұл сұрақ туындайды: үлгі деректерден осы статистикалық сипаттамаларды қалай бағалауға болады және мұны қандай дәлдікпен жасауға болады? Осыған ұқсас мысалдар көп. Мұнда өнімнің сапасын статистикалық басқару саласында шешім қабылдау кезінде ықтималдық теориясы мен математикалық статистиканың өндірісті басқаруда қалай пайдалануға болатынын көрсету маңызды болды.

Ықтималдық-статистикалық әдістер және оңтайландыру. Оңтайландыру идеясы заманауи қолданбалы математикалық статистика мен басқа да статистикалық әдістерді қамтиды. Атап айтқанда, эксперименттерді жоспарлау әдістері, статистикалық қабылдауды бақылау, технологиялық процестерді статистикалық бақылау және т.б.. Екінші жағынан, шешімдер теориясындағы оңтайландыру тұжырымдары, мысалы, өнімнің сапасын және стандарт талаптарын оңтайландырудың қолданбалы теориясы, ықтималдық-статистикалық әдістерді, ең алдымен қолданбалы математикалық статистиканы кеңінен қолдануды қамтамасыз етеді.

Өндірісті басқаруда, атап айтқанда, өнімнің сапасы мен стандарт талаптарын оңтайландыру кезінде статистикалық әдістерді қолдану ерекше маңызды. бастапқы кезеңөнімнің өмірлік циклі, яғни. тәжірибелік-конструкторлық әзірлемелерді ғылыми-зерттеу дайындау кезеңінде (өнімге, алдын ала жобаға, тәжірибелік-конструкторлық әзірлеуге техникалық тапсырмаға перспективалық талаптарды әзірлеу). Бұл өнімнің өмірлік циклінің бастапқы кезеңінде қол жетімді ақпараттың шектеулілігіне және болашақтағы техникалық мүмкіндіктер мен экономикалық жағдайды болжау қажеттілігіне байланысты. Статистикалық әдістерді оңтайландыру мәселесін шешудің барлық кезеңдерінде – айнымалыларды масштабтауда, өнімдер мен жүйелердің жұмыс істеуінің математикалық модельдерін жасауда, техникалық-экономикалық эксперименттер жүргізуде және т.б.

Оңтайландыру мәселелерінде, соның ішінде өнім сапасын және стандарт талаптарын оңтайландыруда статистиканың барлық салалары қолданылады. Атап айтқанда, кездейсоқ шамалар статистикасы, көп айнымалы статистикалық талдау, кездейсоқ процестер мен уақыттық қатарлар статистикасы, сандық емес сипаттағы объектілер статистикасы. Нақты деректерді талдаудың статистикалық әдісін таңдау ұсыныстарға сәйкес жүзеге асырылуы керек.

Қорытынды.
IN
және т.б.................

Ықтималдықтар теориясы мен математикалық статистика мәліметтерді өңдеудің ықтималдық-статистикалық әдістерінің негізі болып табылады. Ал біз деректерді ең алдымен шешім қабылдау үшін өңдеп, талдаймыз. Қазіргі математикалық аппаратты пайдалану үшін қарастырылған есептерді ықтималдық-статистикалық модельдер арқылы өрнектеу қажет.

Нақты ықтималдық-статистикалық әдісті қолдану үш кезеңнен тұрады:

Экономикалық, басқарушылық, технологиялық шындықтан абстрактілі математикалық және статистикалық схемаға көшу, т.б. басқару жүйесінің, технологиялық процестің, шешім қабылдау процедурасының, атап айтқанда статистикалық бақылау нәтижелерінің негізінде ықтималдық моделін құру және т.б.

Ықтималдық модель шеңберінде таза математикалық құралдармен есептеулер жүргізу және қорытындылар алу;

Нақты жағдайға байланысты математикалық және статистикалық қорытындыларды түсіндіру және тиісті шешім қабылдау (мысалы, өнім сапасының белгіленген талаптарға сәйкестігі немесе сәйкес келмеуі, технологиялық процесті түзету қажеттілігі және т.б. туралы), атап айтқанда, қорытындылар (сериядағы ақаулы бірліктердің үлесі туралы, технологиялық бақылаудың нақты түрі бойынша).

Математикалық статистика ықтималдықтар теориясының ұғымдарын, әдістерін және нәтижелерін пайдаланады. Келесі кезекте экономикалық, басқарушылық, технологиялық және басқа жағдайларда ықтималдық модельдерді құрудың негізгі мәселелерін қарастырамыз. Ықтималдық-статистикалық әдістер бойынша нормативтік-техникалық және нұсқаулық-әдістемелік құжаттарды белсенді және дұрыс пайдалану үшін алдын ала білім қажет екенін атап өтеміз. Сонымен, сол немесе басқа құжат қандай жағдайларда қолданылуы керек, оны таңдау және қолдану үшін қандай бастапқы ақпарат болуы керек, деректерді өңдеу нәтижелері бойынша қандай шешімдер қабылдау керек және т.б.

Қолдану мысалдары ықтималдықтар теориясы және математикалық статистика.Ықтималдық-статистикалық модельдер басқарушылық, өндірістік, экономикалық және ұлттық экономикалық мәселелерді шешудің жақсы құралы болған кезде бірнеше мысалдарды қарастырайық. Мәселен, А.Н.Толстойдың «Азаппен жүріп өту» (1-том) романында: «Цех некенің жиырма үш пайызын береді, сен осы көрсеткішті ұстайсың» дейді Струков Иван Ильичке.

Зауыт басшыларының әңгімесіндегі бұл сөздерді қалай түсінуге болады? Бір өнім бірлігі 23% ақаулы болуы мүмкін емес. Ол жақсы немесе ақаулы болуы мүмкін. Мүмкін, Струков үлкен партияда ақаулы қондырғылардың шамамен 23% бар дегенді білдірген болуы мүмкін. Сонда сұрақ туындайды, «туралы» нені білдіреді? Тексерілген 100 өнім бірлігінің 30-ы ақаулы болып шықсын, әлде 1000-нан - 300, немесе 100.000-нан - 30.000, т.б., Струковты өтірік айтты деп айыптау керек пе?

Немесе басқа мысал. Лот ретінде пайдаланылатын монета «симметриялы» болуы керек. Оны лақтырған кезде орта есеппен жарты жағдайда елтаңба (қыран), ал жарты жағдайда тор (құйрық, сан) түсуі керек. Бірақ «орташа» деген нені білдіреді? Егер сіз әр серияда 10 лақтырылатын көптеген серияларды өткізсеңіз, онда монета елтаңбамен 4 рет түсіп кететін сериялар жиі болады. Симметриялық монета үшін бұл серияның 20,5% -ында болады. Ал егер 100 000 лақтыру үшін 40 000 елтаңба болса, монетаны симметриялы деп санауға бола ма? Шешім қабылдау процедурасы ықтималдық теориясы мен математикалық статистикаға негізделген.

Мысал жеткіліксіз болып көрінуі мүмкін. Алайда олай емес. Өнеркәсіптік техникалық-экономикалық тәжірибелерді ұйымдастыруда жеребе тарту кеңінен қолданылады. Мысалы, мойынтіректердің сапа көрсеткішін (үйкеліс моментін) өлшеу нәтижелерін өңдеу кезінде әртүрлі технологиялық факторларға байланысты (сақтау ортасының әсері, өлшеу алдында мойынтіректерді дайындау әдістері, өлшеу процесіндегі мойынтірек жүктемесінің әсері және т.б.). Подшипниктердің сапасын әртүрлі консервіленген майларда сақтау нәтижелеріне байланысты салыстыру қажет делік, яғни. құрамында майлар АЖәне IN. Мұндай экспериментті жоспарлау кезінде мұнай құрамына қандай мойынтіректерді қою керек деген сұрақ туындайды А, ал қайсысы - май құрамында IN, бірақ субъективтілікті болдырмайтын және шешімнің объективтілігін қамтамасыз ететіндей. Бұл сұрақтың жауабын жеребе тарту арқылы алуға болады.

Осыған ұқсас мысалды кез келген өнімнің сапасын бақылау арқылы келтіруге болады. Өнімнің тексерілген партиясы белгіленген талаптарға сәйкес келетіндігін анықтау үшін одан сынама алынады. Үлгіні бақылау нәтижелері бойынша бүкіл партия туралы қорытынды жасалады. Бұл жағдайда үлгіні қалыптастыруда субъективтілікті болдырмау өте маңызды, яғни. бақыланатын партиядағы өнімнің әрбір бірлігі үлгіде таңдалу ықтималдығы бірдей болуы қажет. Өндіріс жағдайында іріктеудегі өнім бірліктерін таңдау әдетте лот бойынша емес, кездейсоқ сандардың арнайы кестелері бойынша немесе компьютерлік кездейсоқ сандар генераторларының көмегімен жүзеге асырылады.

Салыстырудың объективтілігін қамтамасыз етудің ұқсас мәселелері өндірісті ұйымдастырудың әртүрлі схемаларын салыстыру, еңбекақы төлеу, конкурстар мен конкурстарды өткізу, бос лауазымдарға үміткерлерді таңдау және т.б. Барлық жерде лотерея немесе ұқсас процедуралар қажет.

Олимпиадалық жүйе бойынша турнирді ұйымдастыру кезінде ең күшті және екінші күшті команданы анықтау қажет болсын (жеңілген адам шығарылады). Күшті команда әрқашан әлсізді жеңеді делік. Мықты команда міндетті түрде чемпион болатыны анық. Екінші мықты команда финалға дейін болашақ чемпионмен ойыны болмаған жағдайда ғана финалға шығады. Егер мұндай ойын жоспарланса, екінші мықты команда финалға шықпайды. Турнирді жоспарлаған адам турнирден ең күшті екінші команданы мерзімінен бұрын «нокаутқа түсіріп», көшбасшымен бірінші кездесуде оны түсіре алады немесе финалға дейін әлсіз командалармен кездесуді қамтамасыз ете отырып, екінші орынды қамтамасыз ете алады. Субъективтілікке жол бермеу үшін жеребе тартыңыз. 8 командалық турнир үшін екі мықты команданың финалда кездесу ықтималдығы 4/7 құрайды. Сәйкесінше, 3/7 ықтималдығымен екінші мықты команда турнирден мерзімінен бұрын кетеді.

Өнім бірліктерін кез келген өлшеуде (штангенциркуль, микрометр, амперметр және т.б. пайдалану) қателер болады. Жүйелі қателердің бар-жоғын анықтау үшін сипаттамалары белгілі (мысалы, стандартты үлгі) өнім бірлігін қайталап өлшеу қажет. Жүйелі қателіктен басқа кездейсоқ қате де болатынын есте ұстаған жөн.

Сондықтан өлшеу нәтижелерінен жүйелі қателік бар-жоғын қалай анықтауға болады деген сұрақ туындайды. Келесі өлшеу кезінде алынған қатенің оң немесе теріс екенін ғана ескерсек, онда бұл мәселені бұрын қарастырылғанға дейін азайтуға болады. Шынында да, өлшеуді монета лақтырумен, оң қатені - елтаңбаның жоғалуымен, теріс - тормен салыстырайық (масштабтың бөлінулерінің жеткілікті санымен нөлдік қате ешқашан болмайды). Сонда жүйелі қатенің жоқтығын тексеру монетаның симметриясын тексерумен бірдей.

Сонымен, жүйелі қатенің жоқтығын тексеру мәселесі монетаның симметриясын тексеру мәселесіне дейін төмендейді. Жоғарыда келтірілген пайымдаулар математикалық статистикадағы «белгілер критерийі» деп аталатынға әкеледі.

Технологиялық процестерді статистикалық реттеуде математикалық статистика әдістеріне негізделген технологиялық процестердің бұзылуын уақтылы анықтауға және оларды түзету және белгіленген талаптарға сәйкес келмейтін өнімдерді шығаруды болдырмауға бағытталған шараларды қабылдауға бағытталған процестерді статистикалық бақылаудың ережелері мен жоспарлары әзірленеді. Бұл шаралар өндіріс шығындарын және сапасыз өнімді жеткізуден болатын ысыраптарды азайтуға бағытталған. Статистикалық қабылдау бақылауымен математикалық статистика әдістеріне сүйене отырып, өнім партияларынан үлгілерді талдау арқылы сапаны бақылау жоспарлары жасалады. Қиындық шешім қабылдаудың ықтималдық-статистикалық модельдерін дұрыс құра білуде жатыр. Математикалық статистикада бұл үшін ықтималдық үлгілері мен гипотезаларды тексеру әдістері әзірленді, атап айтқанда, ақаулы өндіріс бірліктерінің үлесі белгілі бір санға тең деген гипотезалар. Р 0 , Мысалы, Р 0 = 0,23 (А.Н.Толстойдың романындағы Струковтың сөзін еске түсіріңіз).

Бағалау тапсырмалары.Бірқатар басқарушылық, өндірістік, экономикалық, ұлттық экономикалық жағдайларда басқа типтегі мәселелер туындайды - ықтималдық үлестірімінің сипаттамалары мен параметрлерін бағалау мәселелері.

Мысал қарастырайық. Келіңіздер Нэлектр шамдары Осы лоттан үлгі nэлектр шамдары Бірқатар табиғи сұрақтар туындайды. Үлгі элементтерін сынау нәтижелері бойынша электр шамдарының орташа қызмет ету мерзімін қалай анықтауға болады, бұл сипаттаманы қандай дәлдікпен бағалауға болады? Үлкенірек үлгі алынса, дәлдік қалай өзгереді? Қандай сағаттарда Тэлектр шамдарының кем дегенде 90% қызмет ететініне кепілдік беруге болады Тнемесе одан да көп сағат?

Көлемі бар үлгіні сынау кезінде деп есептейік nшамдар ақаулы Xэлектр шамдары Сан үшін қандай шектеулерді көрсетуге болады Dпартиядағы ақаулы электр шамдары, ақаулық деңгейі үшін D/ Нжәне т.б.?

Немесе технологиялық процестердің дәлдігі мен тұрақтылығын статистикалық талдауда бақыланатын параметрдің орташа мәні және оның қарастырылатын процесте таралу дәрежесі сияқты сапа көрсеткіштерін бағалау қажет. Ықтималдық теориясына сәйкес кездейсоқ шаманың орташа мәні ретінде оның математикалық күтуін, ал таралудың статистикалық сипаттамасы ретінде дисперсияны, стандартты ауытқуды немесе вариация коэффициентін қолданған жөн. Сұрақтар туындайды: үлгі деректерден осы статистикалық сипаттамаларды қалай бағалауға болады, мұны қандай дәлдікпен жасауға болады?

Осыған ұқсас мысалдар көп. Мұнда ықтималдықтар теориясы мен математикалық статистиканы инженерлік және басқару мәселелерінде қалай қолдануға болатынын көрсету маңызды болды.

Математикалық статистиканың қазіргі концепциясы.Математикалық статистика «статистикалық деректерді жинаудың, жүйелеудің, өңдеудің және түсіндірудің, сондай-ақ оларды ғылыми немесе практикалық қорытындылар үшін пайдаланудың математикалық әдістеріне арналған математиканың бөлімі» деп түсініледі. Математикалық статистиканың ережелері мен процедуралары ықтималдық теориясына негізделген, бұл қолда бар статистикалық материал негізінде әрбір мәселе бойынша алынған қорытындылардың дәлдігі мен сенімділігін бағалауға мүмкіндік береді. Сонымен қатар, статистикалық деректер белгілі бір сипаттамаларға ие кез келген азды-көпті жинақтағы объектілердің саны туралы ақпаратты білдіреді.

Шешілетін есептердің түріне сәйкес математикалық статистика әдетте үш бөлімге бөлінеді: деректерді сипаттау, бағалау және гипотезаны тексеру.

Өңделетін статистикалық деректер түріне қарай математикалық статистика төрт салаға бөлінеді:

Бақылау нәтижесі нақты санмен сипатталатын бір өлшемді статистика (кездейсоқ шамалар статистикасы);

Көп өлшемді статистикалық талдау, мұнда объектіні бақылау нәтижесі бірнеше сандармен (вектор) сипатталады;

Кездейсоқ процестер мен уақыт қатарларының статистикасы, мұнда бақылау нәтижесі функция болып табылады;

Бақылау нәтижесі сандық емес сипатта болатын, мысалы, жиынтық (геометриялық фигура), реттілік немесе сапалық атрибут бойынша өлшеу нәтижесінде алынған объектілердің сандық емес сипаттағы статистикасы.

Тарихи тұрғыдан сандық емес сипаттағы объектілер статистикасының кейбір бағыттары (атап айтқанда, ақаулы өнімдердің пайызын бағалау және ол туралы гипотезаларды тексеру мәселелері) және бір өлшемді статистика бірінші болып пайда болды. Математикалық аппарат олар үшін қарапайым, сондықтан олар өз мысалдарымен әдетте математикалық статистиканың негізгі идеяларын көрсетеді.

Тек деректерді өңдеудің сол әдістері, яғни. Математикалық статистика - нақты құбылыстар мен процестердің ықтималдық үлгілеріне негізделген дәлелді деректер. Біз тұтынушылардың мінез-құлқының модельдері, тәуекелдердің пайда болуы, технологиялық жабдықтың жұмыс істеуі, эксперимент нәтижелерін алу, аурудың ағымы және т.б. Нақты құбылыстың ықтималдық моделі, егер қарастырылатын шамалар мен олардың арасындағы байланыстар ықтималдықтар теориясы тұрғысынан өрнектелсе, құрастырылған деп санау керек. Шындықтың ықтималдық моделіне сәйкестік, яғни. оның сәйкестігі, атап айтқанда, гипотезаларды тексерудің статистикалық әдістерінің көмегімен негізделеді.

Деректерді өңдеудің керемет әдістері барлау болып табылады, оларды тек алдын ала деректерді талдау кезінде қолдануға болады, өйткені олар шектеулі статистикалық материалдар негізінде алынған қорытындылардың дәлдігі мен сенімділігін бағалауға мүмкіндік бермейді.

Ықтималдық және статистикалық әдістер құбылыстың немесе процестің ықтималдық моделін құру және негіздеу мүмкін болған жерде қолданылады. Іріктеме деректерінен жасалған қорытындылар бүкіл жиынтыққа (мысалы, үлгіден өнімнің бүкіл партиясына) тасымалданған кезде оларды пайдалану міндетті болып табылады.

Қолданудың нақты салаларында кең қолданудың ықтималдық-статистикалық әдістері де, нақтылары да қолданылады. Мысалы, өнім сапасын басқарудың статистикалық әдістеріне арналған өндірісті басқару бөлімінде қолданбалы математикалық статистика (тәжірибелерді жобалауды қоса) қолданылады. Оның әдістерінің көмегімен технологиялық процестердің дәлдігі мен тұрақтылығына статистикалық талдау және сапаны статистикалық бағалау жүргізіледі. Нақты әдістерге өнім сапасын статистикалық қабылдау бақылау әдістері, технологиялық процестерді статистикалық реттеу, сенімділікті бағалау және бақылау және т.б.

Сенімділік теориясы және кезек теориясы сияқты қолданбалы ықтималдық-статистикалық пәндер кеңінен қолданылады. Олардың біріншісінің мазмұны тақырыптан түсінікті болса, екіншісі кездейсоқ уақытта қоңырауларды қабылдайтын телефон станциясы сияқты жүйелерді - абоненттердің өз телефондарына нөмір теретін талаптарын зерттеумен айналысады. Осы талаптардың қызмет көрсету ұзақтығы, яғни. әңгімелесу ұзақтығы да кездейсоқ айнымалылар арқылы модельденеді. Бұл пәндердің дамуына үлкен үлес қосты КСРО Ғылым академиясының корреспондент-мүшесі А.Я. Хинчин (1894-1959), Украина КСР Ғылым академиясының академигі Б.В.Гнеденко (1912-1995) және басқа да отандық ғалымдар болды.

Математикалық статистиканың тарихы туралы қысқаша.Математикалық статистика ғылым ретінде атақты неміс математигі Карл Фридрих Гаусстың (1777-1855) еңбектерінен басталады, ол ықтималдық теориясына сүйене отырып, ең кіші квадраттар әдісін зерттеп, негіздеді, ол 1795 жылы құрған және астрономиялық мәліметтерді өңдеуге қолданды (планеталардың кішігірім немесе cerbites ретімен). Ең танымал ықтималдық үлестірімдерінің бірі қалыпты, жиі оның атымен аталады, ал кездейсоқ процестер теориясында негізгі зерттеу объектісі гаусс процестері болып табылады.

XIX ғасырдың аяғында. - ХХ ғасырдың басы. математикалық статистикаға үлкен үлес қосқан ағылшын зерттеушілері, ең алдымен К.Пирсон (1857-1936) және Р.А.Фишер (1890-1962). Атап айтқанда, Пирсон статистикалық гипотезаларды тексеруге арналған хи-квадрат тестін, ал Фишер дисперсияны талдауды, экспериментті жобалау теориясын және параметрлерді бағалаудың максималды ықтималдық әдісін жасады.

ХХ ғасырдың 30-жылдарында. Поле Ежи Нейман (1894-1977) мен ағылшын Э.Пирсон статистикалық гипотезаларды тексерудің жалпы теориясын жасады, ал кеңес математиктері академик А.Н. Колмогоров (1903-1987) және КСРО Ғылым академиясының корреспондент мүшесі Н.В.Смирнов (1900-1966) параметрлік емес статистиканың негізін қалады. ХХ ғасырдың қырқыншы жылдары. Румыниялық А.Вальд (1902-1950) дәйекті статистикалық талдау теориясын құрды.

Қазіргі уақытта математикалық статистика қарқынды дамып келеді. Сонымен, соңғы 40 жыл ішінде зерттеудің төрт принципті жаңа бағытын бөліп көрсетуге болады:

Эксперименттерді жоспарлаудың математикалық әдістерін әзірлеу және енгізу;

Қолданбалы математикалық статистикада дербес бағыт ретінде сандық емес сипаттағы объектілер статистикасын дамыту;

Қолданылатын ықтималдық модельден аздаған ауытқуларға төзімді статистикалық әдістерді жасау;

Мәліметтерді статистикалық талдауға арналған компьютерлік бағдарламалық кешендерді құру бойынша жұмыстарды кеңінен дамыту.

Ықтималдық-статистикалық әдістер және оңтайландыру.Оңтайландыру идеясы заманауи қолданбалы математикалық статистика мен басқа да статистикалық әдістерді қамтиды. Атап айтқанда, эксперименттерді жоспарлау әдістері, статистикалық қабылдауды бақылау, технологиялық процестерді статистикалық бақылау және т.б.. Екінші жағынан, шешімдер теориясындағы оңтайландыру тұжырымдары, мысалы, өнімнің сапасын және стандарт талаптарын оңтайландырудың қолданбалы теориясы, ықтималдық-статистикалық әдістерді, ең алдымен қолданбалы математикалық статистиканы кеңінен қолдануды қамтамасыз етеді.

Өндірісті басқаруда, атап айтқанда, өнімнің сапасы мен стандарт талаптарын оңтайландыру кезінде өнімнің өмірлік циклінің бастапқы кезеңінде статистикалық әдістерді қолдану ерекше маңызды, яғни. тәжірибелік-конструкторлық әзірлемелерді ғылыми-зерттеу дайындау кезеңінде (өнімге, алдын ала жобаға, тәжірибелік-конструкторлық әзірлеуге техникалық тапсырмаға перспективалық талаптарды әзірлеу). Бұл өнімнің өмірлік циклінің бастапқы кезеңінде қол жетімді ақпараттың шектеулілігіне және болашақтағы техникалық мүмкіндіктер мен экономикалық жағдайды болжау қажеттілігіне байланысты. Статистикалық әдістерді оңтайландыру мәселесін шешудің барлық кезеңдерінде – айнымалыларды масштабтауда, өнімдер мен жүйелердің жұмыс істеуінің математикалық модельдерін жасауда, техникалық-экономикалық эксперименттер жүргізуде және т.б.

Оңтайландыру мәселелерінде, соның ішінде өнім сапасын және стандарт талаптарын оңтайландыруда статистиканың барлық салалары қолданылады. Атап айтқанда, кездейсоқ шамалар статистикасы, көп айнымалы статистикалық талдау, кездейсоқ процестер мен уақыттық қатарлар статистикасы, сандық емес сипаттағы объектілер статистикасы. Нақты деректерді талдаудың статистикалық әдісін таңдау бойынша ұсыныстар әзірленді.

Кіріспе

2. Математикалық статистиканың негізгі түсініктері

2.1 Таңдаудың негізгі түсініктері

2.2 Сынамаларды іріктеу

2.3 Эмпирикалық таралу функциясы, гистограмма

Қорытынды

Әдебиеттер тізімі

Кіріспе

Математикалық статистика – статистикалық мәліметтерді ғылыми және практикалық қорытындылар үшін жүйелеу және пайдаланудың математикалық әдістері туралы ғылым. Оның көптеген салаларында математикалық статистика ықтималдық теориясына негізделген, бұл шектеулі статистикалық материалдан жасалған қорытындылардың сенімділігі мен дәлдігін бағалауға мүмкіндік береді (мысалы, іріктемелік сауалнамада қажетті дәлдік нәтижелерін алу үшін іріктеудің қажетті мөлшерін бағалау).

Ықтималдықтар теориясында қасиеттері толық белгілі берілген үлестірмелі кездейсоқ шамалар немесе кездейсоқ тәжірибелер қарастырылады. Ықтималдықтар теориясының пәні осы шамалардың (таралулардың) қасиеттері мен байланыстары болып табылады.

Бірақ көбінесе эксперимент тек кейбір нәтижелерді беретін қара жәшік болып табылады, оған сәйкес эксперименттің қасиеттері туралы қорытынды жасау қажет. Бақылаушыда бірдей жағдайларда бірдей кездейсоқ тәжірибені қайталау арқылы алынған сандық (немесе оларды сандық етіп жасауға болады) нәтижелер жиынтығы болады.

Бұл жағдайда, мысалы, келесі сұрақтар туындайды: Егер біз бір кездейсоқ шаманы байқасақ, оның бірнеше эксперименттердегі мәндерінің жиынтығынан оның таралуы туралы ең дәл қорытындыны қалай жасауға болады?

Мұндай эксперименттер сериясының мысалы ретінде социологиялық сауалнама, экономикалық көрсеткіштердің жиынтығы немесе, ең соңында, мың еселенген монета лақтыру кезіндегі Елтаңбалар мен құйрықтар тізбегі болып табылады.

Жоғарыда аталған факторлардың барлығы әкеледі өзектілігіжәне математикалық статистиканың негізгі ұғымдарын терең және жан-жақты зерттеуге бағытталған жұмыс тақырыбының қазіргі кезеңдегі маңыздылығы.

Осыған байланысты бұл жұмыстың мақсаты математикалық статистика ұғымдары туралы білімдерді жүйелеу, жинақтау және бекіту болып табылады.

1. Математикалық статистиканың пәні мен әдістері

Математикалық статистика – жаппай бақылаулар (өлшеулер, тәжірибелер) кезінде алынған мәліметтерді талдаудың математикалық әдістері туралы ғылым. Бақылаулардың нақты нәтижелерінің математикалық сипатына қарай математикалық статистика сандар статистикасы, көп айнымалы статистикалық талдау, функциялар (процестер) мен уақыттық қатарларды талдау және сандық емес объектілер статистикасы болып бөлінеді. Математикалық статистиканың маңызды бөлігі ықтималдық модельдерге негізделген. Деректерді сипаттаудың, бағалаудың және гипотезаны тексерудің жалпы тапсырмаларын бөліңіз. Олар сондай-ақ іріктемелік сауалнамалар жүргізуге, тәуелділіктерді қалпына келтіруге, классификацияларды (типологияларды) құру және пайдалану және т.б. байланысты неғұрлым нақты тапсырмаларды қарастырады.

Деректерді сипаттау үшін кестелер, диаграммалар және басқа көрнекі көріністер құрастырылады, мысалы, корреляция өрістері. Ықтималды модельдер әдетте қолданылмайды. Кейбір деректерді сипаттау әдістері озық теорияға және заманауи компьютерлердің мүмкіндіктеріне сүйенеді. Оларға, атап айтқанда, бір-біріне ұқсас объектілер топтарын анықтауға бағытталған кластерлік талдау және олардың арасындағы қашықтықты ең аз дәрежеде бұрмалай отырып, объектілерді жазықтықта визуализациялауға мүмкіндік беретін көп өлшемді масштабтау жатады.

Бағалау және гипотезаны тексеру әдістері ықтималдық деректер генерациялау үлгілеріне сүйенеді. Бұл модельдер параметрлік және параметрлік емес болып бөлінеді. Параметрлік модельдерде зерттелетін объектілер сандық параметрлердің аз санына (1-4) тәуелді таралу функцияларымен сипатталады деп болжанады. Параметрлік емес модельдерде үлестіру функциялары ерікті үздіксіз болып қабылданады. Математикалық статистикада үлестірімнің параметрлері мен сипаттамалары (математикалық күту, медиана, дисперсия, квантилдер және т.б.), тығыздықтар мен таралу функциялары, айнымалылар арасындағы тәуелділіктер (сызықтық және параметрлік емес корреляция коэффициенттеріне негізделген, сондай-ақ параметрлік немесе параметрлік емес бағалаулар (функциялардың параметрлік немесе параметрлік емес бағалаулары) шынайы тәуелділік мәндерін білдіретін нүктелік мәндер және т.б.). бағалаулар қолданылады.

Математикалық статистикада бар жалпы теориягипотезаны тексеру және үлкен саннақты гипотезаларды тексеруге арналған әдістер. Гипотезалар параметрлер мен сипаттамалардың мәндері туралы, біртектілікті тексеру туралы (яғни екі үлгідегі сипаттамалардың немесе таралу функцияларының сәйкестігі туралы), эмпирикалық таралу функциясының берілген таралу функциясымен немесе осындай функциялардың параметрлік тобымен сәйкестігі туралы, таралу симметриясы туралы және т.б.

Математикалық статистиканың іріктемелік сауалнамалар жүргізумен, әртүрлі іріктеу сұлбаларының қасиеттерімен және гипотезаларды бағалау мен тексерудің адекватты әдістерін құрумен байланысты бөлімі үлкен маңызға ие.

Тәуелділікті қалпына келтіру мәселелері 1794 жылы К.Гаусс ең кіші квадраттар әдісін жасағаннан бері 200 жылдан астам белсенді түрде зерттелді. Қазіргі уақытта айнымалылардың ақпараттық ішкі жиынын іздеу әдістері және параметрлік емес әдістер ең өзекті болып табылады.

Деректерді жуықтау және сипаттама өлшемін азайту әдістерін әзірлеу 100 жылдан астам уақыт бұрын К. Пирсон негізгі құрамдас әдісті жасаған кезде басталды. Кейінірек факторлық талдау және көптеген сызықтық емес жалпылаулар жасалды.

Классификацияларды (типологияларды) құрудың (кластерлік талдау), талдаудың және пайдаланудың (дискриминанттық талдау) әртүрлі әдістерін үлгіні тану әдістері (мұғаліммен және мұғалімсіз), автоматты жіктеу және т.б.

Статистикадағы математикалық әдістер не сандық емес объектілер статистикасындағыдай қосындыларды (ықтималдықтар теориясының орталық шекті теоремасы негізінде) немесе айырмашылық көрсеткіштерін (қашықтықтар, метрика) қолдануға негізделген. Әдетте тек асимптотикалық нәтижелер қатаң негізделеді. Қазіргі уақытта компьютерлер математикалық статистикада үлкен рөл атқарады. Олар есептеулер үшін де, имитациялық модельдеу үшін де (атап айтқанда, іріктеу әдістерінде және асимптотикалық нәтижелердің жарамдылығын зерттеуде) қолданылады.

Математикалық статистиканың негізгі түсініктері

2.1 Таңдау әдісінің негізгі түсініктері

Кездейсоқ экспериментте байқалатын кездейсоқ шама болсын. Ықтималдық кеңістігі берілген деп болжанады (және бізді қызықтырмайды).

Біз бұл тәжірибені бір рет бірдей шарттарда орындай отырып, біз , , , - сандарын алдық деп есептейміз, бұл кездейсоқ шаманың бірінші, екінші және т.б. эксперименттер. Кездейсоқ шама бізге ішінара немесе толығымен белгісіз болатын кейбір үлестірімге ие.

Үлгі деп аталатын жиынтықты толығырақ қарастырайық.

Қазірдің өзінде орындалған эксперименттер сериясында үлгі сандар жиыны болып табылады. Бірақ егер бұл тәжірибелер тізбегі қайтадан қайталанса, онда бұл жиынның орнына біз жаңа сандар жиынтығын аламыз. Санның орнына басқа сан пайда болады - кездейсоқ шаманың мәндерінің бірі. Яғни (және, және т.б.) - айнымалы, ол кездейсоқ шамамен бірдей мәндерді қабылдай алады және жиі (бірдей ықтималдықтармен). Демек, эксперимент алдында – тең үлестірілген кездейсоқ шама, ал тәжірибеден кейін – біз осы бірінші тәжірибеде байқайтын сан, яғни. кездейсоқ шаманың мүмкін мәндерінің бірі.

Көлемнің үлгісі - және сияқты үлестірмесі бар тәуелсіз және бірдей таралған кездейсоқ шамалардың («көшірмелер») жиынтығы.

«Үлгіден бөлу туралы қорытынды жасау» нені білдіреді? Бөлу таралу функциясымен, тығыздығымен немесе кестесімен, жиынымен сипатталады сандық сипаттамалар- , , және т.б. Үлгіге сүйене отырып, осы сипаттамалардың барлығына жуықтауды құра білу керек.

.2 Сынама алу

Бір элементарлық нәтиже бойынша үлгіні жүзеге асыруды қарастырыңыз - сандар жиынтығы , , . Сәйкес ықтималдық кеңістігінде ықтималдықтары бар , мәндерін қабылдайтын кездейсоқ шаманы енгіземіз (егер кейбір мәндер сәйкес келсе, ықтималдықтарды сәйкес рет санын қосамыз). Ықтималдылықты бөлу кестесі және кездейсоқ шаманы бөлу функциясы келесідей:

Шаманың таралуы эмпирикалық немесе таңдамалы үлестірім деп аталады. Шаманың математикалық күтілуі мен дисперсиясын есептеп, осы шамалардың белгілеуін енгізейік:

Дәл осылай біз тапсырыс сәтін есептейміз

Жалпы жағдайда шама арқылы белгілейміз

Егер біз енгізген барлық сипаттамаларды құрастыру кезінде , , таңдамалысын кездейсоқ шамалардың жиыны ретінде қарастырсақ, онда бұл сипаттамалардың өзі - , , , , - кездейсоқ шамаға айналады. Бұл таңдаманың таралу сипаттамалары шынайы үлестірімнің сәйкес белгісіз сипаттамаларын бағалау (шамамен) үшін пайдаланылады.

Шынайы үлестірімнің (немесе ) сипаттамаларын бағалау үшін таралу сипаттамаларын пайдаланудың себебі үлкен .

Мысалы, кәдімгі өлікті лақтыруды қарастырайық. Болсын --ші лақтыруда түскен ұпай саны, . Үлгідегі біреуі бір рет, екеуі бір рет кездеседі және т.б. Содан кейін кездейсоқ шама мәндерді қабылдайды 1 , , 6 ықтималдықтары бар , сәйкесінше. Бірақ өсумен бұл пропорциялар заңға сәйкес келеді үлкен сандар. Яғни, шаманың таралуы қандай да бір мағынада дұрыс матрица лақтырылған кезде түсетін нүктелер санының шынайы таралуына жақындайды.

Біз іріктеменің жақындығы мен шынайы үлестірімнің нені білдіретінін көрсетпейміз. Келесі параграфтарда біз жоғарыда келтірілген сипаттамалардың әрқайсысын егжей-тегжейлі қарастырамыз және оның қасиеттерін, соның ішінде іріктеме көлемінің ұлғаюымен мінез-құлқын қарастырамыз.

.3 Эмпирикалық таралу функциясы, гистограмма

Белгісіз үлестіруді, мысалы, оның таралу функциясы арқылы сипаттауға болатындықтан, біз үлгі бойынша осы функция үшін «бағалау» жасаймыз.

Анықтама 1.

Көлем үлгісіне құрылған эмпирикалық үлестіру функциясы деп аталады кездейсоқ функция, әрқайсысына тең

Еске салғыш:кездейсоқ функция

оқиға көрсеткіші деп аталады. Әрқайсысы үшін бұл параметрі бар Бернулли үлестірімі бар кездейсоқ шама. Неліктен?

Басқаша айтқанда, кездейсоқ шаманың шын ықтималдығына тең кез келген мәні үшін -ден кіші таңдама элементтерінің үлесі бағаланады.

Егер , , үлгі элементтері өсу ретімен сұрыпталса (әрбір қарапайым нәтиже бойынша), вариациялық қатар деп аталатын кездейсоқ шамалардың жаңа жинағы алынады:

, , элементі вариациялық қатардың ші мүшесі немесе ші ретті статистика деп аталады.

1-мысал

Үлгі:

Вариация сериясы:

Күріш. 1. 1-мысал

Эмпирикалық үлестіру функциясында үлгі нүктелерінде секірулер бар, нүктедегі секіру мәні , мұндағы - сәйкес келетін үлгі элементтерінің саны.

Вариациялық қатар үшін эмпирикалық таралу функциясын құруға болады:

Үлестірудің тағы бір сипаттамасы кесте (дискретті таралулар үшін) немесе тығыздық (абсолютті үздіксіз таралулар үшін) болып табылады. Кестенің немесе тығыздықтың эмпирикалық немесе таңдамалы аналогы гистограмма деп аталады.

Гистограмма топтастырылған деректерге негізделген. Кездейсоқ шама мәндерінің болжалды диапазоны (немесе іріктеме деректерінің ауқымы) таңдамаға қарамастан, белгілі бір интервалдар санына (бірдей болуы міндетті емес) бөлінеді. Топтау интервалдары деп аталатын түзудегі , , интервалдары болсын. аралыққа түсетін үлгі элементтерінің санымен for деп белгілейік:

(1)

Әрбір аралықта ауданы пропорционалды тіктөртбұрыш салынады. Барлық төртбұрыштардың жалпы ауданы біреуге тең болуы керек. Интервалдың ұзындығы болсын. Жоғарыдағы тіктөртбұрыштың биіктігі

Алынған фигура гистограмма деп аталады.

2-мысал

Қол жетімді вариациялық қатар(1 мысалды қараңыз):

Мұнда ондық логарифм, сондықтан, яғни. үлгі екі еселенгенде, топтау интервалдарының саны 1-ге артады. Топтау интервалдары неғұрлым көп болса, соғұрлым жақсы екенін ескеріңіз. Бірақ, егер аралықтардың санын, айталық, реттілігін алсақ, онда өсу кезінде гистограмма тығыздыққа жақындамайды.

Келесі мәлімдеме дұрыс:

Егер үлгі элементтерінің таралу тығыздығы үзіліссіз функция болса, сол үшін , гистограмманың тығыздыққа ықтималдығында нүктелік жинақтылық болады.

Сондықтан логарифмді таңдау ақылға қонымды, бірақ жалғыз мүмкін емес.

Қорытынды

Математикалық (немесе теориялық) статистика ықтималдықтар теориясының әдістері мен тұжырымдамаларына негізделген, бірақ белгілі бір мағынада кері есептерді шешеді.

Егер біз екі (немесе одан да көп) белгілердің бір мезгілде көрінуін байқасақ, яғни. бізде бірнеше кездейсоқ шамалардың мәндерінің жиынтығы бар - олардың тәуелділігі туралы не айтуға болады? Ол бар ма, жоқ па? Ал егер солай болса, бұл қандай тәуелділік?

Көбінесе «қара жәшікте» жасырылған бөлу туралы немесе оның қасиеттері туралы кейбір болжамдар жасауға болады. Бұл жағдайда эксперименттік деректерге сәйкес бұл болжамдарды («гипотезалар») растау немесе жоққа шығару қажет. Сонымен бірге, «иә» немесе «жоқ» деген жауап белгілі бір сенімділікпен ғана берілуі мүмкін екенін есте ұстауымыз керек, ал экспериментті неғұрлым ұзақ жалғастыра алсақ, соғұрлым қорытындылар дәлірек болады. Зерттеу үшін ең қолайлы жағдай - бұл бақыланатын эксперименттің белгілі бір қасиеттерін сенімді түрде растау - мысалы, функционалдық тәуелділікбақыланатын шамалар арасында, таралудың қалыптылығы туралы, оның симметриясы туралы, таралудағы тығыздықтың болуы немесе оның дискретті сипаты туралы және т.б.

Сондықтан, егер (математикалық) статистиканы еске түсіру мағынасы бар

кездейсоқ эксперимент бар, оның қасиеттері ішінара немесе толық белгісіз,

Біз бұл экспериментті бірдей жағдайларда бірнеше рет (немесе жақсырақ, кез келген) қайталай аламыз.

Әдебиеттер тізімі

1. Баумоль В. Экономикалық теорияжәне операцияларды зерттеу. – М.; Ғылым, 1999 ж.

2. Большев Л.Н., Смирнов Н.В. Математикалық статистиканың кестелері. Мәскеу: Наука, 1995 ж.

3. Боровков А.А. Математикалық статистика. Мәскеу: Наука, 1994 ж.

4. Корн Г., Корн Т. Ғалымдар мен инженерлерге арналған математика анықтамалығы. - Санкт-Петербург: Лан баспасы, 2003 ж.

5. Коршунов Д.А., Чернова Н.И. Математикалық статистика бойынша тапсырмалар мен жаттығулар жинағы. Новосибирск: Математика институтының баспасы. С.Л.Соболев РҒА СБ, 2001 ж.

6. Пехелецкий И.Д. Математика: оқушыларға арналған оқулық. - М.: Академия, 2003 ж.

7. Суходольский В.Г. бойынша лекциялар жоғары математикагуманитарлық ғылымдар үшін. - Санкт-Петербургтің Петербург баспасы мемлекеттік университеті. 2003

8. Феллер В. Ықтималдық теориясына кіріспе және оның қолданылуы. - М.: Мир, Т.2, 1984 ж.

9. Харман Г., Қазіргі факторлық талдау. – М.: Статистика, 1972 ж.


Харман Г., Қазіргі факторлық талдау. – М.: Статистика, 1972 ж.