Вариациялық қатардың нұсқаларының жиілігі деп аталады. Бөлу және топтастыру қатарлары. t-тестінің даму тарихы

Шарты:

Жұмысшылардың жас құрамы (ж.) туралы мәліметтер бар: 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Интервалдық таралу қатарын құру.
    2. Серияның графикалық көрінісін құрастыру.
    3. Режим мен медиананы графикалық түрде анықтаңыз.

Шешімі:

1) Стерджесс формуласы бойынша популяцияны 1 + 3,322 lg 30 = 6 топқа бөлу керек.

Ең үлкен жас - 38, ең төменгі жас - 18.

Интервал ені Интервалдардың ұштары бүтін сандар болуы керек болғандықтан, біз жиынтықты 5 топқа бөлеміз. Интервал ені - 4.

Есептеулерді жеңілдету үшін деректерді өсу ретімен орналастырайық: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 2 , 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

Жұмысшылардың жас бойынша бөлінуі

Графикалық түрде қатарды гистограмма немесе көпбұрыш түрінде көрсетуге болады. Гистограмма – бағаналы диаграмма. Бағанның негізі интервалдың ені болып табылады. Жолақтың биіктігі жиілікке тең.

Көпбұрыш (немесе тарату полигоны) жиіліктер графигі болып табылады. Оны гистограмма бойынша тұрғызу үшін тіктөртбұрыштардың жоғарғы жақтарының ортаңғы нүктелерін қосамыз. Шеткі х мәндерінен интервалдың жартысына тең қашықтықта х осіндегі көпбұрышты жабамыз.

Режим (Mo) - берілген популяцияда жиі кездесетін зерттелетін белгінің мәні.

Гистограммадан режимді анықтау үшін ең жоғары тіктөртбұрышты таңдап, осы тіктөртбұрыштың оң жақ төбесінен алдыңғы тіктөртбұрыштың оң жақ жоғарғы бұрышына сызық сызып, модальды тіктөртбұрыштың сол жақ төбесінен сызық сызу керек. келесі төртбұрыштың сол жақ төбесі. Осы түзулердің қиылысу нүктесінен х осіне перпендикуляр сызыңыз. Абцисса сән болады. Mo ≈ 27,5. Бұл бұл тұрғындардың ең көп таралған жасы 27-28 жас дегенді білдіреді.

Медиана (Me) – реттелген вариациялық қатардың ортасында орналасқан зерттелетін белгінің мәні.

Біз медиананы кумулят арқылы табамыз. Кумулят – жинақталған жиіліктердің графигі. Абциссалар қатардың нұсқалары болып табылады. Ординаттар жинақталған жиіліктер болып табылады.

Кумулят үшін медиананы анықтау үшін ордината осінің бойынан жинақталған жиіліктердің 50% сәйкес келетін нүктені (біздің жағдайда 15) табамыз, ол арқылы Ох осіне параллель түзу жүргіземіз және оған перпендикуляр жүргіземіз. х осі оның кумулятпен қиылысу нүктесінен. Абцисса медиана болып табылады. Мен ≈ 25,9. Бұл осы халықтағы жұмысшылардың тең жартысы 26 жасқа толмағандар деген сөз.

Осы тарауды меңгеру нәтижесінде студент: білу

  • вариация көрсеткіштері және олардың өзара байланысы;
  • белгілерді бөлудің негізгі заңдылықтарын;
  • келісім критерийлерінің мәні; білу
  • өзгеру жылдамдығын және сәйкестік жақсылығын есептеу;
  • таралу сипаттамаларын анықтау;
  • негізгісін бағалау сандық сипаттамаларстатистикалық таралу қатары;

меншік

  • таралу қатарларын статистикалық талдау әдістері;
  • дисперсиялық талдау негіздері;
  • статистикалық таралу қатарларының таралудың негізгі заңдылықтарына сәйкестігін тексеру әдістері.

Вариация көрсеткіштері

Әртүрлі статистикалық популяциялардың ерекшеліктерін статистикалық зерттеуде халықтың жеке статистикалық бірліктерінің ерекшелігінің вариациясын, сондай-ақ осы белгі бойынша бірліктердің таралу сипатын зерттеу үлкен қызығушылық тудырады. Вариация -бұл зерттелетін популяцияның бірліктері арасындағы белгінің жеке мәндеріндегі айырмашылықтар. Вариацияны зерттеу ауқымды практикалық құндылығы. Вариация дәрежесі бойынша белгінің вариациясының шекарасын, осы белгі бойынша популяцияның біртектілігін, орташаның типтілігін, вариацияны анықтайтын факторлардың байланысын бағалауға болады. Вариациялық көрсеткіштер статистикалық популяцияларды сипаттау және ретке келтіру үшін қолданылады.

Материалдарды жинақтау және топтастыру нәтижелері статистикалық бақылау, статистикалық таралу қатары түрінде құрастырылған, топтастыру (айнымалы) атрибутқа сәйкес топтарға зерттелетін жиынтық бірліктерінің реттелген таралуын білдіреді. Топтастырудың негізі ретінде сапалық белгі алынса, онда мұндай таралу қатары деп аталады атрибутивті(мамандығы, жынысы, түсі және т.б. бойынша бөлу). Егер таралу қатары сандық негізде құрылса, онда мұндай қатар деп аталады вариациялық(бойы, салмағы, өлшемі бойынша бөлу жалақыжәне т.б.). Вариациялық қатар құру дегеніміз – төлсипат мәндеріне сәйкес популяция бірліктерінің сандық үлестіріміне тапсырыс беру, осы мәндермен (жиілік) популяция бірліктерінің санын санау, нәтижелерді кестеде реттеу.

Нұсқаның жиілігінің орнына оның жиілік (салыстырмалы жиілік) деп аталатын бақылаулардың жалпы көлеміне қатынасын қолдануға болады.

Вариациялық қатардың екі түрі бар: дискретті және интервал. Дискретті қатар- бұл осындай вариациялық қатар, оның құрылысы үзіліссіз өзгеретін белгілерге негізделген (дискретті белгілер). Соңғыларына кәсіпорындағы жұмысшылар саны, жалақы категориясы, отбасындағы балалар саны және т.б. Дискретті вариациялық қатар деп екі бағаннан тұратын кестені айтады. Бірінші баған көрсетеді нақты мағынаерекшелігі, ал екіншісінде – белгінің белгілі бір мәні бар халық бірліктерінің саны. Егер белгі үздіксіз өзгеріп отырса (белгілі бір шектерде кез келген мәндерді қабылдай алатын кіріс мөлшері, қызмет өтілі, кәсіпорынның негізгі қорларының құны және т.б.), онда бұл белгі үшін оны құруға болады. интервалдық вариациялық қатар.Интервалдық вариациялық қатарды құру кезіндегі кестеде де екі баған бар. Біріншісі «ден -ге дейін» (параметрлер) аралықтағы мүмкіндіктің мәнін, екіншісі - интервалға (жиілік) кіретін бірліктердің санын көрсетеді. Жиілік (қайталану жиілігі) – атрибут мәндерінің белгілі бір вариантының қайталану саны. Интервалдар жабық және ашық болуы мүмкін. Жабық интервалдар екі жағынан да шектелген, яғни. төменгі («нен») және жоғарғы («қаға») шекарасы болады. Ашық аралықтардың кез келген бір шекарасы болады: жоғарғы немесе төменгі. Егер опциялар өсу немесе кему ретімен орналасса, онда жолдар шақырылады дәрежелі.

Вариациялық қатарлар үшін жиіліктік жауап опцияларының екі түрі бар: кумулятивтік жиілік және жинақталған жиілік. Жиынтық жиілік функция мәні көрсетілген мәннен аз мәндерге қанша бақылау алғанын көрсетеді. Жиынтық жиілік алдыңғы топтардың барлық жиіліктерімен берілген топ үшін сипаттамалық жиіліктің мәндерін қосу арқылы анықталады. Жинақталған жиілік сипаттайды үлес салмағыатрибут мәндері берілген топтың жоғарғы шегінен аспайтын бақылау бірліктері. Осылайша, жинақталған жиілік берілгеннен үлкен емес мәні бар жиынтықтағы нұсқаның үлес салмағын көрсетеді. Жиілік, жиілік, абсолютті және салыстырмалы тығыздықтар, жиынтық жиілік және жиілік нұсқа шамасының сипаттамалары болып табылады.

Популяцияның статистикалық бірліктерінің белгісінің вариациялары, сондай-ақ таралу сипаты вариациялық қатардың көрсеткіштері мен сипаттамаларын пайдалана отырып зерттеледі, олар мыналарды қамтиды: орташа деңгейқатар, орташа сызықтық ауытқу, стандартты ауытқу, дисперсия, тербеліс коэффициенттері, вариациялар, асимметриялар, куртоз және т.б.

Орташа мәндер тарату орталығын сипаттау үшін қолданылады. Орташа мән – зерттелетін популяция мүшелеріне тән белгінің типтік деңгейі сандық түрде анықталатын жалпылама статистикалық сипаттама. Дегенмен, арифметикалық орталар таралудың басқа сипатымен сәйкес келетін жағдайлар болуы мүмкін, сондықтан вариациялық қатардың статистикалық сипаттамалары ретінде құрылымдық орташа деп аталатындар есептеледі - мода, медиана, сондай-ақ үлестіруді бөлетін квантилдер. қатарларды тең бөліктерге бөлу (квартил, дециль, процентиль, т.б.). ).

Сән -бұл таралу қатарында оның басқа мәндеріне қарағанда жиі кездесетін мүмкіндіктің мәні. Дискретті қатарлар үшін бұл ең жоғары жиіліктегі нұсқа. Интервалдық вариациялық қатарда режимді анықтау үшін ең алдымен модальды интервал деп аталатын оның орналасқан интервалын анықтау қажет. Интервалдары бірдей вариациялық қатарда модальды интервал ең жоғары жиілікпен, тең емес аралықтары бар қатарда – бірақ ең жоғары таралу тығыздығымен анықталады. Содан кейін тең аралықтары бар жолдардағы режимді анықтау үшін формуланы қолданыңыз

мұндағы Mo – сәннің құндылығы; x Mo – модальды интервалдың төменгі шегі; h-модальды интервал ені; / Mo - модальды интервал жиілігі; / Mo j – модальға дейінгі интервал жиілігі; / Mo+1 – постмодальдық интервалдың жиілігі, ал осы есептеу формуласындағы интервалдары тең емес қатар үшін / Mo, / Mo, / Mo жиіліктерінің орнына таралу тығыздықтарын пайдалану керек. Ақыл 0 _| , Ақыл 0> UMO+"

Егер бір режим болса, онда кездейсоқ шаманың ықтималдық үлестірімі бірмодальды деп аталады; бірнеше режим болса, ол мультимодальды (полимодальды, мультимодальды), екі режим болған жағдайда - бимодальды деп аталады. Әдетте, мультимодальдылық зерттелетін таралу қалыпты таралу заңына сәйкес келмейтінін көрсетеді. Біртекті популяциялар, әдетте, бірмодальды таралумен сипатталады. Мультивертекс сонымен қатар зерттелетін популяцияның гетерогенділігін көрсетеді. Екі немесе одан да көп шыңдардың пайда болуы біртекті топтарды оқшаулау үшін деректерді қайта топтауды қажет етеді.

Интервалдық вариация қатарында режимді гистограмма арқылы графикалық түрде анықтауға болады. Ол үшін гистограмманың ең жоғарғы бағанының жоғарғы нүктелерінен көршілес екі бағанның жоғарғы нүктелеріне дейін қиылысатын екі сызық сызылады. Содан кейін олардың қиылысу нүктесінен абсцисса осіне перпендикуляр түсіріледі. Перпендикулярға сәйкес абсциссадағы ерекшелік мәні режим болып табылады. Көп жағдайда жиынтықты жалпылама көрсеткіш ретінде сипаттағанда орташа арифметикалық емес, режимге артықшылық беріледі.

Медиана -бұл мүмкіндіктің орталық мәні; оған рейтингті тарату қатарының орталық мүшесі ие болады. Дискретті қатарда медиананың мәнін табу үшін алдымен оның реттік нөмірі анықталады. Бұл үшін жоқ жұп санбірлік, барлық жиіліктердің қосындысына бір қосылады, сан екіге бөлінеді. Егер жұп 1 саны болса, қатарда 2 медиана 1 болады, сондықтан бұл жағдайда медиана 2 медиана 1 мәндерінің орташа мәні ретінде анықталады. Осылайша, дискретті вариациялық қатардағы медиана қатарды опциялардың бірдей санын қамтитын екі бөлікке бөлетін мән болып табылады.

Интервалдық қатарда медиананың реттік нөмірі анықталғаннан кейін жинақталған жиіліктер (жиіліктер) бойынша медианалық интервал табылады, содан кейін медиананы есептеу формуласы арқылы медиананың өзі анықталады:

мұндағы Me – медиананың мәні; x Мен -медианалық интервалдың төменгі шегі; h-орташа интервал ені; - таралу қатарларының жиіліктерінің қосындысы; /D – медианаға дейінгі интервалдың жинақталған жиілігі; / Me – медианалық интервал жиілігі.

Медианды кумуляттың көмегімен графикалық түрде табуға болады. Ол үшін кумуляттың жинақталған жиіліктерінің (жиіліктерінің) шкаласында медиананың реттік нөміріне сәйкес нүктеден бастап абсцисса осіне параллель түзу кумулятпен қиылысқанша жүргізіледі. Әрі қарай, көрсетілген түзудің кумулятпен қиылысу нүктесінен абсцисса осіне перпендикуляр түсіріледі. Сызылған ординатаға (перпендикуляр) сәйкес x осіндегі белгінің мәні медиана болып табылады.

Медиана келесі қасиеттермен сипатталады.

  • 1. Ол оның екі жағында орналасқан атрибут мәндеріне тәуелді емес.
  • 2. Ол минималдылық қасиетіне ие, бұл атрибут мәндерінің медианадан абсолютті ауытқуларының қосындысы атрибут мәндерінің кез келген басқа мәннен ауытқуымен салыстырғанда ең төменгі мән екенін білдіреді.
  • 3. Екі таралуды белгілі медианалармен біріктіру кезінде жаңа таралудың медианалық мәнін алдын ала болжау мүмкін емес.

Медиананың бұл қасиеттері халыққа қызмет көрсету орындарының – мектептердің, емханалардың, жанармай құю станцияларының, су сорғыштарының және т.б. орналастыру орындарын жобалауда кеңінен қолданылады. Мысалы, қаланың белгілі бір орамында емхана салу жоспарланса, оны кварталдың ұзындығын емес, тұрғындардың санын екіге бөлетін нүктеге орналастырған дұрыс.

Моданың, медиананың және орташа арифметикалық шаманың қатынасы белгінің жиынтықтағы таралу сипатын көрсетеді, таралу симметриясын бағалауға мүмкіндік береді. Егер x Me онда қатардың оң жақ ассиметриясы бар. Қалыпты таралумен X -Мен - Мо.

К.Пирсон қисықтардың әртүрлі типтерін теңестіруге сүйене отырып, орташа асимметриялық үлестірімде арифметикалық орта, медиана және мода арасындағы келесі жуық шамамен байланыстар жарамды екенін анықтады:

мұндағы Me – медиананың мәні; Mo - сән құндылығы; x arifm – орташа арифметикалық шаманың мәні.

Егер вариациялық қатардың құрылымын егжей-тегжейлі зерттеу қажет болса, онда сипаттамалық мәндер медианаға ұқсас есептеледі. Мұндай мүмкіндік мәндері барлық тарату бірліктерін тең сандарға бөледі, олар квантил немесе градиент деп аталады. Квантильдер квартилге, децильге, процентильге және т.б.

Квартилдер халықты тең төрт бөлікке бөледі. Бірінші квартиль бірінші тоқсандық интервалды алдын ала анықтай отырып, бірінші квартилді есептеу формуласы арқылы медианаға ұқсас есептеледі:

мұндағы Qi – бірінші квартилдің мәні; xQ^-бірінші квартильдік интервалдың төменгі шегі; h- бірінші тоқсандық интервалдың ені; /, - интервалдық қатардың жиіліктері;

Бірінші квартильдік интервалдың алдындағы аралықта жинақталған жиілік; Jq ( - бірінші квартильдік интервалдың жиілігі.

Бірінші квартиль популяция бірліктерінің 25% оның мәнінен аз, ал 75% көп екенін көрсетеді. Екінші квартиль медианаға тең, яғни. Q2 =мен.

Аналогия бойынша, үшінші тоқсандық интервалды бұрын тапқан үшінші квартиль есептеледі:

мұндағы үшінші квартильдік интервалдың төменгі шегі; h- үшінші квартиль интервалының ені; /, - интервалдық қатардың жиіліктері; /X"-алдындағы аралықта жинақталған жиілік

Г

үшінші квартиль аралығы; Jq – үшінші квартил интервалының жиілігі.

Үшінші квартиль популяция бірліктерінің 75% оның мәнінен аз, ал 25% көп екенін көрсетеді.

Үшінші және бірінші квартилдер арасындағы айырмашылық квартиларалық диапазон болып табылады:

мұндағы Aq – квартильаралық интервалдың мәні; Q 3 -үшінші квартильдің мәні; Q, - бірінші квартилдің мәні.

Децильдер популяцияны 10 тең бөлікке бөледі. Ондық – таралу қатарындағы бастың оннан бір бөлігіне сәйкес келетін белгінің мәні. Квартилдерге ұқсастық бойынша, бірінші ондық популяция бірліктерінің 10% оның мәнінен аз, ал 90% -ы көп екенін көрсетеді, ал тоғызыншы дециль популяция бірлігінің 90% оның мәнінен аз екенін, ал 10% -ын көрсетеді. Көбірек. Тоғызыншы және бірінші ондықтардың қатынасы, яғни. децильдік коэффициент, ең бай халықтың 10% және ең аз ауқатты халықтың 10% табыс деңгейінің арақатынасын өлшеу үшін табыс дифференциациясын зерттеуде кеңінен қолданылады. Процентильдер рейтингтегі халықты 100 тең бөлікке бөледі. Процентильдердің есептелуі, мағынасы және қолданылуы децильдерге ұқсас.

Квартилдер, децильдер және басқа құрылымдық сипаттамалар кумуляттың көмегімен медианаға ұқсастық арқылы графикалық түрде анықталуы мүмкін.

Вариацияның өлшемін өлшеу үшін келесі көрсеткіштер қолданылады: вариация диапазоны, орташа сызықтық ауытқу, стандартты ауытқу және дисперсия. Вариация диапазонының шамасы толығымен қатардың шеткі мүшелерінің таралуының кездейсоқтығына байланысты. Бұл көрсеткіш атрибут мәндеріндегі ауытқулардың амплитудасы қандай екенін білу маңызды болған жағдайларда қызығушылық тудырады:

Қайда R-вариация диапазонының мәні; x max – мүмкіндіктің максималды мәні; x тт -мүмкіндіктің ең төменгі мәні.

Вариация диапазонын есептеу кезінде қатар мүшелерінің басым көпшілігінің мәні есепке алынбайды, бұл ретте вариация қатар мүшесінің әрбір мәнімен байланысты. Бұл кемшілік жеке белгілер мәндерінің олардың орташа мәнінен ауытқуынан алынған орташа мәндер болып табылатын көрсеткіштерден айырылады: орташа сызықтық ауытқу және стандартты ауытқу. Орташа мәннен жеке ауытқулар мен белгілі бір белгінің ауытқуы арасында тікелей байланыс бар. Неғұрлым құбылмалылық күшті болса, орташадан ауытқулардың абсолютті мөлшері соғұрлым үлкен болады.

Орташа сызықтық ауытқу - жеке опциялардың орташа мәнінен ауытқуларының абсолютті мәндерінің орташа арифметикалық мәні.

Топталмаған деректер үшін орташа сызықтық ауытқу

мұндағы / pr - орташа сызықтық ауытқудың мәні; x, - - мүмкіндіктің мәні; X - P -халық бірлігінің саны.

Топтастырылған сериялардың орташа сызықтық ауытқуы

мұндағы / vz - орташа сызықтық ауытқудың мәні; x, - ерекшеліктің мәні; X -зерттелетін популяция үшін белгінің орташа мәні; / - жеке топтағы халық бірліктерінің саны.

Бұл жағдайда ауытқу белгілері еленбейді, әйтпесе барлық ауытқулардың қосындысы нөлге тең болады. Талданатын мәліметтерді топтастыруға байланысты орташа сызықтық ауытқу арқылы есептеледі әртүрлі формулалар: топтастырылған және топталмаған деректер үшін. Орташа сызықтық ауытқу өзінің шарттылығына байланысты басқа вариация көрсеткіштерінен бөлек тәжірибеде салыстырмалы түрде сирек қолданылады (атап айтқанда, жеткізудің біркелкілігі тұрғысынан шарттық міндеттемелердің орындалуын сипаттау үшін; сыртқы сауда айналымын талдау кезінде, қызметкерлер құрамы, өндіріс ырғағы, өндірістің технологиялық ерекшеліктерін ескере отырып өнім сапасы және т.б.).

Стандартты ауытқу зерттелетін белгінің жеке мәндерінің популяция бойынша орташа мәннен орташа қанша ауытқуын сипаттайды және зерттелетін белгінің бірліктерімен көрсетіледі. Стандартты ауытқу вариацияның негізгі өлшемдерінің бірі бола отырып, біртекті популяциядағы белгінің өзгеру шекараларын бағалауда, қалыпты таралу қисығының ординаталарының мәндерін анықтауда, сондай-ақ іріктемелік бақылауды ұйымдастыруға және таңдама сипаттамаларының дәлдігін орнатуға байланысты есептеулер. Топталмаған деректер үшін стандартты ауытқу келесі алгоритм бойынша есептеледі: орташадан әрбір ауытқу квадрат болып табылады, барлық квадраттар қосылды, содан кейін квадраттар қосындысы қатардағы мүшелер санына бөлінеді және квадрат түбірі мынадан алынады. үлес:

мұндағы a Iip – стандартты ауытқудың мәні; Xj-ерекшелік мәні; X- зерттелетін жиынтық үшін атрибуттың орташа мәні; P -халық бірлігінің саны.

Топтастырылған талданатын деректер үшін деректердің стандартты ауытқуы өлшенген формула арқылы есептеледі

Қайда - стандартты ауытқудың мәні; Xj-ерекшелік мәні; X -зерттелетін популяция үшін белгінің орташа мәні; fx-белгілі бір топтағы халық бірліктерінің саны.

Екі жағдайда да түбір астындағы өрнек дисперсия деп аталады. Осылайша, дисперсия белгілер мәндерінің олардың орташа мәнінен ауытқуларының орташа квадраты ретінде есептеледі. Функцияның өлшенбеген (қарапайым) мәндері үшін дисперсия анықталады келесідей:

Салмақталған сипаттамалық мәндер үшін

Сондай-ақ дисперсияны есептеудің арнайы жеңілдетілген әдісі бар: жалпы түрде

өлшенбеген (қарапайым) мүмкіндік мәндері үшін салмақты сипаттамалық мәндер үшін
шартты нөлден бастап санау әдісін қолдану

мұндағы a 2 – дисперсияның мәні; x, - - мүмкіндіктің мәні; X -функцияның орташа мәні, h-топ интервалының мәні, t 1 -салмағы (A =

Дисперсия статистикада тәуелсіз өрнекке ие және вариацияның маңызды көрсеткіштерінің бірі болып табылады. Ол зерттелетін белгінің өлшем бірліктерінің квадратына сәйкес бірліктермен өлшенеді.

Дисперсия келесі қасиеттерге ие.

  • 1. Тұрақты шаманың дисперсиясы нөлге тең.
  • 2. Мүмкіндіктің барлық мәндерін бірдей А мәніне азайту дисперсия мәнін өзгертпейді. Бұл ауытқулардың орташа квадратын атрибуттың берілген мәндерінен емес, олардың кейбір тұрақты саннан ауытқуларынан есептеуге болатынын білдіреді.
  • 3. Мүмкіндіктің барлық мәндерін азайту крет дисперсияны азайтады к 2 есе, ал стандартты ауытқу - в крет, яғни. барлық атрибут мәндерін кейбір тұрақты санға бөлуге болады (айталық, сериялар интервалының мәні бойынша), стандартты ауытқуды есептеуге болады, содан кейін тұрақты санға көбейтіледі.
  • 4. Кез келген мәннен ауытқудың орташа квадратын есептесек Және сағатбелгілі бір дәрежеде орташа арифметикалық мәннен ерекшеленеді, онда ол әрқашан орташа арифметикалық мәннен есептелген ауытқулардың орташа квадратынан үлкен болады. Бұл жағдайда ауытқулардың орташа квадраты нақты анықталған мән бойынша - орташа және осы шартты түрде алынған мән арасындағы айырмашылықтың квадраты бойынша үлкен болады.

Альтернативті белгінің вариациясы – зерттелетін мүліктің бас бірліктерде болуы немесе болмауы. Сандық түрде альтернативті атрибуттың вариациясы екі мәнмен өрнектеледі: бірлікте зерттелетін қасиеттің болуы бір (1) арқылы, ал оның жоқтығы нөлмен (0) белгіленеді. Зерттелетін қасиетке ие бірліктердің үлесі P арқылы, ал бұл қасиеті жоқ бірліктердің үлесі келесі арқылы белгіленеді. Г.Сонымен, альтернативті атрибуттың дисперсиясы берілген қасиетке ие (P) бірліктердің осы қасиеті жоқ бірліктердің үлесіне көбейтіндісіне тең. (G).Популяцияның ең үлкен вариациясына халықтың жалпы көлемінің 50%-ын құрайтын халықтың бір бөлігінде ерекшелік бар, ал халықтың басқа бөлігінде, сонымен қатар 50% тең, жоқ жағдайларда қол жеткізіледі. бұл мүмкіндік, ал дисперсия 0,25 максималды мәнге жеткенде, m .e. P = 0,5, G= 1 - P \u003d 1 - 0,5 \u003d 0,5 және o 2 \u003d 0,5 0,5 \u003d 0,25. Бұл көрсеткіштің төменгі шегі нөлге тең, ол жиынтықта вариация болмайтын жағдайға сәйкес келеді. Альтернативті белгінің дисперсиясының практикалық қолданылуы таңдамалы бақылауды жүргізу кезінде сенімділік интервалдарын құру болып табылады.

Дисперсия және стандартты ауытқу неғұрлым аз болса, популяция соғұрлым біртекті және орташа көрсеткіш соғұрлым типтік болады. Статистика тәжірибесінде әртүрлі белгілердің вариацияларын салыстыру жиі қажет болады. Мысалы, жұмысшылардың жасы мен олардың біліктілігінің, еңбек өтілі мен жалақысының, өзіндік құн мен пайданың, еңбек өтілі мен еңбек өнімділігінің т.б. өзгерулерін салыстыру қызықты. Мұндай салыстырулар үшін сипаттамалардың абсолютті өзгергіштігінің көрсеткіштері жарамсыз: жылдармен көрсетілген жұмыс тәжірибесінің өзгермелілігін рубльмен көрсетілген жалақының өзгеруімен салыстыру мүмкін емес. Осындай салыстыруларды, сондай-ақ әртүрлі арифметикалық құралдармен бірнеше популяциялардағы бір атрибуттың ауытқуын салыстыруды жүзеге асыру үшін вариация көрсеткіштері қолданылады - тербеліс коэффициенті, вариацияның сызықтық коэффициенті және вариация коэффициенті, олар өлшемді көрсетеді. экстремалды мәндердің орташа шама шамасында ауытқуы.

Тербеліс факторы:

Қайда V R -тербеліс коэффициентінің мәні; Р- вариация диапазонының мәні; X -

Сызықтық вариация коэффициенті».

Қайда vj-сызықтық вариация коэффициентінің мәні; мен-орташа сызықтық ауытқудың мәні; X -зерттелетін популяция үшін белгінің орташа мәні.

Вариация коэффициенті:

Қайда Ва-өзгеру коэффициентінің мәні; a - стандартты ауытқудың мәні; X -зерттелетін популяция үшін белгінің орташа мәні.

Тербеліс коэффициенті – зерттелетін белгінің орташа мәніне өзгеру диапазонының пайыздық қатынасы, ал вариацияның сызықтық коэффициенті – зерттелетін белгінің орташа мәніне орташа сызықтық ауытқудың пайызбен көрсетілген қатынасы. Вариация коэффициенті – зерттелетін белгінің орташа мәніне стандартты ауытқудың пайызы. Пайызбен көрсетілген салыстырмалы шама ретінде әртүрлі белгілердің өзгеру дәрежесін салыстыру үшін өзгеру коэффициенті қолданылады. Вариация коэффициентінің көмегімен біртектілік бағаланады статистикалық халық саны. Егер вариация коэффициенті 33%-дан аз болса, онда зерттелетін популяция біртекті, ал вариация әлсіз. Егер вариация коэффициенті 33%-дан жоғары болса, онда зерттелетін популяция гетерогенді, вариация күшті, ал орташа мән атипті болып табылады және оны осы популяцияның жалпылау көрсеткіші ретінде пайдалануға болмайды. Сонымен қатар, вариация коэффициенттері әртүрлі популяциялардағы бір белгінің ауытқуын салыстыру үшін қолданылады. Мысалы, екі кәсіпорындағы жұмысшылардың еңбек өтілінің вариациясын бағалау. Коэффициент мәні неғұрлым жоғары болса, ерекшеліктің өзгеруі соғұрлым маңызды болады.

Есептелген квартилдерге сүйене отырып, формула арқылы тоқсандық вариацияның салыстырмалы көрсеткішін де есептеуге болады.

қайда Q 2 Және

Квартильаралық диапазон формула бойынша анықталады

Төтенше мәндерді пайдаланумен байланысты кемшіліктерді болдырмау үшін вариация диапазонының орнына квартильді ауытқу қолданылады:

Тең емес интервалдық вариациялық қатарлар үшін таралу тығыздығы да есептеледі. Ол сәйкес жиіліктің немесе жиіліктің интервал мәніне бөлінген бөлігі ретінде анықталады. Тең емес интервалдық қатарларда абсолютті және салыстырмалы таралу тығыздықтары қолданылады. Абсолютті таралу тығыздығы интервалдың бірлік ұзындығына жиілік болып табылады. Салыстырмалы таралу тығыздығы – интервал ұзындығы бірлігіне келетін жиілік.

Жоғарыда айтылғандардың барлығы таралу заңы қалыпты таралу заңымен жақсы сипатталған немесе оған жақын таралу қатарлары үшін дұрыс.

топтастыру- бұл халықтың қандай да бір жағынан біртекті топтарға бөлінуі.

Қызметтік тапсырма. Онлайн калькулятордың көмегімен сіз:

  • вариациялық қатар құру, гистограмма мен көпбұрышты құру;
  • вариация көрсеткіштерін табыңыз (орташа, режим (соның ішінде және графикалық түрде), медиана, вариация диапазоны, квартилдер, децильдер, квартилдік дифференциация коэффициенті, вариация коэффициенті және басқа көрсеткіштер);

Нұсқау. Қатарларды топтау үшін алынған вариациялық қатардың түрін (дискретті немесе интервал) таңдап, деректер көлемін (жолдар санын) көрсету керек. Алынған шешім Word файлында сақталады (статистикалық деректерді топтастыру мысалын қараңыз).

Топтау әлдеқашан орындалған болса және дискретті вариациялық қатарнемесе интервалдық қатар, содан кейін онлайн калькуляторды пайдалану керек Вариация көрсеткіштері. Бөлу түрі туралы гипотезаны тексеруТарату нысанын зерттеу қызметін пайдалану арқылы өндірілген.

Статистикалық топтастыру түрлері

Вариациялық қатар. Дискретті кездейсоқ шаманы бақылау жағдайында бір мәнді бірнеше рет кездестіруге болады. Кездейсоқ шамасының мұндай мәндері x i тіркеледі, бұл n i n бақылауда қанша рет пайда болғанын көрсетеді, бұл осы мәннің жиілігі.
Үздіксіз кездейсоқ шама жағдайында тәжірибеде топтау қолданылады.
  1. Типологиялық топтастыру- бұл зерттелетін сапалық жағынан біркелкі емес популяцияны таптарға, әлеуметтік-экономикалық типтерге, бірліктердің біртекті топтарына бөлу. Бұл топтауды құру үшін Дискретті вариациялық қатар параметрін пайдаланыңыз.
  2. Құрылымдық топтастыру деп аталады, онда біртекті популяция қандай да бір өзгермелі белгісіне қарай құрылымын сипаттайтын топтарға бөлінеді. Бұл топтастыруды құру үшін Interval series параметрін пайдаланыңыз.
  3. Зерттелетін құбылыстар мен олардың ерекшеліктері арасындағы байланысты ашатын топтастыру деп аталады аналитикалық топ(қатарларды аналитикалық топтастыруды қараңыз).

№1 мысал. 2-кестеге сәйкес Ресей Федерациясының 40 коммерциялық банктері үшін тарату сериясын құрастырыңыз. Алынған бөлу қатары бойынша анықтаңыз: бір коммерциялық банкке орташа пайда, бір коммерциялық банкке орташа несиелік салымдар, пайданың модальды және медиандық мәні; квартилдер, децильдер, вариация диапазоны, орташа сызықтық ауытқу, стандартты ауытқу, вариация коэффициенті.

Шешім:
тарауда «Статистикалық қатарлардың түрі»дискретті серияларды таңдаңыз. Excel бағдарламасынан Қою түймесін басыңыз. Топтар саны: Стерджесс формуласы бойынша

Статистикалық топтастыруды құру принциптері

Өсу ретімен реттелген бақылаулар қатары вариациялық қатар деп аталады. топтастыру белгісіхалықтың жеке топтарға бөлінуінің белгісі болып табылады. Ол топтың негізі деп аталады. Топтастыру сандық және сапалық сипаттамаларға негізделуі мүмкін.
Топтастырудың негізін анықтағаннан кейін зерттелетін популяцияны қандай топтарға бөлу керектігі туралы мәселені шешу керек.

Статистикалық мәліметтерді өңдеу үшін дербес компьютерлерді пайдалану кезінде объектінің бірліктерін топтастыру стандартты процедуралар арқылы жүзеге асырылады.
Осындай процедуралардың бірі топтардың оңтайлы санын анықтау үшін Sturgess формуласын қолдануға негізделген:

k = 1+3,322*lg(N)

Мұндағы k – топтардың саны, N – халық бірліктерінің саны.

Жартылай аралықтардың ұзындығы h=(x max -x min)/k ретінде есептеледі

Содан кейін n i жиілік ретінде қабылданатын осы интервалдардағы бақылаулардың соққыларының санын есептеңіз. Мәндері 5-тен аз болатын аз жиіліктер (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Жаңа мәндер ретінде x i =(c i-1 +c i)/2 аралықтарының ортаңғы нүктелері алынады.

№3 мысал. 5% өздігінен кездейсоқ үлгіні алу нәтижесінде ылғалдылығы бойынша өнімдердің келесідей таралуы алынды. Есептеңіз: 1) ылғалдылықтың орташа пайызы; 2) ылғалдылықтың өзгеруін сипаттайтын көрсеткіштер.
Шешім калькулятордың көмегімен алынды: №1 мысал

Вариациялық қатар құру. Табылған қатар негізінде таралу көпбұрышын, гистограмманы және кумулятты құрастырыңыз. Режим мен медиананы анықтаңыз.
Шешімді жүктеп алу

Мысал. Таңдамалы бақылау нәтижелері бойынша (А қосымшасы үлгісі):
а) вариациялар қатарын жасау;
б) салыстырмалы жиіліктерді және жинақталған салыстырмалы жиіліктерді есептеу;
в) көпбұрыш салу;
г) эмпирикалық таралу функциясын құрастыру;
д) эмпирикалық үлестіру функциясының графигін салу;
е) сандық сипаттамаларды есептеу: орташа арифметикалық, дисперсия, стандартты ауытқу. Шешім

4-кестеде (1-қосымша) келтірілген және сіздің нұсқаңызға сәйкес келетін деректерге сүйене отырып, орындаңыз:

  1. Құрылымдық топтастыру негізінде топтардың саны 6-ға тең деп есептей отырып, тең тұйық аралықтарды пайдаланып вариациялық жиілік пен жинақтаушы таралу қатарын құрыңыз. Нәтижелерді кестеде және графикалық түрде көрсетіңіз.
  2. Вариациялық таралу қатарын есептеу арқылы талдаңыз:
    • белгінің орташа арифметикалық мәні;
    • режим, медиана, 1-квартиль, 1-ші және 9-шы дециль;
    • стандартты ауытқу;
    • вариация коэффициенті.
  3. Қорытынды жасау.

Міндетті: қатарларды ранжирлеу, аралық таралу қатарын құру, диапазонды және интервалдық қатарлар үшін ортаны, орташа дисперсияны, режимді және медиананы есептеу.

Бастапқы мәліметтер негізінде дискретті вариациялық қатарды құрастырыңыз; оны статистикалық кесте және статистикалық графиктер түрінде көрсетіңіз. 2). Бастапқы деректерге сүйене отырып, интервалдары бірдей интервалдық вариациялық қатарды құрастырыңыз. Аралықтардың санын өзіңіз таңдап, осы таңдауды түсіндіріңіз. Алынған вариациялық қатарды статистикалық кесте және статистикалық графиктер түрінде көрсетіңіз. Қолданылатын кестелер мен графиктердің түрлерін көрсетіңіз.

Зейнетақы қорындағы клиенттерге қызмет көрсетудің орташа ұзақтығын анықтау мақсатында клиенттердің саны өте көп, өздігінен кездейсоқ қайталанбайтын іріктеу схемасы бойынша 100 клиентке сауалнама жүргізілді. Сауалнама нәтижелері кестеде берілген. Табу:
а) 0,9946 ықтималдықпен зейнетақы қорының барлық клиенттері үшін орташа қызмет көрсету уақыты жасалған шекаралар;
б) қызмет көрсету ұзақтығы 6 минуттан аз барлық қор клиенттерінің үлесі іріктеудегі осындай клиенттердің үлесінен 10%-дан аспайтын (абсолюттік мәнде) ерекшелену ықтималдығы;
в) 0,9907 ықтималдылықпен қызмет көрсету ұзақтығы 6 минуттан аз барлық қор клиенттерінің үлесі іріктеудегі осындай клиенттердің үлесінен 10%-дан аспайтын ерекшеленетінін дәлелдеуге болатын қайта іріктеу көлемі (да абсолютті мән).
2. 1-есепке сәйкес, Пирсонның X 2 тестін қолданып, мәнділік деңгейінде α = 0,05, кездейсоқ шама X – тұтынушыларға қызмет көрсету уақыты – үлестірілетін гипотезаны тексеріңіз. қалыпты заң. Бір сызбада эмпирикалық таралу гистограммасын және сәйкес қалыпты қисық сызығын тұрғызыңыз.
Шешімді жүктеп алу

100 элементтен тұратын үлгі берілген. Қажетті:

  1. Рейтингтік вариациялық қатарды құру;
  2. Қатардың ең үлкен және ең кіші мүшелерін табыңыз;
  3. Интервалдық қатарды құру үшін вариация диапазоны мен оңтайлы интервалдар санын табыңыз. Интервалдық қатардың интервалының ұзындығын табыңыз;
  4. Интервалдық қатарды құру. Құрастырылған интервалдарға түсетін үлгі элементтерінің жиіліктерін табыңыз. Әрбір интервалдың ортаңғы нүктелерін табыңыз;
  5. Жиіліктердің гистограммасын және көпбұрышын тұрғызыңыз. Қалыпты таралумен салыстыру (аналитикалық және графикалық);
  6. Эмпирикалық үлестіру функциясының графигін салу;
  7. Іріктеменің сандық сипаттамаларын есептеңіз: іріктеменің орташа және орталық таңдау моменті;
  8. Стандартты ауытқудың, қиғаштық пен куртоздың жуық мәндерін есептеңіз (MS Excel талдау пакетін пайдалану). Шамамен есептелген мәндерді нақты мәндермен салыстыру (MS Excel формулалары арқылы есептелген);
  9. Таңдалған графикалық сипаттамаларды сәйкес теориялық сипаттамалармен салыстырыңыз.
Шешімді жүктеп алу

Бізде келесі үлгі деректер (10% үлгі, механикалық) шығарылым және пайда сомасы, миллион рубль. Бастапқы деректер бойынша:
13.1-тапсырма.
13.1.1. Бес топты тең аралықпен құра отырып, кәсіпорындарды пайда көлемі бойынша бөлудің статистикалық қатарын құру. Сюжетті тарату серияларының сюжеттері.
13.1.2. Пайда мөлшері бойынша кәсіпорындарды бөлу қатарының сандық сипаттамаларын есептеңіз: орташа арифметикалық, стандартты ауытқу, дисперсия, вариация коэффициенті V. Қорытынды жасаңыз.
13.2-тапсырма.
13.2.1. 0,997 ықтималдықпен жалпы халық санындағы бір кәсіпорынның пайдасының мөлшері жасалатын шекараларды анықтаңыз.
13.2.2. Пирсонның x2-критериясын пайдаланып, мәнділік деңгейінде α, кездейсоқ шама Х - пайда мөлшері - қалыпты заңға сәйкес бөлінеді деген гипотезаны тексеріңіз.
13.3-тапсырма.
13.3.1. Таңдамалы регрессия теңдеуінің коэффициенттерін анықтаңыз.
13.3.2. Өндірілген өнімнің өзіндік құны (Х) мен кәсіпорынға шаққандағы пайда мөлшері (У) арасындағы корреляцияның болуы мен сипатын белгілеңіз. Шашырау және регрессия сызығын салыңыз.
13.3.3. Сызықтық корреляция коэффициентін есептеңіз. Стьюденттің t-тестінің көмегімен корреляция коэффициентінің маңыздылығын тексеріңіз. Чаддок шкаласы арқылы Х және У факторларының арасындағы байланыстың жақындығы туралы қорытынды жасаңыз.
Нұсқаулар . 13.3-тапсырма осы сервис арқылы орындалады.
Шешімді жүктеп алу

Тапсырма. Төмендегі деректер клиенттердің келісім-шарт жасауға жұмсаған уақытын көрсетеді. Ұсынылған деректердің интервалдық вариациялық қатарын, гистограмманы құру, бейтарап бағалауды табу математикалық күту, дисперсияны біржақты және бейтарап бағалау.

Мысал. 2 кестеге сәйкес:
1) Ресей Федерациясының 40 коммерциялық банкі үшін тарату сериясын құру:
А) пайда мөлшері бойынша;
В) несиелік салымдардың көлемі бойынша.
2) Алынған таралу қатары бойынша анықтаңыз:
A) коммерциялық банкке шаққандағы орташа пайда;
B) коммерциялық банкке орташа есеппен несиелік салымдар;
C) пайданың модальды және медиандық мәні; квартилдер, децильдер;
D) несиелік салымдардың модальды және медиандық құны.
3) 1-тармақта алынған таралу қатары бойынша есептеңіз:
а) вариация диапазоны;
б) орташа сызықтық ауытқу;
в) стандартты ауытқу;
г) вариация коэффициенті.
Қажетті есептеулерді кесте түрінде жазыңыз. Нәтижелерді талдаңыз. Өзіңіздің қорытындыларыңызды жасаңыз.
Алынған таралу қатарын сызыңыз. Режим мен медиананы графикалық түрде анықтаңыз.

Шешімі:
Бірдей аралықтары бар топтауды құру үшін біз статистикалық деректерді топтау қызметін қолданамыз.

1-сурет - Параметрлерді енгізу

Параметрлердің сипаттамасы
Жолдар саны: бастапқы деректер мөлшері. Егер қатардың өлшемі аз болса, оның нөмірін көрсетіңіз. Таңдау жеткілікті үлкен болса, Excel бағдарламасынан қою түймесін басыңыз.
Топтар саны: 0 - топтардың саны Стерджесс формуласымен анықталады.
Топтардың белгілі бір саны көрсетілсе, оны көрсетіңіз (мысалы, 5).
Жол түрі: Дискретті қатар.
Маңыздылық деңгейі: мысалы, 0,954 . Бұл параметр орташа мән үшін сенімділік аралығын анықтау үшін орнатылған.
Үлгі: Мысалы, 10% механикалық сынама алынады. 10 санын көрсетіңіз. Біздің деректеріміз үшін біз 100 көрсетеміз.

Топтастыру әдісі де өлшеуге мүмкіндік береді вариациябелгілердің (өзгермелілігі, ауытқуы). Популяция бірліктерінің салыстырмалы түрде аз санымен вариация популяцияны құрайтын бірліктердің реттелген қатары негізінде өлшенеді. Жол деп аталады дәрежеліегер бірліктер өсу (кему) сипатында орналасса.

Дегенмен, қажет болған кезде рейтингті сериялар өте индикативті болып табылады Салыстырмалы сипаттамаларвариациялар. Сонымен қатар, көп жағдайда белгілі бір қатар түрінде көрсету іс жүзінде қиын болатын көптеген бірліктерден тұратын статистикалық агрегаттармен айналысуға тура келеді. Осыған байланысты статистикалық мәліметтермен алғашқы жалпы танысу үшін және әсіресе белгілердің вариациясын зерттеуді жеңілдету үшін әдетте зерттелетін құбылыстар мен процестер топтарға біріктіріледі, ал топтастыру нәтижелері топтық кестелер түрінде құрастырылады. .

Егер топтық кестеде тек екі баған болса - таңдалған мүмкіндікке (параметрлер) және топтар санына (жиіліктер немесе жиіліктер) сәйкес топтар, ол деп аталады. таратуға жақын.

Таралу диапазоны -атрибуттың нұсқалары мен жиіліктерін қамтитын екі бағанасы бар топтық кестеде көрсетілетін бір атрибут бойынша құрылымдық топтастырудың қарапайым түрі. Көптеген жағдайларда мұндай құрылымдық топтастырумен, т.б. таралу қатарын құрастырумен бастапқы статистикалық материалды зерттеу басталады.

Бөлу қатары түріндегі құрылымдық топтастыру, егер таңдалған топтар тек жиіліктермен ғана емес, басқа статистикалық көрсеткіштермен де сипатталса, шынайы құрылымдық топтастыруға айналуы мүмкін. Тарату қатарларының негізгі мақсаты – белгілердің вариациясын зерттеу. Таралу қатарларының теориясы математикалық статистикамен егжей-тегжейлі әзірленген.

Тарату сериялары бөлінеді атрибутивті(атрибутивтік белгілер бойынша топтау, мысалы, халықтың жынысы, ұлты, отбасылық жағдайы және т.б. бойынша бөлінуі) және вариациялық(сандық белгілері бойынша топтастыру).

Вариациялық қатарекі бағанды ​​қамтитын топтық кесте: бір сандық атрибутқа және әр топтағы бірліктердің санына сәйкес бірліктерді топтастыру. Вариациялық қатардағы интервалдар әдетте тең және тұйық құрылады. вариациялық қатаржан басына шаққандағы ақшалай табысы бойынша Ресей халқының келесі тобы болып табылады (3.10-кесте).

3.10-кесте

Ресей халқының 2004-2009 жж. жан басына шаққандағы орташа табысы бойынша бөлінуі

Жан басына шаққандағы орташа ақшалай табыс бойынша халық топтары, руб./ай

Топтағы халық саны, жалпы саннан %

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

25 000,0 астам

Барлық халық

Вариациялық қатарлар өз кезегінде дискретті және интервалдық болып бөлінеді. Дискреттівариациялық қатар тар шектерде өзгеретін дискретті белгілердің нұсқаларын біріктіреді. Дискретті вариациялық қатарға мысал ретінде орыс отбасыларының балаларының санына қарай бөлінуін келтіруге болады.

Интервалвариациялық қатарлар кең ауқымда өзгеретін үздіксіз мүмкіндіктердің немесе дискретті мүмкіндіктердің нұсқаларын біріктіреді. Интервалдық қатар - жан басына шаққандағы орташа ақшалай кіріс бойынша Ресей халқының таралуының вариациялық қатары.

Дискретті вариациялық қатарлар практикада көп қолданылмайды. Сонымен қатар, оларды құрастыру қиын емес, өйткені топтардың құрамы зерттелетін топтастыру сипаттамаларына нақты ие болатын нақты нұсқалармен анықталады.

Интервалдық вариациялық қатарлар кең тараған. Оларды құрастыру кезінде топтардың саны, сондай-ақ белгіленетін интервалдардың мөлшері туралы қиын сұрақ туындайды.

Бұл мәселені шешу принциптері статистикалық топтастыруларды құру әдістемесі тарауында көрсетілген (3.3-тармақты қараңыз).

Вариациялық қатарлар әртүрлі ақпаратты ықшамдауға немесе ықшамдауға арналған құрал болып табылады; олар вариацияның табиғаты туралы жеткілікті түрде нақты пайымдаулар жасау үшін, зерттелетін жиынтыққа кіретін құбылыстардың белгілеріндегі айырмашылықтарды зерттеу үшін пайдаланылуы мүмкін. Бірақ маңыздывариациялық қатарлар - олардың негізінде вариацияның арнайы жалпылаушы сипаттамалары есептелінеді (7-тарауды қараңыз).

Әр түрлі үлгі мәндерін шақырайық опциялармәндер қатарын белгілеңіз және мынаны белгілеңіз: X 1 , X 2, …. Ең алдымен, жасайық ауқымдыопциялар, яғни. оларды өсу немесе кему ретімен орналастырыңыз. Әрбір опция үшін өз салмағы көрсетіледі, яғни. осы опцияның жалпы халық санына қосқан үлесін сипаттайтын сан. Жиіліктер немесе жиіліктер салмақ ретінде әрекет етеді.

Жиілік n i опция x iбұл опция қарастырылған іріктеу жиынында қанша рет кездесетінін көрсететін сан деп аталады.

Жиілік немесе салыстырмалы жиілік w i опция x iнұсқа жиілігінің барлық варианттардың жиіліктерінің қосындысына қатынасына тең сан деп аталады. Жиілік таңдамалы жиынтық бірліктерінің қай бөлігінде берілген нұсқа бар екенін көрсетеді.

Өсу (немесе кему) ретімен жазылған сәйкес салмақтары (жиіліктері немесе жиіліктері) бар опциялар тізбегі деп аталады. вариациялық қатар.

Вариациялық қатар дискретті және интервал болып табылады.

Дискретті вариациялық қатар үшін атрибуттың нүктелік мәндері көрсетіледі, интервалдық қатар үшін атрибут мәндері интервалдар түрінде көрсетіледі. Вариациялық қатарлар жиіліктердің немесе салыстырмалы жиіліктердің (жиіліктердің) таралуын көрсете алады, әрбір опция үшін қандай мән көрсетілгеніне байланысты – жиілік немесе жиілік.

Жиілік үлестірімінің дискретті вариациялық қатарыұқсайды:

Жиіліктер i = 1, 2, …, формуласы бойынша табылады. м.

w 1 +w 2 + … + w m = 1.

Мысал 4.1. Берілген сандар жиыны үшін

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

жиілік пен жиілік үлестірімінің дискретті вариациялық қатарын құру.

Шешім . Халықтың саны n= 10. Дискретті жиілікті таралу қатары пішінге ие

Интервалдық қатарлар ұқсас жазу формасына ие.

Жиілік үлестірімінің интервалдық вариациялық қатарыбылай жазылады:

Барлық жиіліктердің қосындысы жалпы саныбақылаулар, яғни. жалпы көлемі: n = n 1 +n 2 + … + nм .

Салыстырмалы жиіліктердің (жиіліктердің) таралуының интервалдық вариациялық қатарыұқсайды:

Жиілік i = 1, 2, …, формуласымен табылады. м.

Барлық жиіліктердің қосындысы біреуге тең: w 1 +w 2 + … + w m = 1.

Көбінесе тәжірибеде интервалдық қатарлар қолданылады. Егер статистикалық іріктеме деректері көп болса және олардың мәндері бір-бірінен ерікті түрде аз мөлшерде ерекшеленсе, онда бұл деректерге арналған дискретті қатарлар айтарлықтай қиын және әрі қарай зерттеу үшін қолайсыз болады. Бұл жағдайда деректерді топтау қолданылады, яғни. атрибуттың барлық мәндерін қамтитын интервал бірнеше ішінара интервалдарға бөлінеді және әрбір аралық үшін жиілікті есептеп, интервалдық қатар алынады. Жартылай интервалдардың ұзындықтары бірдей болады деп, интервалдық қатарды құру схемасын толығырақ жазайық.

2.2 Интервалдық қатарды құру

Интервалдық қатарды құру үшін сізге қажет:

аралықтардың санын анықтау;

Аралықтардың ұзындығын анықтау;

Осьтегі аралықтардың орнын анықтаңыз.

Анықтау үшін интервалдар саны к Стердж формуласы бар, соған сәйкес

,

Қайда n- жиынтық көлемі.

Мысалы, 100 сипаттамалық мән (вариант) болса, интервалдар қатарын құру үшін интервалдарға тең интервалдар санын алу ұсынылады.

Дегенмен, тәжірибеде өте жиі интервалдар санын зерттеушінің өзі таңдайды, бұл сан өте үлкен болмауы керек, сондықтан қатар қиын емес, сонымен қатар өте аз емес, сонымен қатар олардың кейбір қасиеттерін жоғалтпау үшін. тарату.

Интервал ұзындығы h келесі формуламен анықталады:

,

Қайда xмакс және x min - ең үлкен және ең көп шағын мәнопциялар.

мән шақырды кең ауқымдақатар.

Интервалдарды өздері құрастыру үшін олар әртүрлі жолдармен жүреді. Ең бірі қарапайым тәсілдеркелесідей. Мән бірінші интервалдың басы ретінде қабылданады
. Сонда аралықтардың қалған шекаралары формула бойынша табылады . Әлбетте, соңғы интервалдың соңы а m+1 шартты қанағаттандыру керек

Аралықтардың барлық шекаралары табылғаннан кейін осы аралықтардың жиіліктері (немесе жиіліктері) анықталады. Бұл мәселені шешу үшін олар барлық нұсқаларды қарап шығып, белгілі бір интервалға түсетін нұсқалардың санын анықтайды. Мысал арқылы интервалдық қатардың толық құрылысын қарастырамыз.

Мысал 4.2. Өсу ретімен жазылған келесі статистика үшін интервалдар саны 5-ке тең интервалдық қатарды құрыңыз:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Шешім. Барлығы n=50 нұсқа мәндері.

Интервалдар саны мәселе шартында көрсетіледі, яғни. к=5.

Аралықтардың ұзындығы
.

Интервалдардың шекараларын анықтайық:

а 1 = 11 − 8,5 = 2,5; а 2 = 2,5 + 17 = 19,5; а 3 = 19,5 + 17 = 36,5;

а 4 = 36,5 + 17 = 53,5; а 5 = 53,5 + 17 = 70,5; а 6 = 70,5 + 17 = 87,5;

а 7 = 87,5 +17 = 104,5.

Аралықтардың жиілігін анықтау үшін біз осы аралыққа түсетін опциялардың санын есептейміз. Мысалы, 11, 12, 12, 14, 14, 15 опциялары 2,5-тен 19,5-ке дейінгі бірінші интервалға жатады.Олардың саны 6-ға тең, сондықтан бірінші интервалдың жиілігі n 1=6. Бірінші интервалдың жиілігі . 21, 21, 22, 23, 25 нұсқалары, олардың саны 5, 19,5-тен 36,5-ке дейінгі екінші интервалға түседі.Сондықтан екінші интервалдың жиілігі n 2 =5 және жиілігі . Барлық интервалдар үшін жиіліктер мен жиіліктерді бірдей тауып, келесі интервалдық қатарды аламыз.

Жиілік үлестірімінің интервалдық қатары келесі түрде болады:

Жиіліктердің қосындысы 6+5+9+11+8+11=50.

Жиілік үлестірімінің интервалдық қатары келесі түрде болады:

Жиіліктердің қосындысы 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

Интервалдық қатарларды құру кезінде қарастырылатын мәселенің нақты шарттарына байланысты басқа ережелерді қолдануға болады, атап айтқанда

1. Интервалдық вариациялық қатарлар әртүрлі ұзындықтағы жартылай интервалдардан тұруы мүмкін. Интервалдардың тең емес ұзындықтары белгінің біркелкі таралмаған статистикалық жиынтық қасиеттерін бөліп алуға мүмкіндік береді. Мысалы, аралықтардың шекаралары қалалардағы тұрғындардың санын анықтайтын болса, онда бұл есепте ұзындығы бойынша бірдей емес интервалдарды қолданған жөн. Әлбетте, шағын қалалар үшін тұрғындар санының аздаған айырмашылығы да маңызды, ал ірі қалалар үшін ондаған және жүздеген тұрғындардың айырмашылығы айтарлықтай емес. Парциалды интервалдардың ұзындығы тең емес интервалдық қатарлар негізінен зерттеледі жалпы теориястатистика және оларды қарастыру осы нұсқаулықтың аясынан тыс.

2. В математикалық статистикакейде интервалдық қатарлар қарастырылады, олар үшін бірінші интервалдың сол жақ шекарасы –∞-ке тең, ал соңғы интервалдың оң шекарасы +∞ болады. Бұл статистикалық бөлуді теориялық бөлуге жақындату үшін жасалады.

3. Интервалдық қатарларды тұрғызған кезде қандай да бір нұсқаның мәні интервал шекарасымен дәл сәйкес келетіні анықталуы мүмкін. Бұл жағдайда ең жақсы әрекет келесідей болады. Егер осындай бір ғана сәйкестік болса, онда қарастырылып отырған нұсқа жиілігімен интервалдық қатардың ортасына жақын орналасқан интервалға түскенін ескеріңіз, егер мұндай бірнеше нұсқалар болса, онда олардың барлығы не интервалдарға тағайындалады? осы нұсқаның оң жағында немесе барлығы сол жақта.

4. Аралықтардың санын және олардың ұзындығын анықтағаннан кейін аралықтардың орналасуын басқа жолмен де жасауға болады. Опциялардың барлық қарастырылған мәндерінің орташа арифметикалық мәнін табыңыз Xқараңыз. және бірінші интервалды осы үлгі ортасы кейбір интервалдың ішінде болатындай етіп құрыңыз. Осылайша, біз интервалды аламыз Xқараңыз. – 0,5 hбұрын Xорташа + 0,5 h. Содан кейін солға және оңға, интервалдың ұзындығын қосып, қалған интервалдарды дейін саламыз xмин және x max сәйкесінше бірінші және соңғы аралықтарға түспейді.

5. Интервалдар саны көп интервалдық қатарлар тігінен ыңғайлы түрде жазылады, яғни. аралықтарды бірінші жолға емес, бірінші бағанға, ал екінші бағанға жиіліктерді (немесе жиіліктерді) жазу.

Үлгі деректер кейбір кездейсоқ шаманың мәндері ретінде қарастырылуы мүмкін X. Кездейсоқ шаманың өзінің таралу заңы бар. Ықтималдықтар теориясынан дискретті кездейсоқ шаманың таралу заңын таралу қатары ретінде, ал үзіліссіз үшін таралу тығыздығы функциясын қолдана отырып көрсетуге болатыны белгілі. Дегенмен, дискретті де, үздіксіз үшін де орындалатын әмбебап таралу заңы бар кездейсоқ айнымалылар. Бұл бөлу заңы бөлу функциясы ретінде берілген Ф(x) = П(X<x). Үлгі деректер үшін тарату функциясының аналогын – эмпирикалық үлестіру функциясын көрсетуге болады.