Составить вариационный и статистический ряды. Вариационный ряд. Статистическое распределение выборки. Основные характеристики вариационного ряда. Парный t-критерий стьюдента

Вариационные ряды: определение, виды, основные характеристики. Методика расчета
моды, медианы, средней арифметической в медико-статистических исследованиях
(показать на условном примере).

Вариационный ряд – это ряд числовых значений изучаемого признака, отличающихся друг от друга по своей величине и расположенных в определенной последовательности(в восходящем или убывающем порядке). Каждое числовое значение ряда называют вариантой (V), а числа, показывающие, как часто встречается та или иная варианта в составе данного ряда, называется частотой (р).

Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n. Различие в значении изучаемых признаков называется вариацией. В случае если варьирующий признак не имеет количественной меры, вариацию называют качественной, а ряд распределения – атрибутивным (например, распределение по исходу заболевания, по состоянию здоровья и т.д.).

Если варьирующий признак имеет количественное выражение, такую вариацию называют количественной, а ряд распределения – вариационным.

Вариационные ряды делятся на прерывные и непрерывные – по характеру количественного признака, простые и взвешенные – по частоте встречаемости вариант.

В простом вариационном ряду каждая варианта встречается только один раз (р=1), во взвешенном – одна и та же варианта встречается несколько раз (р>1). Примеры таких рядов будут рассмотрены далее по тексту. Если количественный признак носит непрерывный характер, т.е. между целыми величинами имеются промежуточные дробные величины, вариационный ряд называется непрерывным.

Например: 10,0 – 11,9

14,0 – 15,9 и т.д.

Если количественный признак носит прерывный характер, т.е. отдельные его значения (варианты) отличаются друг от друга на целое число и не имеют промежуточных дробных значений, вариационный ряд называют прерывным или дискретным.

Используя данные предыдущего примера о частоте пульса

у 21 студентов, построим вариационный ряд (табл. 1).

Таблица 1

Распределение студентов-медиков по частоте пульса (уд/мин)

Таким образом, построить вариационный ряд – означает имеющиеся числовые значения (варианты) систематизировать, упорядочить, т.е. расположить в определенной последовательности (в восходящем или убывающем порядке) с соответствующими им частотами. В рассматриваемом примере варианты расположены в восходящем порядке и выражены в виде целых прерывных (дискретных) чисел, каждая варианта встречается несколько раз, т.е. мы имеем дело со взвешенным, прерывным или дискретным вариационным рядом.

Как правило, если число наблюдений в изучаемой нами статистической совокупности не превышает 30, то достаточно все значения изучаемого признака расположить в вариационном ряду в нарастающем, как в табл. 1, или убывающем порядке.

При большом количестве наблюдений (n>30) число встречающихся вариант может быть очень большим, в этом случае составляется интервальный или сгруппированный вариационный ряд, в котором для упрощения последующей обработки и выяснения характера распределения варианты объединены в группы.

Обычно число групповых вариант колеблется от 8 до 15.

Их должно быть не меньше 5, т.к. иначе это будет слишком грубое, чрезмерное укрупнение, что искажает общую картину варьирования и сильно сказывается на точности средних величин. При числе групповых вариант более 20-25 увеличивается точность вычисления средних величин, но существенно искажаются особенности варьирования признака и усложняется математическая обработка.

При составлении сгруппированного ряда необходимо учесть,

− группы вариант должны располагаться в определенном порядке (в восходящем или нисходящем);

− интервалы в группах вариант должны быть одинаковыми;

− значения границ интервалов не должны совпадать, т.к. неясно будет, в какие группы относить отдельные варианты;

− необходимо учитывать качественные особенности собираемого материала при установлении пределов интервалов (например, при изучении веса взрослых людей интервал 3-4 кг допустим, а для детей первых месяцев жизни он не должен превышать 100 г.)

Построим сгруппированный (интервальный) ряд, характеризующий данные о частоте пульса (число ударов в минуту) у 55 студентов-медиков перед экзаменом: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Для построения сгруппированного ряда необходимо:

1. Определить величину интервала;

2. Определить середину, начало и конец групп вариант вариационного ряда.

● Величина интервала (i) определяется по числу предполагаемых групп (r), количество которых устанавливается в зависимости от числа наблюдений (n) по специальной таблице

Число групп в зависимости от числа наблюдений:

В нашем случае, для 55 студентов, можно составить от 8 до 10 групп.

Величина интервала (i) определяется по следующей формуле –

i = V max-V min/r

В нашем примере величина интервала равна 82- 58/8= 3.

Если величина интервала представляет собой дробное число, полученный результат следует округлить до целого числа.

Различают несколько видов средних величин:

средняя арифметическая,

● средняя геометрическая,

● средняя гармоническая,

● средняя квадратическая,

● средняя прогрессивная,

● медиана

В медицинской статистике наиболее часто пользуются средними арифметическими величинами.

Средняя арифметическая величина (М) является обобщающей величиной, которая определяет то типичное, что характерно для всей совокупности. Основными способами расчета М являются: среднеарифметический способ и способ моментов (условных отклонений).

Среднеарифметический способ применяется для вычисления средней арифметической простой и средней арифметической взвешенной. Выбор способа расчета средней арифметической величины зависит от вида вариационного ряда. В случае простого вариационного ряда, в котором каждая варианта встречается только один раз, определяется средняя арифметическая простая по формуле:

где: М – средняя арифметическая величина;

V – значение варьирующего признака (варианты);

Σ – указывает действие – суммирование;

n – общее число наблюдений.

Пример расчета средней арифметической простой. Частота дыхания (число дыхательных движений в минуту) у 9 мужчин в возрасте 35 лет: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Для определения среднего уровня частоты дыхания у мужчин в возрасте 35 лет необходимо:

1. Построить вариационный ряд, расположив все варианты в возрастающем или убывающем порядке Мы получили простой вариационный ряд, т.к. значения вариант встречаются только один раз.

M = ∑V/n = 171/9 = 19 дыхательных движений в минуту

Вывод. Частота дыхания у мужчин в возрасте 35 лет в среднем равна 19 дыхательным движениям в минуту.

Если отдельные значения вариант повторяются, незачем выписывать в линию каждую варианту, достаточно перечислить встречающиеся размеры вариант (V) и рядом указать число их повторений (р). такой вариационный ряд, в котором варианты как бы взвешиваются по числу соответствующих им частот, носит название – взвешенный вариационный ряд, а рассчитываемая средняя величина – средней арифметической взвешенной.

Средняя арифметическая взвешенная определяется по формуле: M= ∑Vp/n

где n – число наблюдений, равное сумме частот – Σр.

Пример расчета средней арифметической взвешенной.

Длительность нетрудоспособности (в днях) у 35 больных острыми респираторными заболеваниями (ОРЗ), лечившихся у участкового врача на протяжении I-го квартала текущего года составила: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 дней.

Методика определения средней длительности нетрудоспособности у больных с ОРЗ следующая:

1. Построим взвешенный вариационный ряд, т.к. отдельные значения вариант повторяются несколько раз. Для этого можно расположить все варианты в возрастающем или убывающем порядке с соответствующими им частотами.

В нашем случае варианты расположены в возрастающем порядке

2. Рассчитаем среднюю арифметическую взвешенную по формуле: M = ∑Vp/n = 233/35 = 6,7 дней

Распределение больных с ОРЗ по длительности нетрудоспособности:

Длительность нетрудоспособности (V) Число больных (p) Vp
∑p = n = 35 ∑Vp = 233

Вывод. Длительность нетрудоспособности у больных с острыми респираторными заболеваниями составила в среднем 6,7 дней.

Мода (Мо) – наиболее часто встречающаяся варианта в вариационном ряду. Для распределения, представленного в таблице, моде соответствует варианта, равная 10, она встречается чаще других – 6 раз.

Распределение больных по длительности пребывания на больничной койке (в днях)

V
p

Иногда точную величину моды установить трудно, поскольку в изучаемых данных может существовать несколько наблюдений, встречающихся «наиболее часто».

Медиана (Ме) – непараметрический показатель, делящий вариационный ряд на две равные половины: в обе стороны от медианы располагается одинаковое число вариант.

Например, для распределения, указанного в таблице, медиана равна 10, т.к. по обе стороны от этой величины располагается по 14 вариант, т.е. число 10 занимает центральное положение в этом ряду и является его медианой.

Учитывая, что число наблюдений в этом примере четное (n=34), медиану можно определить таким образом:

Me = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Это означает, что середина ряда приходится на семнадцатую по счету варианту, которой соответствует медиана, равная 10. Для распределения, представленного в таблице, средняя арифметическая равна:

M = ∑Vp/n = 334/34 = 10,1

Итак, для 34 наблюдений из табл. 8, мы получили: Мо=10, Ме=10, средняя арифметическая (М) равна 10,1. В нашем примере все три показателя оказались равными или близкими друг к другу, хотя они совершенно различны.

Средняя арифметическая является результативной суммой всех влияний, в формировании ее принимают участие все без исключения варианты, в том числе и крайние, часто нетипичные для данного явления или совокупности.

Мода и медиана, в отличие от средней арифметической, не зависят от величины всех индивидуальных значений варьирующего признака (значений крайних вариант и степени рассеяния ряда). Средняя арифметическая характеризует всю массу наблюдений, мода и медиана – основную массу

Метод группировок позволяет также измерить вариацию (изменчивость, колеблемость) признаков. При относительно малом числе единиц совокупности вариация измеряется на основе ранжированного ряда единиц, образующих совокупность. Ряд называется ранжированным, если единицы расположены по возрастанию (убыванию) признака.

Однако ранжированные ряды довольно малопоказательны тогда, когда необходима сравнительная характеристика вариации. Кроме того, во многих случаях приходится иметь дело со статистическими совокупностями, состоящими из большого числа единиц, которые практически трудно представить в виде конкретного ряда. В связи с этим для первоначального общего ознакомления со статистическими данными и особенно для облегчения изучения вариации признаков исследуемые явления и процессы обычно объединяют в группы, а результаты группировки оформляют в виде групповых таблиц.

Если в групповой таблице имеется всего две графы - группы по выделенному признаку (варианты) и численности групп (частоты или частости), она называется рядом распределения.

Ряд распределения - простейшая разновидность структурной группировки по одному признаку, отображенная в групповой таблице с двумя графами, в которых содержатся варианты и частоты признака. Во многих случаях с такой структурной группировки, т.е. с составления рядов распределения, начинается изучение исходного статистического материала.

Структурная группировка в виде ряда распределения может быть превращена в подлинную структурную группировку, если выделенные группы будут охарактеризованы не только частотами, но и другими статистическими показателями. Главное предназначение рядов распределения - изучение вариации признаков. Теорию рядов распределения подробно разрабатывает математическая статистика.

Ряды распределения делят на атрибутивные (группировка по атрибутивным признакам, например деление населения по полу, национальности, семейному положению и т.д.) и вариационные (группировка по количественным признакам).

Вариационный ряд представляет собой групповую таблицу, которая содержит две графы: группировку единиц по одному количественному признаку и численность единиц в каждой группе. Интервалы в вариационном ряду образуются обычно равные и закрытые. Вариационным рядом является следующая группировка населения России по величине среднедушевых денежных доходов (табл. 3.10).

Таблица 3.10

Распределение численности населения России по величине среднедушевых доходов в 2004-2009 гг.

Группы населения по величине среднедушевых денежных доходов, руб./мес

Численность населения в группе, в % к итогу

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Свыше 25 000,0

Все население

Вариационные ряды в свою очередь подразделяются на дискретные и интервальные. Дискретные вариационные ряды объединяют варианты дискретных признаков, изменяющихся в узких пределах. Примером дискретного вариационного ряда может служить распределение российских семей по числу имеющихся детей.

Интервальные вариационные ряды объединяют варианты либо непрерывных признаков, либо изменяющихся в широких пределах дискретных признаков. Интервальным является вариационный ряд распределения населения России по величине среднедушевых денежных доходов.

Дискретные вариационные ряды на практике применяются не слишком часто. Между тем составление их несложно, поскольку состав групп определяется конкретными вариантами, которыми реально обладают изучаемые группировочные признаки.

Более широко распространены интервальные вариационные ряды. При их составлении возникает сложный вопрос о количестве групп, а также о величине интервалов, которые должны быть установлены.

Принципы решения этого вопроса изложены в главе о методологии построения статистических группировок (см. параграф 3.3).

Вариационные ряды представляют собой средство свертывания или сжатия многообразной информации в компактную форму, по ним можно составить достаточно ясное суждение о характере вариации, изучить различия признаков явлений, входящих в исследуемую совокупность. Но важнейшее значение вариационных рядов состоит в том, что на их основе исчисляются особые обобщающие характеристики вариации (см. главу 7).

Пример решения контрольной работы по математической статистике

Задача 1

Исходные данные : студенты некоторой группы, состоящей из 30 человек сдали экзамен по курсу «Информатика». Полученные студентами оценки образуют следующий ряд чисел:

I. Составим вариационный ряд

m x

w x

m x нак

w x нак

Итого:

II. Графическое представление статистических сведений.

III. Числовые характеристики выборки.

1. Среднее арифметическое

2. Среднее геометрическое

3. Мода

4. Медиана

222222333333333 | 3 34444444445555

5. Выборочная дисперсия

7. Коэффициент вариации

8. Ассиметрия

9. Коэффициент ассиметрии

10. Эксцесс

11. Коэффициент эксцесса

Задача 2

Исходные данные : студенты некоторой группы написали выпускную контрольную работу. Группа состоит из 30 человек. Набранные студентами баллы образуют следующий ряд чисел

Решение

I. Так как признак принимает много различных значений, то для него построим интервальный вариационный ряд. Для этого сначала зададим величину интервала h . Воспользуемся формулой Стэрджера

Составим шкалу интервалов. При этом за верхнюю границу первого интервала примем величину, определяемую по формуле:

Верхние границы последующих интервалов определим по следующей рекуррентной формуле:

, тогда

Построение шкалы интервалов заканчиваем, так как верхняя граница очередного интервала стала больше или равна максимальному значению выборки
.

II. Графическое отображение интервального вариационного ряда

III. Числовые характеристики выборки

Для определения числовых характеристик выборки составим вспомогательную таблицу

Сумма :

1. Среднее арифметическое

2. Среднее геометрическое

3. Мода

4. Медиана

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Выборочная дисперсия

6. Выборочное стандартное отклонение

7. Коэффициент вариации

8. Ассиметрия

9. Коэффициент ассиметрии

10. Эксцесс

11. Коэффициент эксцесса

Задача 3

Условие : цена деления шкалы амперметра равна 0,1 А. Показания округляют до ближайшего целого деления. Найти вероятность того, что при отсчете будет сделана ошибка, превышающая 0,02 А.

Решение.

Ошибку округления отсчета можно рассматривать как случайную величину Х , которая распределена равномерно в интервале между двумя соседними целыми делениями. Плотность равномерного распределения

,

где
- длина интервала, в котором заключены возможные значения Х ; вне этого интервала
В данной задаче длина интервала, в котором заключены возможные значения Х , равна 0,1, поэтому

Ошибка отсчета превысит 0,02 если она будет заключена в интервале (0,02; 0,08). Тогда

Ответ: р =0,6

Задача 4

Исходные данные: математическое ожидание и стандартное отклонение нормально распределенного признака Х соответственно равны 10 и 2. Найти вероятность того, чтов результате испытания Х примет значение, заключенное в интервале (12, 14).

Решение.

Воспользуемся формулой

И теоретическими частотами

Решение

Для Х ее математическое ожидание M(X) и дисперсию D(X). Решение . Найдем функцию распределения F(x) случайной величины... ошибка выборки). Составим вариационный ряд Ширина интервала составит : Для каждого значения ряда подсчитаем, какое количество...

  • Решение: уравнение с разделяющимися переменными

    Решение

    В виде Для нахождения частного решения неоднородного уравнения составим систему Решим полученную систему... ; +47; +61; +10; -8. Построить интервальный вариационный ряд . Дать статистические оценки среднего значения...

  • Решение: Проведем расчет цепных и базисных абсолютных приростов, темпов роста, темпов прироста. Полученные значения сведем в таблицу 1

    Решение

    Объем производства продукции. Решение : Средняя арифметическая интервального вариационного ряда вычисляется следующим образом: за... Предельная ошибка выборки с вероятностью 0,954 (t=2) составит : Δ w = t*μ = 2*0,0146 = 0,02927 Определим границы...

  • Решение. Признак

    Решение

    О трудовом стаже которых и составили выборку. Средний по выборке стаж... рабочего дня этих сотрудников и составили выборку. Средняя по выборке продолжительность... 1,16, уровень значимости α = 0,05. Решение . Вариационный ряд данной выборки имеет вид: 0,71 ...

  • Рабочая учебная программа по биологии для 10-11 классов Составитель: Поликарпова С. В

    Рабочая учебная программа

    Простейших схем скрещивания» 5 Л.р. «Решение элементарных генетических задач» 6 Л.р. «Решение элементарных генетических задач» 7 Л.р. « ... , 110, 115, 112, 110. Составьте вариационный ряд , начертите вариационную кривую, найдите среднюю величину признака...

  • Условие:

    Имеются данные о возрастном составе рабочих (лет): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28, 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

      1. Построить интервальный ряд распределения.
      2. Построить графическое изображение ряда.
      3. Графически определить моду и медиану.

    Решение:

    1) По формуле Стерджесса совокупность надо разделить на 1 + 3,322 lg 30 = 6 групп.

    Максимальный возраст - 38, минимальный - 18.

    Ширина интервала Так как концы интервалов должны быть целыми числами, разделим совокупность на 5 групп. Ширина интервала - 4.

    Для облегчения подсчетов расположим данные в порядке возрастания: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

    Распределение возрастного состава рабочих

    Графически ряд можно изобразить в виде гистограммы или полигона. Гистограмма - столбиковая диаграмма. Основание столбика - ширина интервала. Высота столбика равна частоте.

    Полигон (или многоугольник распределения) - график частот. Чтобы его построить по гистограмме, соединяем середины верхних сторон прямоугольников. Многоугольник замыкаем на оси Ох на расстояниях, равных половине интервала от крайних значений х.

    Мода (Мо) - это величина изучаемого признака, которая в данной совокупности встречается наиболее часто.

    Чтобы определить моду по гистограмме, надо выбрать самый высокий прямоугольник, провести линию от правой вершины этого прямоугольника к правому верхнему углу предыдущего прямоугольника, и от левой вершины модального прямоугольника провести линию к левой вершине последующего прямоугольника. От точки пересечения этих линий провести перпендикуляр к оси х. Абсцисса и будет модой. Мо ≈ 27,5. Значит, наиболее часто встречаемый возраст в данной совокупности 27-28 лет.

    Медиана (Mе) - это величина изучаемого признака, которая находится в середине упорядоченного вариационного ряда.

    Медиану находим по кумуляте. Кумулята - график накопленных частот. Абсциссы - варианты ряда. Ординаты - накопленные частоты.

    Для определения медианы по кумуляте находим по оси ординат точку, соответствующую 50% накопленных частот (в нашем случае 15), проводим через неё прямую, параллельно оси Ох, и от точки её пересечения с кумулятой проводим перпендикуляр к оси х. Абсцисса является медианой. Ме ≈ 25,9. Это означает, что половина рабочих в данной совокупности имеет возраст менее 26 лет.

    Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определённому варьирующему признаку.
    В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения .

    Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.

    Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.

    Виды статистических признаков .

    Атрибутивными называют ряды распределения , построенные по качественным признакам. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
    Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
    Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.

    Вариационный ряд – это значения признака (или интервалы значений) и их частоты.
    Вариационными рядами называют ряды распределения , построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
    Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду.
    Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, её объём.
    Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.

    В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды .
    Пример дискретного вариационного ряда приведен в табл. 2.9.
    Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.

    В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй – помещены частоты вариационного ряда, в третьей – показатели частости.

    Вариационный ряд

    В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x 1 , x 2 , …, x n по возрастанию. Каждое наблюдаемое значение x i называется вариантой . Частота m i – это число наблюдений значения x i в выборке. Относительная частота (частость) w i – это отношение частоты m i к объему выборкиn : .
    При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: для x i n называется накопленной частостью w i max .
    Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

    Таблица 1. Общий вид дискретного вариационного ряда частот

    Значения признака x i x 1 x 2 x n
    Частоты m i m 1 m 2 m n

    Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд для такого признака называется интервальным.

    Таблица 2. Общий вид интервального вариационного ряда частот

    Таблица 3. Графические изображения вариационного ряда

    Ряд Полигон или гистограмма Эмпирическая функция распределения
    Дискретный
    Интервальный
    Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности a i – a i +1 называются частичными интервалами. Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i -го интервала принимают за вариант x i , а соответствующую интервальную частоту m i – за частоту этого интервала.
    Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая и эмпирическая функция распределения.

    В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд .
    Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма .
    Полигон используется при изображении дискретных вариационных рядов .
    Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
    Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).


    Рис. Полигон распределения жилого фонда


    На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.
    Гистограмма принимается для изображения интервального вариационного ряда . При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. Гистограмма – график, на котором ряд изображен в виде смежных друг с другом столбиков.
    Изобразим графически интервальный ряд распределения, приведённый в табл. 2.11.
    Таблица 2.11 - Распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).
    N п/п Группы семей по размеру жилой площади, приходящейся на одного человека Число семей с данным размером жилой площади Накопленное число семей
    1 3 – 5 10 10
    2 5 – 7 20 30
    3 7 – 9 40 70
    4 9 – 11 30 100
    5 11 – 13 15 115
    ВСЕГО 115 ----


    Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека


    Используя данные накопленного ряда (табл. 2.11), построим кумуляту распределения.


    Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека


    Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда.
    Если при графическом изображении вариационного ряда в виде кумуляты оси поменять, то мы получим огиву . На рис. 2.4 приведена огива, построенная на основе данных табл. 2.11.
    Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями. Полученный полигон распределения изображён на рис. 2.2 пунктирной линией.
    При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах.
    Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала. Пример расчета плотности распределения представлен в табл. 2.12.
    Таблица 2.12 - Распределение предприятий по числу занятых (цифры условные)
    N п/п Группы предприятий по числу занятых, чел. Число предприятий Величина интервала, чел. Плотность распределения
    А 1 2 3=1/2
    1 До 20 15 20 0,75
    2 20 – 80 27 60 0,25
    3 80 – 150 35 70 0,5
    4 150 – 300 60 150 0,4
    5 300 – 500 10 200 0,05
    ВСЕГО 147 ---- ----

    Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.


    Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека

    При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.

    Непрерывный вариационный ряд

    Непрерывный вариационный ряд - ряд, построенный на основе количественного статистического признака . Пример . Средняя продолжительность заболеваний осужденных (дней на одного человека) в осенне-зимний период в текущем год составила:
    7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
    7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
    10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5