Вариационные ряды. средние величины. стандартное отклонение. средняя ошибка средней арифметической. Вариационные ряды, их элементы

Представляются в виде рядов распределения и оформляются в виде .

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

  • Атрибутивными — называют ряды распределения, построенные по качественными признакам.
  • Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант , выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:
  • Полигона
  • Гистограммы
  • Кумуляты
  • Огивы

Полигон

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

6.1. Распределение домохозяйств по размеру

Условие : Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача : Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение :
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие : Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача : Построить интервальный вариационный ряд с равными интервалами.
Решение :

  1. Исходная совокупность состоит из 20 единиц (N = 20).
  2. По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
  3. Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
  4. Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
  5. Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Гистограмма

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис. 6.2. Распределение населения России по возрастным группам

Условие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы

Задача : Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение :

  1. Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
  2. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
    Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.
  3. Построим гистограмму:

Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.

Кумулята

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределения домохозяйств по размеру

4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.

Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.

6.4. Кривая концентрации
Наименование параметра Значение
Тема статьи: Вариационный ряд
Рубрика (тематическая категория) Производство

Наблюдаемые значения случайной величины х 1 , х 2 , …, х k называются вариантами .

Частотой варианты х i принято называть число n i (i =1,…,k ), показывающее, сколько раз эта варианта встречается в выборке.

Частостью (относительной частотой, долей) варианты х i (i =1,…,k ) принято называть отношение ее частоты n i к объёму выборки n .

Частоты и частости называютвесами .

Накопленной частотой принято называть количество вариант, значения которых меньше данного х :

Накопленной частостью принято называть отношение накопленной частоты к объёму выборки:

Вариационным рядом (статистическим рядом) – принято называть последовательность вариант, записанных в порядке возрастания и соответствующих им весов.

Вариационный ряд должна быть дискретным (выборка значений дискретной случайной величины) и непрерывным (интервальным) (выборка значений непрерывной случайной величины).

Дискретный вариационный ряд имеет вид:

Когда число вариант велико или признак является непрерывным (случайная величина может принимать любые значения в некотором интервале), составляют интервальный вариационный ряд.

Для построения интервального вариационного ряда проводят группировку вариант – их разбивают на отдельные интервалы:

Число интервалов иногда определяют с помощью формулы Стерджеса :

Затем подсчитывается число вариант, попавших в каждый интервал – частоты n i (или частости n i /n ). В случае если варианта находится на границе интервала, то ее присоединяют к правому интервалу.

Интервальный вариационный ряд имеет вид :

Варианты
Частоты

Эмпирической (статистической) функцией распределœения принято называть функция, значение которой в точке х равно относительной частоте того, что варианта примет значение, меньшее х (накопительной частости для х ):

Полигоном частот называют ломанную, отрезки которой соединяют точки с координатами (х 1 ; n 1), (х 2 ; n 2), …, (х k ; n k ). Аналогично строится полигон частостей , который является статистическим аналогом многоугольника распределœений.

Стоит сказать, что для непрерывного вариационного ряда полигон можно построить, в случае если в качестве значений х 1 , х 2 , …, х k взять середины интервалов.

Интервальный вариационный ряд графически обычно изображают с помощью гистограммы .

Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых являются частичные интервалы длины h = x i +1 – x i , i = 0,…,k -1, а высоты равны частотам (или частостям) интервалов n i (w i ).

Кумулята (кумулятивная кривая) – кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломанную, соединяющую точки или , . Для интервального ряда кумулята начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю. Другие точки этой ломанной соответствуют концам интервалов.

Вариационный ряд - понятие и виды. Классификация и особенности категории "Вариационный ряд" 2017, 2018.

  • - Вариационный ряд распределения

    Распределение розничного товарооборота Российской Федерации в 1995 году по формам собственности, млн. руб. Виды рядов распределения Лекция VIII. Ряды распределения В результате обработки и систематизации первичных статистических данных получают... .


  • - Вариационный ряд

    Простейшее преобразование статистических данных является их упорядочивание по величине. Выборка объёма из генеральной совокупности, упорядоченная в порядке неубывания элементов, т.е. , называется вариационным рядом: . В том случае, когда объем наблюдений... .


  • - Задание 2. Интервальный вариационный ряд

    1. По заданной выборке, соответствующей варианту задания построить интервальный вариационный ряд; построить гистограмму и кумуляту (используйте два способа: вставку диаграммы Excel и режим «Гистограмма» пакета «Анализ данных»). 2. Проанализировать полученную гистограмму. ... .


  • - Составить вариационный ряд изменчивости признака семян фасоли или листьев какого-либо растения одного возраста. Выявить закономерности изменчивости признака.

    Популяция - структурная единица вида. Численность популяций. Причины колебания численности популяций. Взаимоотношения особей в популяциях и между различными популяциями одного и разных видов. 1. Важный признак вида - расселение его группами, популяциями в...

    1. Все значения изучаемого свойства, которые встречаются в изучаемой совокупности, называет значением признака (вариантом, вариантой), а изменение этого значения варьированием . Варианты обозначают малыми буквами латинского алфавита с соответствующими порядковому номеру группы индексами - x i .

      Число, которое показывает, сколько раз встречается каждое значение признака в изучаемой совокупности частотой и обозначают f i . Сумма всех частот ряда равна объему изучаемой совокупности.

      Очень часто нужно подсчитать накопленную частоту (S ). Накопленная частота для каждого значения признака показывают, сколько единиц совокупности имеют значение признака не больше, чем данное значение. Накопленная частота исчисляются путем последовательного прибавления к частоте первого значения признака частот следующих значений признака:

    Накопленную частоту начинают рассчитывать с самого первого значения признака

    Сумма частостей всегда равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

    Частоты ряда (f i) в некоторых случаях могут быть заменены частостями (ω i).

    Если вариационный ряд дан с неравными интервалами, то для правильного представления о характере распределения необходимо произвести расчет абсолютной или относительной плотности распределения.

      Абсолютная плотность распределения (р f ) представляет собой величину частоты, приходящейся на единицу размера интервала отдельной группы ряда:

    р f = f / i.

      Относительная плотность распределения (р ω ) представляет собой величину частости, приходящейся на единицу размера интервала отдельной группы ряда:

    р ω = ω / i.

    Для рядов с неравными интервалами только эти характеристики дает более правильное представление о характере распределения, чем частота и частость.

      Статистическим распределением выборки называют перечень вариантов (значений признака) и соответствующих им частот или плотностей распределения, относительных частот или относительных плотностей распределения.

    Разные ряды распределения характеризуются разным набором частотных характеристик:

    минимальным – атрибутивные ряды (частота, частость),

    для дискретных используются четыре характеристики (частота, частость, накопленная частота, накопленная частость),

    для интервальных – все пять (частота, частость, накопленная частота, накопленная частость, абсолютная и относительная плотности распределения).

    1. Правила построения интервального вариационного ряда

    1. Графическое изображение вариационных рядов

    Первым этапом изучения вариационного ряда является построение его графического изображения. Графическое изображение вариационных рядов облегчает их анализ и позволяет судить о форме распределения. Для графического изображения вариационного ряда в статистике строят гистограмму, полигон и кумуляту распределения.

    Дискретный вариационный ряд изображается в виде так называемого полигона частот.

    Для изображения интервального ряда применяются полигон распределения частот и гистограмма частот.

    Строятся графики в прямоугольной системе координат.

    Ряды, построенные по количественному признаку , называются вариационным .

    Ряды распределений состоят из вариантов (значений признака) и частот (численности групп). Частоты, выраженные в виде относительных величин (долей, процентов) называются частостями . Сумма всех частот называется объёмом ряда распределения.

    По виду ряды распределения делятся на дискретные (построены по прерывным значениям признака) и интервальные (построены на непрерывных значениях признака).

    Вариационный ряд представляет собой две колонки (или строки); в одной из которых приводятся отдельные значения варьирующего признака, именуемые вариантами и обозначаемые Х; а в другой – абсолютные числа, показывающие сколько раз (как часто) встречается каждый вариант. Показатели второй колонки называются частотами и условно обозначают через f. Еще раз заметим, что во второй колонке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Эти относительные показатели именуются частостями и условно обозначают через ω Сумма всех частостей в этом случае равна единице. Однако частоты можно выражать и в процентах, и тогда сумма всех частостей дает 100%.

    Если варианты вариационного ряда выражены в виде дискретных величин, то такой вариационный ряд именуют дискретным.

    Для непрерывных признаков вариационные ряды строятся как интервальные , то есть значения признака в них выражаются «от… до …». При этом минимальны значения признака в таком интервале именуют нижней границей интервала, а максимальное – верхней границей.

    Интервальные вариационные ряды строят и для дискретных признаков, варьирующих в большом диапазоне. Интервальные ряды могут быть с равными и неравными интервалами.

    Рассмотрим как определяется величина равных интервалов. Введем следующие обозначения:

    i – величина интервала;

    - максимальное значение признака у единиц совокупности;

    – минимальное значение признака у единиц совокупности;

    n – число выделяемых групп.

    , если n известно.

    Если число выделяемых групп трудно заранее определить, то для расчета оптимальной величины интервала при достаточном объеме совокупности может быть рекомендована формула, предложенная Стерджессом в 1926 году:

    n = 1+ 3.322 lg N, где N – число единиц в совокупности.

    Величина неравных интервалов определяется в каждом отдельном случае с учетом особенностей объекта изучения.

    Статистическим распределением выборки называют перечень ва­риант и соответствующих им частот (или относительных частот).

    Статистическое распределение выборки можно задать в виде таблицы, в первой графе которой располагаются варианты, а во второй - соот­ветствующие этим вариантам частоты ni , или относительные частоты Pi .

    Статистическое распределение выборки

    Интервальными называются вариационные ряды, в которых значе­ния признаков, положенных в основу их образования, выражены в определенных пределах (интервалах). Частоты в этом случае относятся, не к отдельным значениям признака, а ко всему интервалу.

    Интервальные ряды распределения строятся по непрерывным количе­ственным признакам, а также по дискретным признакам, варьирующим в значительных пределах.

    Интервальный ряд можно представить статистическим распределени­ем выборки с указанием интервалов и соответствующих им частот. При этом в качестве частоты интервала принимают сумму частот вариант, по­павших в этот интервал.

    При группировке по количественным непрерывным признакам важ­ное значение имеет определение размера интервала.

    Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда.

    Модой называют варианту, которая имеет наибольшую частоту.

    Метод группировок позволяет также измерить вариацию (изменчивость, колеблемость) признаков. При относительно малом числе единиц совокупности вариация измеряется на основе ранжированного ряда единиц, образующих совокупность. Ряд называется ранжированным, если единицы расположены по возрастанию (убыванию) признака.

    Однако ранжированные ряды довольно малопоказательны тогда, когда необходима сравнительная характеристика вариации. Кроме того, во многих случаях приходится иметь дело со статистическими совокупностями, состоящими из большого числа единиц, которые практически трудно представить в виде конкретного ряда. В связи с этим для первоначального общего ознакомления со статистическими данными и особенно для облегчения изучения вариации признаков исследуемые явления и процессы обычно объединяют в группы, а результаты группировки оформляют в виде групповых таблиц.

    Если в групповой таблице имеется всего две графы - группы по выделенному признаку (варианты) и численности групп (частоты или частости), она называется рядом распределения.

    Ряд распределения - простейшая разновидность структурной группировки по одному признаку, отображенная в групповой таблице с двумя графами, в которых содержатся варианты и частоты признака. Во многих случаях с такой структурной группировки, т.е. с составления рядов распределения, начинается изучение исходного статистического материала.

    Структурная группировка в виде ряда распределения может быть превращена в подлинную структурную группировку, если выделенные группы будут охарактеризованы не только частотами, но и другими статистическими показателями. Главное предназначение рядов распределения - изучение вариации признаков. Теорию рядов распределения подробно разрабатывает математическая статистика.

    Ряды распределения делят на атрибутивные (группировка по атрибутивным признакам, например деление населения по полу, национальности, семейному положению и т.д.) и вариационные (группировка по количественным признакам).

    Вариационный ряд представляет собой групповую таблицу, которая содержит две графы: группировку единиц по одному количественному признаку и численность единиц в каждой группе. Интервалы в вариационном ряду образуются обычно равные и закрытые. Вариационным рядом является следующая группировка населения России по величине среднедушевых денежных доходов (табл. 3.10).

    Таблица 3.10

    Распределение численности населения России по величине среднедушевых доходов в 2004-2009 гг.

    Группы населения по величине среднедушевых денежных доходов, руб./мес

    Численность населения в группе, в % к итогу

    8 000,1-10 000,0

    10 000,1-15 000,0

    15 000,1-25 000,0

    Свыше 25 000,0

    Все население

    Вариационные ряды в свою очередь подразделяются на дискретные и интервальные. Дискретные вариационные ряды объединяют варианты дискретных признаков, изменяющихся в узких пределах. Примером дискретного вариационного ряда может служить распределение российских семей по числу имеющихся детей.

    Интервальные вариационные ряды объединяют варианты либо непрерывных признаков, либо изменяющихся в широких пределах дискретных признаков. Интервальным является вариационный ряд распределения населения России по величине среднедушевых денежных доходов.

    Дискретные вариационные ряды на практике применяются не слишком часто. Между тем составление их несложно, поскольку состав групп определяется конкретными вариантами, которыми реально обладают изучаемые группировочные признаки.

    Более широко распространены интервальные вариационные ряды. При их составлении возникает сложный вопрос о количестве групп, а также о величине интервалов, которые должны быть установлены.

    Принципы решения этого вопроса изложены в главе о методологии построения статистических группировок (см. параграф 3.3).

    Вариационные ряды представляют собой средство свертывания или сжатия многообразной информации в компактную форму, по ним можно составить достаточно ясное суждение о характере вариации, изучить различия признаков явлений, входящих в исследуемую совокупность. Но важнейшее значение вариационных рядов состоит в том, что на их основе исчисляются особые обобщающие характеристики вариации (см. главу 7).