1 Краткая история возникновения корреляционного анализа

Начало применения математико-статистических приемов для изучения корреляционных зависимостей относится к 70 годам девятнадцатого столетия. Многие историки – статистики историю развития корреляции ведут от сороковых годов девятнадцатого столетия – от того времени, когда французский математик О. Браве предложил формулу для распределения двух случайных величин, удовлетворяющих требованиям закона нормального распределения.

Однако истинным основателем корреляционной теории считается английский математик – статистик К. Пирсон, создавший в конце девятнадцатого начале двадцатого веков данную теорию. В ней корреляция выступает как форма диалектической связи, при которой действует множество различных причин, как необходимых, так и случайных, как общих для обеих корреляционных величин, так и частных, влияющих только на одну из них. Причем, не все закономерные связи – причинные.

Развитие теории осуществлялось с помощью других исследований, когда основные положения теории корреляции были уже созданы. Причем в области изучения корреляций практика резко расходилась с теорией, ставя исследователей в такие условия, которые не удовлетворяли ее требованиям.

Основой формирования способов изучения корреляций и регрессий были данные, характеризующие какие-либо, количественно выраженные признаки. Поэтому исследователи на первых же шагах встретились с задачей корреляции качественных признаков, например, связь между цветом глаз у отцов и сыновей. Общий принцип, который был положен в основу конструкции показателей корреляции качественных признаков, заключался в том, что два качественных признака можно считать взаимосвязанными, если действие одного из них А при действии признака Б таково же, как и при действии признака не Б. В развитие этого принципа, и предлагались различные конструкции таких показателей, как, например, коэффициент средней квадратичной сопряженности Пирсона или коэффициент взаимной сопряженности Чупрова.

Изучение корреляции качественных признаков породило в общем учении о корреляции так называемую теорию рангов и основанную на ней теорию ранговой корреляции. Английский математик-статистик М. Кендалл, автор монографии, посвященной проблемам ранговой корреляции, указывал, что теория рангов впервые возникла как ответвление теории случайных процессов. На начальной стадии в рангах чаще всего видели просто удобный аппарат, благодаря которому удается обойтись без измерения абсолютной величины переменных и тем самым сэкономить время и усилия. Позднее статистика рангов смогла завоевать признание благодаря своим собственным достоинствам. Кендалл сконструировал показатель, который применим и для изучения частной корреляции между рангами. Современную теорию ранговой корреляции невозможно представить без наиболее полно ее освещающих исследований М. Кендалла.

Таким образом, уже к началу двадцатого столетия математико-статистические методы измерения корреляций и регрессий сложились в общем в достаточно стройную целостную систему, включающую в себя методы непараметрической статистики и непараметрические ранговые методы.

2 Непараметрические ранговые методы

Непараметрические ранговые методы – это бурно развивающаяся область математической статистики. История современных непараметрических методов, основанных на рангах, довольно коротка – всего лишь около 40 лет. Ранговые методы выделились в особое направление непараметрической статистики не только вследствие природы исходного материала, но и по идеям его дальнейшего использования. Сегодня этими методами решаются многие задачи анализа экономических, статистических, инженерных, естественнонаучных, социологических, медицинских данных.

Ранжирование – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения. Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Как показали статистические исследования, проведенные за последние 10-15 лет, ранговые методы в значительной мере лишены ряда недостатков для работы с малыми выборками, распределение которых неизвестно. Как известно, переход от самих наблюдений к их рангам сопровождается определенной потерей информации. Однако, эти потери не слишком велики. К сожалению, в настоящее время все еще сказывается нехватка специальной литературы по данному вопросу.

В последнее время в прогнозировании и при решении ряда других задач стали широко применяться экспертные оценки. Методы ранговой корреляции в этой области является едва ли не единственным путем обобщения экспертных оценок.

Теория рангов впервые возникла как ответвление теории случайных процессов. На начальной стадии в рангах чаще всего видели просто удобный аппарат, благодаря которому удается обойтись без изменения абсолютной величины переменных и тем самым сэкономить время или усилия. Благодаря использованию рангов можно было избежать трудностей, связанных с построением объективной шкалы абсолютных значений. Позднее статистика рангов смогла завоевать признание благодаря своим собственным достоинствам.

Ниже будут рассмотрены наиболее распространенные способы упорядочения изучаемых объектов:

Задача может сводиться просто к упорядочению объектов по месту, которое они занимают в пространстве или во времени. Например, карты были расположены в колоде в некотором порядке, а затем перетасованы. Новое расположение карт также характеризуется определенным порядком, ранжированием. Сравнив его со старым, можно увидеть, насколько тщательно были перетасованы карты. В этой задаче интересно только общее расположение карт в колоде, и нет необходимости упорядочить объекты в соответствии с “возрастанием” или “убыванием” того или иного присущего всем им признака;

Упорядочить объекты можно и по некоторому качеству, для которого не существует объективной абсолютной шкалы изменения. Можно, например, ранжировать образцы горных пород по твердости, исходя из следующего простого критерия: А тверже Б, если А оставляет царапину на Б, когда они соприкасаются. Если А оставляет царапину на Б, а Б – на В, то А будет оставлять царапину на В. Таким образом, прибегнув к ряду сопоставлений, можно с достаточной точностью упорядочить рассматриваемые объекты (если только набор не включает такие два объекта, которые обладают одинаковой твердостью). Однако подобный способ не позволяет измерить абсолютную величину твердости горных пород. Всегда можно установить, что А тверже Б. Однако до тех пор, пока не построена та или иная шкала измерения абсолютных величин, нельзя утверждать, что А, скажем, вдвое тверже Б;

Упорядочение может проводиться в соответствии с измеряемой (или теоретически исчисляемой) величиной некоторого признака. Например, можно располагать людей в том или ином порядке в зависимости от их роста, а города по численности населения. При этом не всегда требуется прибегать к самому процессу измерения: можно «на глаз» построить группу студентов по росту; однако в таких случаях критерий, по которому происходит ранжирование, должен допускать возможность непосредственных сопоставлений.

Можно упорядочить объекты по некоторому признаку, величину которого, в принципе, можно измерить, но на практике (или даже теоретически) не удается прибегнуть к такому измерению в силу тех или иных причин. Например, можно упорядочить ряд лиц по их интеллектуальным способностям, полагая, что такое качество действительно существует и что можно разместить людей в том или ином порядке в соответствии с интенсивностью этого признака.

В практических приложениях методов, основанных на ранжировании, иногда сталкиваются со случаями, когда два или несколько объектов настолько подобны, что не удается отдать предпочтение одному из них. Когда эксперт ранжирует объект на основе субъективных суждений, то это свойство (отсутствие предпочтений) связано с истиной их неразличимостью или неспособностью исследователя найти существенные различия. В этом случае говорят, что такой объект называется связанным.

Например, студентов расположили в соответствии с их достоинствами или экзаменационными баллами. Метод, который принимается для предписания числовых значений рангов связанных объектов, заключается в усреднении рангов, которые они имели бы, если были различимы. Например, если связывают третий и четвертый объекты, то каждому приписывают ранг, равный 3,5, если же связывают объекты от второго до седьмого, то получаемый ранг равен 4,5.

Иногда такой подход называется “методом средних рангов”. Когда нет основания для выбора между объектами, то ясно, что в этом случае нужно приписать всем одинаковые ранги. Преимуществом данного метода является то, что сумма рангов для всех объектов остается точно такой же как и при ранжировании без связей.

В анализе социально – экономических явлений часто приходится прибегать к различным, условным оценкам с помощью рангов, а взаимосвязь между отдельными признаками измерять с помощью непараметрических коэффициентов связи.

3 Коэффициент конкордации рангов Кендалла

Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент корреляции (коэффициент конкордации).

В практике статистических исследований встречаются случаи, когда совокупность объектов характеризуется не двумя, а несколькими последовательностями рангов, необходимо установить статистическую связь между несколькими переменными. В качестве такого измерителя используют множественный коэффициент корреляции (коэффициент конкордации) рангов Кендалла, определяемой по следующей формуле:

где W – коэффициент конкордации;

D – сумма квадратов рангов рассчитывается по формуле (2);

n – число объектов ранжируемого признака (число экспертов);

m – число анализируемых порядковых переменных.

В некотором смысле W служит мерой общности.

, (2)

где r ij – расставленные ранги суждений группы экспертов;

n – число объектов(число экспертов).

Значения коэффициентов конкордации заключены на отрезке .

Увеличение коэффициента от 0 к 1 означает проявление большей согласованности суждений. Если все эти суждения совпадают, то W=1.

Проверка значимости коэффициента основана на том, что в случае справедливости нулевой гипотезы об отсутствии корреляционной связи при n>7 статистика m(n-1)* W имеет приближенно – распределение с k=n-1 степенями свободы. Поэтому коэффициент конкордации значим на уровне =0,05, если m(n-1)W> .

Коэффициент тесноты связи между признаками, рассмотренный в предыдущем разделе, можно применять, если изучаемые признаки являются количественными. При этом используется вычисление основных параметров распределения (средних величин, дисперсий), т.е. параметрический метод.

В статистической практике изучения общественно-экономических явлений и процессов приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. В этом случае используют так называемые непараметрические методы.

В анализе социально-экономических явлений широко используются ранговые коэффициенты корреляции (коэффициенты корреляции рангов), когда коррелируют не непосредственные значения х и у, а их ранги,т.е. номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию. К таким непараметрическим коэффициентам относятся коэффициенты рангов Спирменаи Кендалла.

Если п вариантов ряда расположены в соответствии с возрастанием или убыванием признака х, то говорят, что объекты ранжированы по этому признаку. Ранг для х,- указывает место, которое занимает i-eзначение признака среди других п значений признака х (/ = 1,2,___, п).

Например, при исследовании рынка можно задаться целью выяснения предпочтений потребителей при выборе товара (при покупке акций, мороженого, автомобиля и т.п.) таким образом, чтобы они распределили товар в порядке возрастания (или убывания) своих потребительских предпочтений. Если имеется два набора ранжированных данных, то можно установить степень линейной зависимости между ними.

Пример 6.7.Предположим, имеется 5 продуктов (табл. 6.7), которые ранжированы по порядку предпочтений от 1 до 5 в соответствии с двумя характеристиками Aw В.

Исходные ранжировки

Таблица 6.7

Необходимо исследовать тесноту статистической связи между характеристиками.

Решение. Использование для определения интенсивности связи между признаками коэффициента Пирсона будет неверным, так как этот коэффициент применяется для признаков, измеряемых количественно. Так, например, при определении взаимосвязи между ростом и весом мы измеряем рост в сантиметрах, а вес в килограммах, при этом есть возможность точно определить на шкале измерений разность значений этих признаков для любого человека (иначе — расстояние между ними на шкале измерений). Возьмем признак, измеренный в ранговой шкале, — экзаменационная оценка. Значит ли, что у получившего двойку студента знаний в два раза меньше, чем у того, кто получил четверку? Или двое студентов, получивших тройки, имеют абсолютно одинаковый уровень знаний? Ответ — нет, преподаватель упорядочивает их уровень знаний в определенной последовательности, в соответствии с критериями оценки знаний по конкретному предмету, но расстояние между значениями признаков на такой шкале не является строго фиксированным.

Для определения наличия взаимосвязи между ранговыми оценками используется коэффициент ранговой корреляции Спирмена.Его расчет основан на различиях между рангами.

Обозначим разность рангов d = ранг А ~ ранг В.

Коэффициент Спирмена

где п — число пар ранжированных наблюдений.

Впримере имеем пять пар рангов, следовательно, п- 5.Сумма ct равна

Тогда коэффициент Спирмена

Коэффициент Спирмена изменяется в интервале [-1; 1] и интерпретируется так же, как и коэффициент Пирсона. Отличие в том, что он вычисляется для ранжированных данных.

Значение 0,6 позволяет сделать вывод о заметной линейной связи между двумя характеристиками товаров.

Значимость коэффициента Спирмена проверяется на основе t критерия Стьюдента по формуле

Значение коэффициента считается существенным, если t paсч > > 6фит;а (и — 2) для заданного уровня значимости а.

Коэффициент корреляции рангов (при условии, что ранги не повторяются) может быть рассчитан и по формуле, предложенной английским статистиком М. Кендаллом:

где S — фактическая разность рангов; ~ п (п — l) — максимальная сумма рангов.

Этот коэффициент изменяется в интервале от [-1; 1] и интерпретируется так же, как и коэффициент Пирсона, но дает более строгую

оценку связи, чем коэффициент Спирмена, причем р = — т. Это соотношение выполняется при большом числе наблюдений (п > 30), и слабых либо умеренно тесных связях.

При расчете коэффициента Кендалла соблюдается следующая последовательность действий:

  • 1. Значения х ранжируются в порядке возрастания.
  • 2. Значения у располагаются в порядке, соответствующем значениям х.
  • 3. Для каждого ранга у определяется число следующих за ним значений рангов, превышающих его величину. Результат записывается в столбец «+».
  • 4. Для каждого ранга у определяется число следующих за ним меньших значений рангов. Результат записывается в столбец «-».
  • 5. Находится сумма в столбце «+» и обозначается Р, в столбце «-» и обозначается Q. Определяется S = P- Q.

Значимость коэффициента корреляции рангов Кендалла проверяется по формуле

где щ_ а/2 (п — 2) — квантиль, определяемый по таблице нормального распределения для выбранного уровня значимости а и заданного п.

Пример 6.8. Рассчитаем коэффициент Кендалла на основании данных примера 6.7.

Решение. Проведем необходимые расчеты в табл. 6.8.

Действительно, если полученное значение т умножить на 1,5, то получим 0,6 — значение коэффициента Спирмена, рассчитанное в примере 6.7.

Расчетная таблица

Рассмотрим корреляцию альтернативных признаков, т.е.признаков, принимающих только два возможных значения. Исследования их корреляции основано на показателях, построенных на четырехклеточных таблицах, в которые сводится число единиц для заданных значений признаков:

Решение. Для измерения тесноты взаимосвязи признаков производится расчет коэффициента контингенции по формуле

Коэффициент контингенции принимает значения на интервале [-1; 1 ]. Интерпретация аналогична коэффициенту корреляции. Мы получили слабую отрицательную связь.

Другой метод измерения связи основан на расчете коэффициента ассоциации:

„ л 30×5-20×15 л „

Получим: Q =-= -0,33

Знак «минус» перед коэффициентом указывает на то, что чем больше студентов было привито от гриппа, тем ниже заболеваемость.

Коэффициент контингенции всегда бывает меньше коэффициента ассоциации и дает более корректную оценку тесноты связи.

Для оценки тесноты связи между признаками, принимающими любое число вариантов значений (категориальные, номинальные признаки), применяется коэффициент взаимной сопряженности Пирсона. Основой изучения связи между категориальными признаками служит таблица сопряженности — двумерное распределение единиц совокупности по признакам. Вся информация о наличии или отсутствии связи содержится в совместных частотах сочетаний признаков.

Информация для оценки этой связи группируется в виде таблицы (например, для трех значений первого признака и двух — второго), табл. 6.10.

Таблица 6.10

Пример таблицы сопряженности

Признак

Итого

Ъгпц

ЪЪгпц

Обозначения: ту — частоты взаимного сочетания двух атрибутивных признаков; п = YLmy — число наблюдений.

Коэффициент взаимной сопряженности Пирсона определяется по формуле

где ср — показатель средней квадратической сопряженности:

Коэффициент взаимной сопряженности принимает значения в интервале и интерпретируется подобно коэффициенту парной линейной корреляции Пирсона.

Пример 6.10.Для изучения влияния условий труда на взаимоотношения в коллективе было проведено выборочное обследование 250 работников предприятия, ответы которых распределились, как представлено в табл. 6.11.

Таблица 6.11

Исходные данные об условиях труда и взаимоотношениях в коллективе

Требуется охарактеризовать связь между исследуемыми показателями с помощью коэффициента взаимной сопряженности Пирсона.

Решение.

Полученное значение коэффициента сопряженности свидетельствует, что связь между условиями труда и взаимоотношениями в коллективе умеренная.

При изучении общественного здоровья и здравоохранения в научных и практических целях исследователю часто приходится проводитьстатистический анализ связей между факторными и результативными признаками статистический совокупности (причинно-следственная связь)или определение зависимости параллельных изменений нескольких признаков этой совокупности от какой либо третьей величины (от общейих причины). Необходимо уметь изучать особенности этой связи, определять ее размеры и направление, а также оценивать еедостоверность. Для этого используются методы корреляции.

  1. Виды проявления количественных связей между признаками
    • функциональная связь
    • корреляционная связь
  2. Определения функциональной и корреляционной связи

    Функциональная связь — такой вид соотношения между двумя признаками, когда каждому значению одного из них соответствуетстрого определенное значение другого (площадь круга зависит от радиуса круга и т.д.). Функциональная связь характерна дляфизико-математических процессов.

    Корреляционная связь — такая связь, при которой каждому определенному значению одного признака соответствует несколькозначений другого взаимосвязанного с ним признака (связь между ростом и массой тела человека; связь между температурой тела ичастотой пульса и др.). Корреляционная связь характерна для медико-биологических процессов.

  3. Практическое значение установления корреляционной связи. Выявление причинно-следственной между факторными ирезультативными признаками (при оценке физического развития, для определения связи между условиями труда, быта и состояниемздоровья, при определении зависимости частоты случаев болезни от возраста, стажа, наличия производственных вредностей и др.)

    Зависимость параллельных изменений нескольких признаков от какой-то третьей величины. Например, под воздействием высокойтемпературы в цехе происходят изменения кровяного давления, вязкости крови, частоты пульса и др.

  4. Величина, характеризующая направление и силу связи между признаками. Коэффициент корреляции, который одним числом даетпредставление о направлении и силе связи между признаками (явлениями), пределы его колебаний от 0 до ± 1
  5. Способы представления корреляционной связи
    • график (диаграмма рассеяния)
    • коэффициент корреляции
  6. Направление корреляционной связи
    • прямая
    • oбратная
  7. Сила корреляционной связи
    • сильная: ±0,7 до ±1
    • средняя: ±0,3 до ±0,699
    • слабая: 0 до ±0,299
  8. Методы определения коэффициента корреляции и формулы
    • метод квадратов (метод Пирсона)
    • ранговый метод (метод Спирмена)
  9. Методические требования к использованию коэффициента корреляции
    • измерение связи возможно только в качественно однородных совокупностях (например, измерение связи между ростом и весом всовокупностях, однородных по полу и возрасту)
    • расчет может производиться с использованием абсолютных или производных величин
    • для вычисления коэффициента корреляции используются не сгруппированные вариационные ряды (это требование применяется толькопри вычислении коэффициента корреляции по методу квадратов)
    • число наблюдений не менее 30
  10. Рекомендации по применению метода ранговой корреляции (метод Спирмена)
    • когда нет необходимости в точном установлении силы связи, а достаточно ориентировочных данных
    • когда признаки представлены не только количественными, но и атрибутивными значениями
    • когда ряды распределения признаков имеют открытые варианты (например, стаж работы до 1 года и др.)
  11. Рекомендации к применению метода квадратов (метод Пирсона)
    • когда требуется точное установление силы связи между признаками
    • когда признаки имеют только количественное выражение
  12. Методика и порядок вычисления коэффициента корреляции

    1) Метод квадратов

    2) Ранговый метод

  13. Схема оценки корреляционной связи по коэффициенту корреляции
  14. Вычисление ошибки коэффициента корреляции
  15. Оценка достоверности коэффициента корреляции,полученного методом ранговой корреляции и методом квадратов

    Способ 1Достоверность определяется по формуле:

    Критерий t оценивается по таблице значений t с учетом числа степеней свободы (n — 2), где n — число парных вариант. Критерий tдолжен быть равен или больше табличного, соответствующего вероятности р ≥99%.

    Способ 2Достоверность оценивается по специальной таблице стандартных коэффициентов корреляции. При этом достоверным считается такойкоэффициент корреляции, когда при определенном числе степеней свободы (n — 2), он равен или более табличного, соответствующегостепени безошибочного прогноза р ≥95%.

на применение метода квадратов

Задание: вычислить коэффициент корреляции, определить направление и силу связи между количеством кальция в воде ижесткостью воды, если известны следующие данные (табл. 1). Оценить достоверность связи. Сделать вывод.

Таблица 1

Обоснование выбора метода. Для решения задачи выбран метод квадратов (Пирсона), т.к. каждый из признаков (жесткость водыи количество кальция) имеет числовое выражение; нет открытых вариант.

Решение.Последовательность расчетов изложена в тексте, результаты представлены в таблице. Построив ряды из парных сопоставляемыхпризнаков, обозначить их через х (жесткость воды в градусах) и через у (количество кальция в воде в мг/л).

Жесткость воды (в градусах)Количество кальция в воде (в мг/л)d хd уd х х d уd x 2d y 24 8 11 27 34 3728 56 77 191 241 262-16 -12 -9 +7 +14 +16-114 -86 -66 +48 +98 +1201824 1032 594 336 1372 1920256 144 81 49 196 25612996 7396 4356 2304 9604 14400М х =Σ х / n М у =Σ у / n Σ d х x d у =7078 Σ d х 2 =982 Σ d y 2 =51056М х =120/6=20 М y =852/6=142

  1. Определить средние величины M x ряду вариант «х» и М у в ряду вариант «у» по формулам:М х = Σх/n (графа 1) иМ у = Σу/n (графа 2)
  2. Найти отклонение (d х и d у) каждой варианты от величины вычисленной средней в ряду «x» и в ряду «у»d х = х — М х (графа 3) и d y = у — М у (графа4).
  3. Найти произведение отклонений d x х d y и суммировать их: Σ d х х d у (графа 5)
  4. Каждое отклонение d x и d у возвести в квадрат и суммировать их значения по ряду «х» и по ряду «у»:Σ d x 2 = 982 (графа 6) и Σ d y 2 = 51056 (графа 7).
  5. Определить произведение Σ d x 2 х Σ d y 2 и из этого произведения извлечьквадратный корень
  6. Полученные величины Σ (d x x d y) и√(Σd x 2 xΣd y 2) подставляем в формулу расчета коэффициента корреляции:
  7. Определить достоверность коэффициента корреляции:1-й способ. Найти ошибку коэффициента корреляции (mr xy) и критерий t по формулам:

    Критерий t = 14,1, что соответствует вероятности безошибочного прогноза р > 99,9%.

    2-й способ. Достоверность коэффициента корреляции оценивается по таблице «Стандартные коэффициенты корреляции» (см.приложение 1). При числе степеней свободы (n — 2)=6 — 2=4, наш расчетный коэффициент корреляции r xу = + 0,99 большетабличного (r табл = + 0,917 при р = 99%).

    Вывод. Чем больше кальция в воде, тем она более жесткая (связь прямая, сильная и достоверная:r ху = + 0,99, р > 99,9%).

    на применение рангового метода

    Задание: методом рангов установить направление и силу связи между стажем работы в годах и частотой травм, если полученыследующие данные:

    Обоснование выбора метода: для решения задачи может быть выбран только метод ранговой корреляции, т.к. первый рядпризнака «стаж работы в годах» имеет открытые варианты (стаж работы до 1 года и 7 и более лет), что не позволяет использовать дляустановления связи между сопоставляемыми признаками более точный метод — метод квадратов.

    Решение. Последовательность расчетов изложена в тексте, результаты представлены в табл. 2.

    Таблица 2

    Стаж работы в годахЧисло травмПорядковые номера (ранги)Разность ранговКвадрат разности ранговXYd(х-у)d 2До 1 года2415-4161-21624-243-41232,5+0,50,255-61242,5+1,52,257 и более651+416Σ d 2 = 38,5

    Стандартные коэффициенты корреляции, которые считаются достоверными (по Л.С. Каминскому)

    Число степеней свободы — 2Уровень вероятности р (%)95%98%99%10,9970,9990,99920,9500,9800,99030,8780,9340,95940,8110,8820,91750,7540,8330,87460,7070,7890,83470,6660,7500,79880,6320,7160,76590,6020,8850,735100,5760,8580,708110,5530,6340,684120,5320,6120,661130,5140,5920,641140,4970,5740,623150,4820,5580,606160,4680,5420,590170,4560,5280,575180,4440,5160,561190,4330,5030,549200,4230,4920,537250,3810,4450,487300,3490,4090,449

    1. Власов В.В. Эпидемиология. — М.: ГЭОТАР-МЕД, 2004. — 464 с.
    2. Лисицын Ю.П. Общественное здоровье и здравоохранение. Учебник для вузов. — М.: ГЭОТАР-МЕД, 2007. — 512 с.
    3. Медик В.А., Юрьев В.К. Курс лекций по общественному здоровью и здравоохранению: Часть 1. Общественное здоровье. — М.: Медицина, 2003. — 368 с.
    4. Миняев В.А., Вишняков Н.И. и др. Социальная медицина и организация здравоохранения (Руководство в 2 томах). — СПб, 1998. -528 с.
    5. Кучеренко В.З., Агарков Н.М. и др.Социальная гигиена и организация здравоохранения (Учебное пособие) — Москва, 2000. — 432 с.
    6. С. Гланц. Медико-биологическая статистика. Пер с англ. — М., Практика, 1998. — 459 с.

Достаточно хорошо аппроксимирует Р. с. Т, и разность пренебрежимо мала, когда . При справедливости гипотезы H 0 , согласно к-рой компоненты Х 1 ,… , Х n случайного вектора Xсуть независимые случайные величины, проекция Р. с. Топределяется по формуле

где (см. ).

Существует внутренняя связь между Р. с. и . Как показано в , при справедливости гипотезы H 0 проекция коэффициента корреляции Кендалла в семейство линейных Р. с. с точностью до постоянного множителя совпадает с коэффициентом ранговой корреляции Спирмена , а именно:

Из этого равенства следует, что коэффициент корреляции соrr между и равен

т. е. при больших пР. с. и асимптотически эквивалентны (см. ).

Лит.: Г а е к Я., Ш и д а к З., Теория ранговых критериев, пер. с англ., М., 1971; К е n d a l l M. G., Rank correlation methods, 4ed., L., 1970. М. С. Никулин.

Математическая энциклопедия. — М.: Советская энциклопедия. И. М. Виноградов. 1977-1985.

Смотреть что такое «РАНГОВАЯ СТАТИСТИКА» в других словарях:

    ранговая статистика — — [А.С.Гольдберг. Англо русский энергетический словарь. 2006 г.] Тематики энергетика в целом EN rank statistics … Справочник технического переводчика

    У этого термина существуют и другие значения, см. Статистика (значения). Статистика (в узком смысле) это измеримая числовая функция от выборки, не зависящая от неизвестных параметров распределения. В широком смысле термин (математическая)… … Википедия

    — (statistics) 1. Совокупность данных и математических методов, используемых для изучения связей между различными переменными. Она включает такие методы, как линейная регрессия (linear regression) и ранговая корреляция. 2. Значения, использующиеся… … Экономический словарь

    СТАТИСТИКА — 1. Вид деятельности, направленной на получение, обработку и анализ информации, характеризующей количественные закономерности жизни об ва во всем ее многообразии, в неразрывной связи с ее качественным содержанием. В более узком смысле слова… … Российская социологическая энциклопедия

    — (non parametric statistics) Статистические технические приемы, которые не допускают особенных функциональных форм для отношений между переменными. Ранговая корреляция двух переменных является тому примером. Использование подобных технических… … Экономический словарь — К. м., получившие свое назв. благодаря тому, что основываются на «со отношении» («co relation») переменных, представляют собой статистические методы, начало к рым было положено в работах Карла Пирсона примерно в конце XIX в. Они тесно связаны с… … Психологическая энциклопедия

    Разработчик Digital Illusions CE Издатель … Википедия

    Карл Пирсон Karl (Carl) Pearson Дата рождения … Википедия

Использованиепорядковой шкалы позволяет присваиватьранги объектам по какому-либо признаку.Таким образом, метрические значенияпереводятся в ранговые. При этомфиксируются различия в степенивыраженности свойств. В процессеранжирования следует придерживаться2 правил.

Правилопорядка ранжирования.Надо решить, кто получает первый ранг:объект с самой большей степеньювыраженности какого-либо качества илинаоборот. Чаще всего это абсолютнобезразлично и не отражается на конечномрезультате. Традиционно принято первыйранг приписывать объектам с большейстепенью выраженности качества (большемузначению – меньший ранг). Например,чемпиону присуждают первое место, а ненаоборот. Хотя, и здесь если бы был принятобратный порядок, то результаты от этогоне изменились бы. Так что порядокранжирования каждый исследовательвправе определять сам. Например, Е. В.Сидоренко рекомендует меньшему значениюприписывать меньший ранг. В некоторыхслучаях это удобнее, но непривычнее.

Например: имеетсянеупорядоченная выборка, данные которойнеобходимо проранжировать. {2, 7, 6, 8, 11,15, 9}. После упорядочивания выборкиранжируем ее.

Метрические данные

Альтернативный вариант:

Метрические данные

Отдельно следуетсказать следующее. Существует группаредко используемых непараметрическихкритериев (Т-критерий Вилкоксона,U-критерий Манна-Уитни,Q-критерий Розенбаума идр.), при работе с которыми всегда надоменьшему значению приписывать меньшийранг.

Правилосвязанных рангов.Объектам с одинаковой выраженностьюсвойств приписывается один и тот жеранг. Этот ранг представляет собойсреднее значение тех рангов, которыеони получили бы, если бы не были равны.Например, надо проранжировать выборку,содержащую ряд одинаковых метрическихданных: {4, 5, 9, 2, 6, 5, 9, 7, 5, 12}. Послеупорядочивания выборки следует вычислитьсреднее арифметическое значениесвязанных рангов.

Метрические данные

Предварительное ранжирование

Окончательное ранжирование

Задания для самостоятельной работы.

    Проранжировать выборку по правилу «большему значению – меньший ранг»:{111, 104, 115, 107, 95, 104, 104}.

    Проранжировать выборку по правилу «меньшему значению – меньший ранг»{20, 25, 8, 7, 20, 14, 27}.

    Объединить две предыдущие выборки и провести ранжирование по правилу «большему значению – меньший ранг»

    Показатели каких признаков из Таблицы Iявляются номинативными, каких – метрическими?

    Перевести показатели осведомленности из Таблицы IПриложения в ранговую шкалу. Выделить уровни выраженности показателей посредством их перевода в номинативную шкалу.

      Таблица I Данные для обработки

учащиеся

профиль ВУЗа

осведомленность

скрытые фигуры

пропущенные

арифметика

понятливость

исключение

изображений

аналогии

числовые ряды

умозаключения

геометрическое сложение

заучивание слов

средний IQ

экстраверсия-

интроверсия

нейротизм

средняя отметка

ПрофильВУЗа: 0 — выбор учеником гуманитарногопрофиля;

1- выбор учеником математического илиестественно-научного профиля

От admin