Как сделать корреляционную таблицу
Корреляционные плеяды используются как наглядный способ представления результатов корреляционного анализа. Это не отдельный статистический метод, а лишь способ графически представить корреляционные взаимосвязи.
Прежде чем строить корреляционные плеяды, необходимо разобраться в том, что же такое корреляция, а также понять, в чем специфика использования корреляционного анализа в психологических исследованиях.
Использование метода корреляционных плеяд в дипломах по психологии делает работу более презентабельной и демонстрирует более высокий уровень осведомленности студента-психолога.
Как построить корреляционные плеяды
Существует два основных способа построения корреляционных плеяд:
- Рисование с помощью инструментов Word.
- Построение при помощи специальных программ.
Построение корреляционной плеяды средствами Word
Прежде всего необходимо провести расчет корреляций между психологическими параметрами.
Далее следует на черновике наметить расположение параметров и связей между ними.
На следующем этапе необходимо приступить собственно к рисованию:
Рассмотрим в качестве примера построение корреляционной плеяды в исследовании взаимосвязей различных видов личностной идентичности с психологическим благополучием и смысложизненными ориентациями.
Значимые коэффициенты ранговой корреляции Спирмена различных видов личностной идентичности с психологическим благополучием и смысложизненными ориентациями.
Позитивные отношения
с окружающими
* - корреляции статистически достоверны (р≤0,05)
** - корреляции статистически достоверны (р≤0,01)
Так как в данном случае имеем два различных вида психологических показателей (с одной стороны показатели идентичности, с другой – смысложизненные ориентации и показатели благополучия), то логично расположить фигуры с разными психологическими данными напротив друг друга.
Рис. 1. Корреляционная плеяда показателей личностной идентичности с психологическим благополучием и смысложизненными ориентациями
Существуют следующие правила изображения взаимосвязей между психологическими параметрами на корреляционных плеядах в ВКР по психологии:
- положительные корреляции – сплошная черта;
- отрицательные корреляции – пунктирная черта;
- корреляции на уровне значимости 0,05 – одинарная черта;
- корреляции на уровне значимости 0,01 – двойная черта.
Над линиями, соединяющими фигуры с надписями психологических показателей и отражающими взаимосвязи между ними следует написать численное значение корреляций.
В приведенном выше примере психологических показателей и связей между ними не так много и рисунок с изображением корреляционных плеяд наглядно отражает корреляционные связи. В ситуации, когда психологических показателей и связей между ними существенно больше изобразить их вручную становится трудно. В этом случае для реализации метода корреляционных плеяд можно воспользоваться специальными программами.
Построение корреляционной плеяды с помощью специальных программ
Существует несколько программ для построения корреляционных плеяд. При этом в строго научной терминологии корреляционные плеяды называются графами.
Графы – это совокупность некоторых объектов, соединенных связями. Применительно к психологии корреляционные связи между психологическими показателями – это и есть графы.
Суть программ построения граф сводится к тому, что в некотором редакторе в определенном формате нужно задать психологические показатели, связи между ними и программа сама нарисует корреляционную плеяду наиболее оптимально расположив объекты.
Пример построения корреляционной плеяды в психологии с использованием программы Graphviz.
Задание для построения программе Graphviz пишется на языке DOT в отдельном текстовом файле. В нем описаны все показатели и связи между ними. И вот как выглядит корреляционная плеяда, построенная программой Graphviz.
Рис. 2. Корреляционная плеяда взаимосвязей состояния гнева с личностными чертами
На рисунке 2 достаточно много показателей и взаимосвязей и оптимально расположить их на рисунке вручную было бы сложно. Программа же справилась с этой непростой задачей. Важно отметить, что в данной программе нельзя строить двойные и пунктирные линии для выделения типа взаимосвязей.
Представляется спорным вопрос о том, насколько корреляционная плеяда, изображенная на рис. 2 помогает лучше понять корреляционные связи между показателями гнева и личностными чертами в группе подростков. По-моему, табличное представление в данном случае более наглядно, а рисунок слишком запутан. Но часто преподаватели требуют от студентов дублировать табличное представление корреляций построением корреляционных плеяд. В этом случае приходится использовать метод корреляционных плеяд.
Итак, если вам необходимо построить корреляционную плеяду в дипломной, курсовой или магистерской работе по психологии, то следует действовать по следующему алгоритму:
1. Если психологических показателей и корреляционных связей между ними немного, то лучше строить корреляционную плеяду средствами редактора Word (см. рис. 1).
2. Если же психологических параметров и корреляций между ними достаточно много, то лучше использовать программы построения графов, например, Graphviz.
Надеюсь, эта статья поможет вам написать работу по психологии самостоятельно. Если понадобится помощь, обращайтесь (все виды работ по психологии; статистические расчеты). Заказать
Корреляционная матрица в Excel — это способ обобщения данных корреляции, показывающих взаимосвязь между двумя переменными, и каждая таблица в матрице корреляции показывает нам взаимосвязь между двумя переменными, чтобы создать матрицу корреляции, мы можем сделать это из вкладки анализа данных и из раздела корреляции.
Объяснение
Матрица — это набор чисел, упорядоченных по строкам и столбцам в структурированном формате. Корреляция — это поиск или измерение зависимости или отношений между переменными. Он показывает, как одна переменная зависит от другой, а влияние роста или снижения одной переменной влияет на другую. Для измерения корреляции также можно использовать более двух переменных, и это называется корреляцией нескольких переменных. Результирующие коэффициенты могут быть положительными, отрицательными или нулевыми, т. Е. -1, +1 или 0.
- Положительная корреляция — это та, где результирующий коэффициент равен +1, что означает, что обе переменные движутся в одном направлении.
- Отрицательная корреляция — это та, при которой результирующий коэффициент равен -1, что означает, что переменные имеют тенденцию двигаться в противоположных направлениях.
- Нулевая корреляция — это когда результирующий коэффициент равен 0, а переменные не зависят друг от друга.
Как создать корреляционную матрицу в Excel?
Давайте посмотрим на несколько примеров, чтобы понять, как создать корреляционную матрицу в Excel.
Теперь давайте посмотрим, как найти корреляционную матрицу в Excel с помощью пакета Analysis Toolpak в Excel.
Если этот параметр недоступен, добавьте его из списка надстроек. Добавить,
- Установите флажок для пакета инструментов анализа и нажмите ОК.
- Теперь, чтобы создать матрицу корреляции и использовать функцию Excel корреляции, щелкните Анализ данных, выберите Корреляцию во всплывающем окне Инструменты анализа и нажмите ОК.
Появится всплывающее окно с запросом диапазона ввода.
- Выберите диапазон данных переменных в поле диапазона ввода.
- Установите флажок для меток в первой строке (если у вас есть метки переменных в первой строке)
- Это таблица результатов корреляции для переменных A и B.
Давайте посмотрим на пример корреляционной матрицы в Excel для нескольких переменных.
- Теперь, чтобы использовать функцию корреляции, щелкните Анализ данных, выберите Корреляцию во всплывающем окне Инструменты анализа и нажмите ОК.
Появится всплывающее окно с запросом диапазона ввода.
- Выберите диапазон данных переменных в поле диапазона ввода.
- Установите флажок для меток в первой строке (если у вас есть метки переменных в первой строке)
- Выберите опцию Output Range и выберите / введите номер ячейки, в которой вы хотите получить таблицу результатов.
- Щелкните ОК.
- В этом примере мы использовали три переменные, чтобы найти корреляционную матрицу. Диапазон (A1: C7) — это данные для переменных, а диапазон (A9: D12) — это таблица результатов для корреляционной матрицы.
Здесь переменные показаны в строках и столбцах. Результат корреляции между переменными должен быть прочитан путем проверки переменной в строке и переменной в столбце, смежном с этой строкой.
Пример 1 . По данной корреляционной таблице построить прямые регрессии с X на Y и с Y на X . Найти соответствующие коэффициенты регрессии и коэффициент корреляции между X и Y .
y/x | 15 | 20 | 25 | 30 | 35 | 40 |
100 | 2 | 2 | ||||
120 | 4 | 3 | 10 | 3 | ||
140 | 2 | 50 | 7 | 10 | ||
160 | 1 | 4 | 3 | |||
180 | 1 | 1 |
Решение:
Уравнение линейной регрессии с y на x будем искать по формуле
а уравнение регрессии с x на y, использовав формулу:
где x x , y — выборочные средние величин x и y, σx, σy — выборочные среднеквадратические отклонения.
Находим выборочные средние:
x = (15(1 + 1) + 20(2 + 4 + 1) + 25(4 + 50) + 30(3 + 7 + 3) + 35(2 + 10 + 10) + 40(2 + 3))/103 = 27.961
y = (100(2 + 2) + 120(4 + 3 + 10 + 3) + 140(2 + 50 + 7 + 10) + 160(1 + 4 + 3) + 180(1 + 1))/103 = 136.893
Выборочные дисперсии:
σ 2 x = (15 2 (1 + 1) + 20 2 (2 + 4 + 1) + 25 2 (4 + 50) + 30 2 (3 + 7 + 3) + 35 2 (2 + 10 + 10) + 40 2 (2 + 3))/103 — 27.961 2 = 30.31
σ 2 y = (100 2 (2 + 2) + 120 2 (4 + 3 + 10 + 3) + 140 2 (2 + 50 + 7 + 10) + 160 2 (1 + 4 + 3) + 180 2 (1 + 1))/103 — 136.893 2 = 192.29
Откуда получаем среднеквадратические отклонения:
и
Определим коэффициент корреляции:
где ковариация равна:
Cov(x,y) = (35•100•2 + 40•100•2 + 25•120•4 + 30•120•3 + 35•120•10 + 40•120•3 + 20•140•2 + 25•140•50 + 30•140•7 + 35•140•10 + 15•160•1 + 20•160•4 + 30•160•3 + 15•180•1 + 20•180•1)/103 — 27.961 • 136.893 = -50.02
Запишем уравнение линий регрессии y(x):
Построим найденные уравнения регрессии на чертеже, из которого сделаем следующие вывод:
1) обе линии проходят через точку с координатами (27.961; 136.893)
2) все точки расположены близко к линиям регрессии.
Пример 2 . По данным корреляционной таблицы найти условные средние y и x . Оценить тесноту линейной связи между признаками x и y и составить уравнения линейной регрессии y по x и x по y . Сделать чертеж, нанеся его на него условные средние и найденные прямые регрессии. Оценить силу связи между признаками с помощью корреляционного отношения.
Корреляционная таблица:
X / Y | 2 | 4 | 6 | 8 | 10 |
1 | 5 | 4 | 2 | ||
2 | 6 | 3 | 3 | ||
3 | 1 | 2 | 3 | ||
5 | 1 |
Уравнение линейной регрессии с y на x имеет вид:
Уравнение линейной регрессии с x на y имеет вид:
Запишем уравнения линий регрессии y(x):
и вычисляя, получаем:
yx = 0.28 x + 0.39
Запишем уравнения линий регрессии x(y):
и вычисляя, получаем:
xy = 2.13 y + 1.42
Если построить точки, определяемые таблицей и линии регрессии, увидим, что обе линии проходят через точку с координатами (5.53; 1.93) и точки расположены близко к линиям регрессии.
Значимость коэффициента корреляции.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=30-m-1 = 28 находим tкрит:
tкрит (n-m-1;α/2) = (28;0.025) = 2.048
где m = 1 — количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически — значим.
Пример . По корреляционной таблице рассчитать ковариацию и коэффициент корреляции, построить прямые регрессии.
Пример 5 . С целью анализа взаимного влияния прибыли предприятия и его издержек выборочно были проведены наблюдения за этими показателями в течение ряда месяцев: X — величина месячной прибыли в тыс. руб., Y — месячные издержки в процентах к объему продаж.
Результаты выборки сгруппированы и представлены в виде корреляционной таблицы, где указаны значения признаков X и Y и количество месяцев, за которые наблюдались соответствующие пары значений названных признаков.
Решение.
Пример №5
Пример №6
Пример №7
Пример 7 . Дана корреляционная таблица для величин X и Y, X- срок службы колеса вагона в годах, а Y — усредненное значение износа по толщине обода колеса в миллиметрах. Определить коэффициент корреляции и уравнения регрессий.
X / Y | 2 | 7 | 12 | 17 | 22 | 27 | 32 | 37 | 42 |
3 | 6 | ||||||||
1 | 25 | 108 | 44 | 8 | 2 | ||||
2 | 30 | 50 | 60 | 21 | 5 | 5 | |||
3 | 1 | 11 | 33 | 32 | 13 | 2 | 3 | 1 | |
4 | 5 | 5 | 13 | 13 | 7 | 2 | |||
5 | 1 | 2 | 12 | 6 | 3 | 2 | 1 | ||
6 | 1 | 1 | 2 | 1 | 1 | ||||
7 | 1 | 1 | 1 |
Пример 8 . По заданной корреляционной таблице определить групповые средние количественных признаков X и Y. Построить эмпирические и теоретические линии регрессии. Предполагая, что между переменными X и Y существует линейная зависимость:
- Вычислить выборочный коэффициент корреляции и проанализировать степень тесноты и направления связи между переменными.
- Определить линии регрессии и построить их графики.
Корреляционный анализ – популярный метод статистического исследования, который используется для выявления степени зависимости одного показателя от другого. В Microsoft Excel имеется специальный инструмент, предназначенный для выполнения этого типа анализа. Давайте выясним, как пользоваться данной функцией.
Суть корреляционного анализа
Предназначение корреляционного анализа сводится к выявлению наличия зависимости между различными факторами. То есть, определяется, влияет ли уменьшение или увеличение одного показателя на изменение другого.
Если зависимость установлена, то определяется коэффициент корреляции. В отличие от регрессионного анализа, это единственный показатель, который рассчитывает данный метод статистического исследования. Коэффициент корреляции варьируется в диапазоне от +1 до -1. При наличии положительной корреляции увеличение одного показателя способствует увеличению второго. При отрицательной корреляции увеличение одного показателя влечет за собой уменьшение другого. Чем больше модуль коэффициента корреляции, тем заметнее изменение одного показателя отражается на изменении второго. При коэффициенте равном 0 зависимость между ними отсутствует полностью.
Расчет коэффициента корреляции
Теперь давайте попробуем посчитать коэффициент корреляции на конкретном примере. Имеем таблицу, в которой помесячно расписана в отдельных колонках затрата на рекламу и величина продаж. Нам предстоит выяснить степень зависимости количества продаж от суммы денежных средств, которая была потрачена на рекламу.
Способ 1: определение корреляции через Мастер функций
Одним из способов, с помощью которого можно провести корреляционный анализ, является использование функции КОРРЕЛ. Сама функция имеет общий вид КОРРЕЛ(массив1;массив2).
Как видим, коэффициент корреляции в виде числа появляется в заранее выбранной нами ячейке. В данном случае он равен 0,97, что является очень высоким признаком зависимости одной величины от другой.
Способ 2: вычисление корреляции с помощью пакета анализа
Кроме того, корреляцию можно вычислить с помощью одного из инструментов, который представлен в пакете анализа. Но прежде нам нужно этот инструмент активировать.
Так как место вывода результатов анализа было оставлено по умолчанию, мы перемещаемся на новый лист. Как видим, тут указан коэффициент корреляции. Естественно, он тот же, что и при использовании первого способа – 0,97. Это объясняется тем, что оба варианта выполняют одни и те же вычисления, просто произвести их можно разными способами.
Как видим, приложение Эксель предлагает сразу два способа корреляционного анализа. Результат вычислений, если вы все сделаете правильно, будет полностью идентичным. Но, каждый пользователь может выбрать более удобный для него вариант осуществления расчета.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Корреляционная таблица позволяет изложить материал сжато, компактно и наглядно.
Построение корреляционной таблицы начинают с группировки значений фактического и результативного признаков. Для этого надо разбить все данные значения на требуемое количество интервалов (если количество интервалов не оговаривается в задании, можно выбрать k = 7, 8 или 10). Длина интервала вычисляется по формулам , , где k — количество интервалов. В первый столбик следует вписать значения факторного признака (X), а первую строку заполнить значениями результативного признака (Y).
[ymin, ymin + hy) | [ymin + hy, ymin + 2hy) | … | [ymax — hy, ymax ] | n(y) | ||
[xmin, xmin + hx) | n11 | n12 | … | n1k | ||
[xmin + hx, xmin + 2hx) | n21 | n22 | … | n2k | ||
… | … | … | … | … | … | … |
[xmax — hx, xmax ] | nk1 | nk2 | … | nkk | ||
n(x) | … | n | ||||
… |
Таблица 1. Корреляционная таблица.
Числа nij, полученные на пересечении строк и столбцов, означают частоту повторения данного сочетания значений X и Y, , где n — объем выборки. Если nij расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания nij допустимо утверждать о связи между Х и Y. При этом, если nij концентрируется около одной из двух диагоналей, имеет место прямая или обратная линейная связь.
и — середины соответствующих интервалов. Теперь можно пересчитать числовые характеристики по сгруппированной выборке, используя для этого формулы: , , .
Вопросы и ответы в сфере it технологий и настройке ПК
Использование корреляции
Вычисление корреляции особенно широко используется в экономике, социологических исследованиях, медицине и биометрии — везде, где можно получить два массива данных, между которыми может обнаружиться связь.
Рассчитать корреляцию можно вручную, выполняя несложные арифметические действия. Однако процесс вычисления оказывается очень трудоемким, если набор данных велик. Особенность метода в том, что он требует сбора большого количества исходных данных, чтобы наиболее точно отобразить, есть ли связь между признаками. Поэтому серьезное использование корреляционного анализа невозможно без применения вычислительной техники. Одной из наиболее популярных и доступных программ для решения этой задачи является Microsoft Office Excel.
Как выполнить корреляцию в Excel?
Самым трудоемким этапом определения корреляции является набор массива данных. Сравниваемые данные располагаются обычно в двух колонках или строчках. Таблицу следует делать без пропусков в ячейках. Современные версии Excel (с 2007 и младше) не требуют установок дополнительных настроек для статистических расчетов; необходимые манипуляции можно сделать в разделе формул:
Корреляция может быть прямая (если коэффициент больше нуля) и обратная (от -1 до 0).
Первая означает, что при росте одного параметра растет и другой. Обратная (отрицательная) корреляция отражает факт, что при росте одной переменной другая уменьшается.
Корреляция может быть близка к нулю. Это обычно свидетельствует, что исследуемые параметры не связаны друг с другом. Но иногда нулевая корреляция возникает, если сделана неудачная выборка, которая не отразила связь, либо связь имеет сложный нелинейный характер.
Если коэффициент показывает среднюю или сильную взаимосвязь (от ±0,5 до ±0,99), следует помнить, что это лишь статистическая взаимосвязь, которая вовсе не гарантирует влияние одного параметра на другой. Также нельзя исключать ситуации, что оба параметра независимы друг от друга, но на них воздействует какой-нибудь третий неучтенный фактор. Excel помогает моментально вычислить коэффициент корреляции, но обычно только количественных методов недостаточно для установления причинно-следственных связей в соотносимых выборках.
Читайте также: