Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Как построить график корреляции в excel

Корреляционный анализ – популярный метод статистического исследования, который используется для выявления степени зависимости одного показателя от другого. В Microsoft Excel имеется специальный инструмент, предназначенный для выполнения этого типа анализа. Давайте выясним, как пользоваться данной функцией.

Предназначение корреляционного анализа сводится к выявлению наличия зависимости между различными факторами. То есть, определяется, влияет ли уменьшение или увеличение одного показателя на изменение другого.

специалист
Мнение эксперта
Витальева Анжела, консультант по работе с офисными программами
Со всеми вопросами обращайтесь ко мне!
Задать вопрос эксперту
Корреляция стандартных графиков доходности двух прибыльных ПАММ-счетов всегда будет очень высокой, просто потому что они все движутся в правый верхний угол. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!
Коэффициент -0,16285 показывает весомость переменной Х на Y. То есть среднемесячная заработная плата в пределах данной модели влияет на количество уволившихся с весом -0,16285 (это небольшая степень влияния). Знак «-» указывает на отрицательное влияние: чем больше зарплата, тем меньше уволившихся. Что справедливо.

Корреляция и ковариация в EXCEL. Примеры и описание

  1. В категории «Статистические» выбираем функцию КОРРЕЛ.
  2. Аргумент «Массив 1» – первый диапазон значений – время работы станка: А2:А14.
  3. Аргумент «Массив 2» – второй диапазон значений – стоимость ремонта: В2:В14. Жмем ОК.

Если аргумент массив1 или массив2 пуст или если ( стандартное отклонение) их значений равны нулю, КОРРЕЛ возвращает значение #DIV/0! Если позиция, которую вы указали, находится перед первым или после последнего элемента в поле, формула возвращает ошибку #ССЫЛКА!.

Размер тор-говой площади, кв.м., х
Объем реализации, тыс. руб., у

Базовые понятия

Думаю, еще со школы все знакомы с линейной функцией, она как раз и лежит в основе тренда:

Y — это объем продаж, та переменная, которую мы будем объяснять временем и от которого она зависит, то есть Y(t);

t — номер периода (порядковый номер месяца), который объясняет план продаж Y;

a0 — это нулевой коэффициент регрессии, который показывает значение Y(t), при отсутствии влияния объясняющего фактора (t=0);

a1 — коэффициент регрессии, который показывает, на сколько исследуемый показатель продаж Y зависит от влияющего фактора t;

E — случайные возмущения, которые отражают влияния других неучтенных в модели факторов, кроме времени t.

специалист
Мнение эксперта
Витальева Анжела, консультант по работе с офисными программами
Со всеми вопросами обращайтесь ко мне!
Задать вопрос эксперту
1 наблюдаемое значение t -статистики Стьюдента для этого коэффициента больше, чем критическое табличное значение статистики Стьюдента для заданного уровня значимости, например, α 0,05 и числа степеней свободы df. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!
В настоящем разделе рассматривается аппроксимация экспериментальных данных с помощью функций ЛИНЕЙН, ТЕНДЕНЦИЯ, ЛГРФПРИБЛ и РОСТ. Функции ЛИНЕЙН и ТЕНДЕНЦИЯ применяют для восстановления линейных зависимостей вида y=b+a1x1+a2x2+…+anxn, а функции ЛГРФПРИБЛ и РОСТ — для нелинейных (показательных) зависимостей вида y=ba1 X 1 a2 X 2 …an Xn .

Как Сделать Коэффициент Детерминации в Excel

В Google Sheets выбираем Редактор диаграмм -> Дополнительные и ставим галочку возле Линии тренда. В настройках выбираем ЯрлыкУравнение и Показать R^2.

Построение уравнений регрессии с помощью линий тренда в MS Excel при хронометражных наблюдениях

Как поступить в случае, если для определенных объемов/размеров продукции хронометражные замеры отсутствуют? Или число замеров недостаточно, а дополнительные наблюдения в ближайшее время осуществить невозможно? Наилучший способ решения данной проблемы – построение расчетных зависимостей (уравнений регрессии) с помощью линий тренда в MS Excel.

Рассмотрим реальную ситуацию: на складе с целью установления величины трудовых затрат по коробочной отборке заказа были проведены хронометражные наблюдения. Результаты этих наблюдений представлены в таблице 1 ниже.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Впоследствии возникла необходимость определения затрат времени на отборку 0,6 и 0,9 м3 товара/заказа. В связи с невозможностью проведения дополнительных хронометражных исследований затраты времени на отборку данных объемов заказа были рассчитаны с помощью уравнений регрессии в MS Excel. Для этого таблица 1 была преобразована в таблицу 2.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Далее на вкладке «Вставка» в группе «Диаграммы» была выбрана «точечная с гладкими кривыми и маркерами» (рис.1).

Следующий шаг: курсор мыши был установлен на одной из точек графика и с помощью правой кнопки мыши было вызвано контекстное меню, в котором был выбран пункт: «добавить линию тренда» (рис.2).

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

В появившемся окне настройки формата линии тренда (рис. 3) были последовательно выбраны: тип линии линейная/степенная и установлены флажки на следующие пункты: «показать уравнение на диаграмме» и «поместить на диаграмме величину достоверности аппроксимации (R^2)» (коэффициент детерминации).

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

В результате были получены графики, представленные на рис. 4 и 5.

Линейная расчетная зависимость, рис. 4

Степенная расчетная зависимость, рис. 5

Примем за основную — линейную расчетную зависимость. Тогда значения затрат времени в зависимости от количества товара будут определяться по формуле: y = 54,511x + 0,1489. Результаты этих расчетов для количества товара, по которому ранее были проведены хронометражные наблюдения, представлены в таблице 3 ниже.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Определим среднее отклонение затрат времени, рассчитанных по уравнению регрессии от затрат времени, рассчитанных по данным хронометражных наблюдений: (-0,05+0,10-0,05+0,01)/4=0,0019. Таким образом, затраты времени, рассчитанные по уравнению регрессии отличаются от затрат времени, рассчитанных по данным хронометражных наблюдений всего на 0,19%. Расхождение данных ничтожно мало.

По формуле: y = 54,511x + 0,1489 установим затраты времени для количества товара, по которому ранее не были проведены хронометражные наблюдения (таблица 4).

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Таким образом, построение расчетных зависимостей с помощью линий тренда в MS Excel – это отличный способ установления затрат времени по операциям, которые в силу различных причин не были охвачены хронометражными наблюдениями.

Как построить график корреляции в excel - Все про Эксель
Статистические методы позволяют установить факт существования взаимозависимости признаков. Использование для этого специальных расчетов приводит к установлению коэффициентов корреляции (меры связанности).
специалист
Мнение эксперта
Витальева Анжела, консультант по работе с офисными программами
Со всеми вопросами обращайтесь ко мне!
Задать вопрос эксперту
Но иногда нулевая корреляция возникает, если сделана неудачная выборка, которая не отразила связь, либо связь имеет сложный нелинейный характер. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!
Открывается окно с параметрами корреляционного анализа. В отличие от предыдущего способа, в поле «Входной интервал» мы вводим интервал не каждого столбца отдельно, а всех столбцов, которые участвуют в анализе. В нашем случае это данные в столбцах «Затраты на рекламу» и «Величина продаж».
Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Построение функции тренда в Excel. Быстрый прогноз без учета сезонности – This is Data

Теперь вернитесь к состоянию рис. 2.50, нажав кнопку Отменить на Панели инструментов. Попробуйте изменить формат линии тренда – установите полиномиальную линию тренда полиномом 2-ой степени – получите рис. 2.52.

Использование MS EXCEL для расчета корреляции

и
Y
и, соответственно,
выборку
состоящую из нескольких пар значений (Х i ; Y i ). Для наглядности построим диаграмму рассеяния .

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

проведем для различных случаев взаимосвязи между переменными:
линейной, квадратичной
и при
отсутствии связи
.

: В файле примера можно задать параметры линейного тренда (наклон, пересечение с осью Y) и степень разброса относительно этой линии тренда. Также можно настроить параметры квадратичной зависимости.

В файле примера для построения диаграммы рассеяния

в случае отсутствия зависимости переменных использована диаграмма типа Точечная. В этом случае точки на диаграмме располагаются в виде облака.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

: Обратите внимание, что изменяя масштаб диаграммы по вертикальной или горизонтальной оси, облаку точек можно придать вид вертикальной или горизонтальной линии. Понятно, что при этом переменные останутся независимыми.

Как было сказано выше, для расчета коэффициента корреляции

в MS EXCEL существует функций КОРРЕЛ() . Также можно воспользоваться аналогичной функцией PEARSON() , которая возвращает тот же результат.

Для того, чтобы удостовериться, что вычисления корреляции

производятся функцией КОРРЕЛ() по вышеуказанным формулам, в файле примера приведено вычисление
корреляции
с помощью более подробных формул:

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

специалист
Мнение эксперта
Витальева Анжела, консультант по работе с офисными программами
Со всеми вопросами обращайтесь ко мне!
Задать вопрос эксперту
Для некоторых задач бывает полезно преобразовать одну или обе переменных так, чтобы получить линейную взаимосвязь для этого требуется сделать предположение о виде нелинейной связи, чтобы предложить нужный тип преобразования. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!
Для оценки качества модели множественной регрессии вычисляют коэффициент детерминации R 2 и коэффициент множественной корреляции (индекс корреляции) R . Чем ближе к 1 значение этих характеристик, тем выше качество модели.

Методичка эконометрика excel АГЗ — Стр 3

  1. Открываем меню инструмента «Анализ данных». Выбираем «Регрессия».
  2. Откроется меню для выбора входных значений и параметров вывода (где отобразить результат). В полях для исходных данных указываем диапазон описываемого параметра (У) и влияющего на него фактора (Х). Остальное можно и не заполнять.
  3. После нажатия ОК, программа отобразит расчеты на новом листе (можно выбрать интервал для отображения на текущем листе или назначить вывод в новую книгу).

Корреляция , как и любой другой статистический показатель, при правильном применении может быть полезной, но она также имеет и ограничения по использованию. Если диаграмма рассеяния показывает четко выраженную линейную зависимость или полное отсутствие взаимосвязи, то корреляция замечательно это отразит.

excel11

Процесс подбора эмпирической формулы P(x) для опытной зависимости F(x) называется аппроксимацией (сглаживанием). Для зависимостей с одним неизвестным в Excel используются графики, а для зависимостей со многими неизвестными – пары функций из группы Статистические ЛИНЕЙН и ТЕНДЕНЦИЯ, ЛГРФПРИБЛ и РОСТ.

В настоящем разделе рассматривается аппроксимация экспериментальных данных с помощью графиков Excel: на основе данных стоится график, к нему подбирается линия тренда, т.е. аппроксимирующая функция, которая с максимальной степенью близости приближается к опытной зависимости. Excel предоставляет 5 видов аппроксимирующих функций:

Линейная – y=cx+b. Это простейшая функция, отражающая рост и убывание данных с постоянной скоростью.

Полиномиальная – y=c0+c1x+c2x 2 +…+c6x 6 . Функция описывает попеременно возрастающие и убывающие данные. Полином 2-ой степени может иметь один экстремум (min или max), 3-ей степени – до 2-х экстремумов, 4-ой степени – до 3-х и т.д.

Логарифмическая – y=clnx+b. Эта функция описывает быстро возрастающие (убывающие) данные, которые затем стабилизируются.

Степенная – y=cx b , (х>0 и y>0). Функция отражает данные с постоянно увеличивающейся (убывающей) скоростью роста.

Экспоненциальная – y=ce bx , (e – основание натурального логарифма). Функция описывает быстро растущие (убывающие) данные, которые затем стабилизируются.

Степень близости подбираемой функции оценивается коэффициентом детерминации R 2 . Если нет других теоретических соображений, то выбирают функцию с коэффициентом R 2 , стремящимся к 1. Отметим, что подбор формул с использованием линии тренда позволяет установить как вид эмпирической формулы, так и определить численные значения неизвестных параметров.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Для всех 5 видов функций используется аппроксимация данных по методу наименьших квадратов. Подробнее о формулах расчета линии тренда и коэффициента детерминации смотрите в справке по F1, введя поиск слов «линия тренда».

В качестве примера рассмотрим зависимость продаж от рекламы, заданную следующими статистическими данными по некоторой фирме:

Необходимо построить функцию, наилучшим образом отражающую эту зависимость. Кроме того, необходимо оценить продажи для рекламных вложений в 6 тыс. руб.

Приступим к решению: в первую очередь введите эти данные в Excel и постройте график, как на рис. 2.48. Как видно, график построен на основании диапазона B2:J2. Далее, щелкнув правой кнопкой мыши по графику, добавьте линию тренда, как показано на рис. 2.48.

В открывшемся окне настройки (рис. 2.49), в закладке Тип выберите для аппроксимации логарифмическую линию тренда (по виду графика). В закладке Параметры установите флажки, отображающие на графике уравнение и коэффициент детерминации.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Как Сделать Коэффициент Детерминации в Excel • Базовые понятияКак Сделать Коэффициент Детерминации в Excel • Базовые понятия

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

После установки прогноза Вы увидите изменение кривой графика на 10 периодов наблюдения вперед, как на рис. 2.51. Он с большой долей вероятности отражает дальнейшее увеличение продаж с увеличением рекламных вложений.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Теперь вернитесь к состоянию рис. 2.50, нажав кнопку Отменить на Панели инструментов. Попробуйте изменить формат линии тренда – установите полиномиальную линию тренда полиномом 2-ой степени – получите рис. 2.52.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Опять вернитесь к состоянию рис. 2.50, нажав кнопку Отменить. Для вычисления продаж при рекламе в 6 тыс. руб. запишите в ячейку К2 формулу =23,796*LN(K1)+0,5961: должно получиться 43,2 тыс. штук.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Обратите внимание, что на рис. 2.50 ось Х подписана номерами периодов наблюдения, а на рис. 2.52 — значениями в точках наблюдения. Для нанесения значений на ось Х щелкните правой кнопкой мыши по графику и в выпавшем меню выберите пункт Исходные данные:

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

В открывшемся одноименном окне, в закладке Ряд, в поле Подписи оси Х, укажите диапазон ячеек, где записаны значения Х (здесь $B$1:$K$1).

Постройте функцию, наилучшим образом отражающую зависимость и спрогнозируйте значения для следующего периода наблюдения со значением 5, основываясь на следующих данных:

Концентрация ядовитого вещества в водоеме изменялась во времени согласно таблице:

Определите вид зависимости концентрации от времени и расчетную концентрацию в момент выброса.

В настоящем разделе рассматривается аппроксимация экспериментальных данных с помощью функций ЛИНЕЙН, ТЕНДЕНЦИЯ, ЛГРФПРИБЛ и РОСТ. Функции ЛИНЕЙН и ТЕНДЕНЦИЯ применяют для восстановления линейных зависимостей вида y=b+a1x1+a2x2+…+anxn, а функции ЛГРФПРИБЛ и РОСТ — для нелинейных (показательных) зависимостей вида y=ba1 X 1 a2 X 2 …an Xn .

Функции ЛИНЕЙН и ЛГРФПРИБЛ возвращают массив с т.н. регрессионной статистикой, в котором содержатся вычисленные значения параметров (b,a1,a2,…an), коэффициент детерминации R 2 и другие данные, характеризующие аппроксимирующую функцию. Формат функций ЛИНЕЙН, ЛГРФПРИБЛ и их применение поясним на примере.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Последовательность действий для решения задачи следующая:

Заведите приведенную таблицу в Excel, в ячейки A1:D14.

Выделите диапазон ячеек B17:E21 (рис. 2.54) для сохранения результатов вычислений функции ЛИНЕЙН – массива регрессионной статистики.

Вызовите мастер функций, выберите статистическую функцию ЛИНЕЙН и заполните параметры функции как на рис. 2.53. Параметр Изв_знач_y содержит диапазон D2:D14, т.е. известные значения y. Параметр Изв_знач_х содержит диапазон A2:C14, т.е. известные значения х. Параметр Стат=1, поскольку мы хотим получить дополнительную статистику.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

После нажатия ОК встаньте на строку формул и нажмите Ctrl+Shift+Enter. В результате должен получиться массив значений, показанный на рис. 2.54. Интересующие нас коэффициенты выделены на рисунке (подробнее см. справку F1). Коэффициент детерминации R 2 =0.9725 вполне удовлетворителен. Таким образом, искомая формула имеет вид:

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

После подбора формулы осталось вычислить стоимость при х1=42, х2=11, х3=5. В любую ячейку запишите выражение =1,36*42+0,1*11–0,21*5–19,27. В результате получится y=37.9 тыс. $.

Использование функции ТЕНДЕНЦИЯ покажем на этом же примере для расчета стоимостей различных вариантов квартир, как показано на рис. 2.55.

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Как Сделать Коэффициент Детерминации в Excel • Базовые понятия

Следующий пример. Подобрать формулу для вычисления процента увеличения оборота при различных затратах на рекламу. Экспериментально известны проценты увеличения оборота при затратах в 5, 10, 15, 20 тыс.$ в 3-х масс-медиа — на телевидении, радио и в прессе:

Построение уравнений регрессии с помощью линий тренда в MS Excel при хронометражных наблюдениях
В Google Sheets выбираем Редактор диаграмм -> Дополнительные и ставим галочку возле Линии тренда. В настройках выбираем ЯрлыкУравнение и Показать R^2.
специалист
Мнение эксперта
Витальева Анжела, консультант по работе с офисными программами
Со всеми вопросами обращайтесь ко мне!
Задать вопрос эксперту
Проблема неодинаковой вариации состоит в том, что места с высокой вариацией не только предоставляют наименее точную информацию, но и оказывают наибольшее влияние при расчете статистических показателей. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!
Опять вернитесь к состоянию рис. 2.50, нажав кнопку Отменить. Для вычисления продаж при рекламе в 6 тыс. руб. запишите в ячейку К2 формулу =23,796*LN(K1)+0,5961: должно получиться 43,2 тыс. штук.

Как сделать корреляцию в экселе — Агрегатор знаний

Приведенная выше формула расчета коэффициента Пирсона, показывает насколько трудоемок этот процесс если выполнять его вручную.Использование возможностей Excell ускоряет процесс нахождения коэффициента в разы.

методичка эконометрика excel АГЗ

Х 1 , …, Х k – q и найдем для нее сумму квадратов остатков ESS кор . 3. Вычислим F -статистику:

4. Если F набл > F табл (α, ν 1 = q , ν 2 = n – k – 1), то гипотеза отвергается (выбираем «длинную» регрессию), в противном случае – «короткую» регрессию.

На основании данных примера сравним две модели – «длинную» (с фак-

торами X 2 , X 4 , X 5 ) и «короткую» (с факторами X 2 , X 5 ).

1. Построим «длинную» регрессию по всем факторам X 2 , X 4 , X 5 и найдем для нее сумму квадратов остатков ESS длин .

2. Построим «короткую» регрессию по первым факторам X 2 , X 5 и найдем для нее сумму квадратов остатков ESS кор .

Выбор факторных признаков для построения регрессионной модели методом исключения

Для проведения регрессионного анализа используем инструмент Регрес-

На первом шаге строится модель регрессии по всем факторам:

В скобках указаны значения стандартных ошибок коэффициентов регрес-

Фрагмент протокола регрессионного анализа приведен в табл. 4.

В данном случае коэффициенты уравнения регрессии при Х 1 , Х 3 , Х 4 незначимы при 5%-ном уровне значимости. После построения уравнения регрессии и оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент при котором незначим и имеет наименьший по абсолютной величине коэффициент t , а именно Х 3 .

После этого получают новое уравнение множественной регрессии y ˆ i = − 2914.33 − 12.57 х 1 + 7.13 x 2 + 7.93 x 4 + 29.15 x 5

и снова производят оценку значимости всех оставшихся коэффициентов регрессии (табл. 5).

Так как среди них есть незначимые ( Х 1 и Х 4 ), то исключают фактор с наименьшим значением t -критерия – Х 4 . В табл. 6 представлены результаты, полученные после исключения фактора Х 4 . На следующем шаге исключаем незначимый фактор Х 1 .

Процесс исключения факторов останавливается на том шаге, при котором все регрессионные коэффициенты значимы (табл. 7).

Получено уравнение регрессии, все коэффициенты которого значимы не только при 5%-ном уровне значимости, но и при 1%-ном уровне значимости:

2. Оценка параметров модели. Экономическая интерпретация коэффициентов регрессии

В результате применения различных подходов к выбору факторов пришли к выводу о необходимости включения в модель двух факторов – Затраты на рекламу и Индекс потребительских расходов .

Выполняя матричные вычисления по формуле A = ( X ′ X ) − 1 X ′ Y , естественно, получим такое же уравнение регрессии, как и при использовании инструмента Регрессия в Анализе данных (рис. 2). Уравнение зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:

Коэффициент регрессии α j показывает, на какую величину в среднем изменится результативный признак Y , если переменную x j увеличить на единицу измерения, то есть α j является нормативным коэффициентом.

В нашей задаче величина, равная 9,57 (коэффициент при х 2 ), показывает, что при увеличении затрат на рекламу на 1000 руб. объем реализации увеличится на 9,57 тыс. руб., а если на 1% увеличится индекс потребительских расходов, то объем реализации увеличится на 15,75 тыс. руб.

Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого наблюдения, или из последней таблицы регрессионного анализа Вывод остатка (столбец Предска-

Для оценки качества модели множественной регрессии вычисляют коэффициент детерминации R 2 и коэффициент множественной корреляции (индекс корреляции) R . Чем ближе к 1 значение этих характеристик, тем выше качество модели.

Значение коэффициентов детерминации и множественной корреляции можно найти в таблице Регрессионная статистика (см. рис. 2) или вычислить по формулам:

Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 86% вариации зависимой переменной учтено в модели и обусловлено влиянием факторов, включенных в модель;

Коэффициент множественной корреляции показывает высокую тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами.

Точность модели оценим с помощью средней ошибки аппроксимации:

Модель неточная. Фактические значения объема реализации отличаются от расчетных в среднем на 10,65%.

4. Оценка значимости уравнения регрессии и его коэффициентов

Проверку значимости уравнения регрессии произведем на основе F —

Значение F -критерия Фишера можно найти в таблице Дисперсионный анализ протокола Еxcel (см. рис. 2).

Табличное значение F -критерия при доверительной вероятности α = 0,95 и числе степеней свободы, равном ν 1 = k = 2 и ν 2 = n – k – 1 = 16 – 2 – 1 = 13 составляет 3,81.

Поскольку F расч > F табл , уравнение регрессии следует признать значимым, то есть его можно использовать для анализа и прогнозирования.

Оценку значимости коэффициентов полученной модели, используя ре-

зультаты отчета Excel, можно осуществить тремя способами.

Коэффициент уравнения регрессии признается значимым в том случае, ес-

1) наблюдаемое значение t -статистики Стьюдента для этого коэффициента больше, чем критическое (табличное) значение статистики Стьюдента (для заданного уровня значимости, например, α = 0,05 и числа степеней свободы df

= n – k – 1, где n – число наблюдений , а k – число факторов в модели);

2) Р -значение t-статистики Стьюдента для этого коэффициента меньше, чем уровень значимости, например, α = 0,05;

3) доверительный интервал для этого коэффициента, вычисленный с некоторой доверительной вероятностью (например, 95%), не содержит ноль внутри себя, то есть если нижняя 95% и верхняя 95% границы доверительного интервала имеют одинаковые знаки.

Значимость коэффициентов a ˆ 1 и a ˆ 2 проверим по второму и третьему спо-

Следовательно, коэффициенты a ˆ 1 и a ˆ 2 значимы при 1%-ном уровне, а тем более при 5%-ном уровне значимости.

Нижние и верхние 95% границы доверительного интервала имеют одинаковые знаки (см. рис. 2), следовательно, коэффициенты a ˆ 1 и a ˆ 2 значимы.

5. Определение объясняющей переменной, от которой может зависеть дисперсия случайных возмущений. Проверка выполнения условия гомоскедастичности остатков по тесту Голдфельда–Квандта

Для двухфакторной модели нашего примера графики остатков относительно каждого из двух факторов имеют вид, представленный на рис. 3 (эти графики легко получить в отчете, который формируется в результате использования инструмента Регрессия в пакете Анализ данных ).

Рис. 3. Графики остатков по каждому из факторов двухфакторной модели

Из графиков на рис. 3 видно, что дисперсия остатков более всего нарушена по отношению к фактору Затраты на рекламу .

специалист
Мнение эксперта
Витальева Анжела, консультант по работе с офисными программами
Со всеми вопросами обращайтесь ко мне!
Задать вопрос эксперту
Если коэффициент показывает среднюю или сильную взаимосвязь от 0,5 до 0,99 , следует помнить, что это лишь статистическая взаимосвязь, которая вовсе не гарантирует влияние одного параметра на другой. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!

Рассчитать корреляцию можно вручную, выполняя несложные арифметические действия. Однако процесс вычисления оказывается очень трудоемким, если набор данных велик. Особенность метода в том, что он требует сбора большого количества исходных данных, чтобы наиболее точно отобразить, есть ли связь между признаками.

Определение коэффициентов модели

R-квадрат – коэффициент детерминации. В нашем примере – 0,755, или 75,5%. Это означает, что расчетные параметры модели на 75,5% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере – «неплохо».

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: