Как рассчитать доверительный интервал в Excel
Получив несколько цифр, может потребоваться предсказать то, какое среднее значение будет у них в дальнейшем и какого разброса нужно ожидать. Это можно пояснить на следующем примере.
На заводе выпускаются детали одного типа. У них измеряется определённая характеристика. В каждом случае она может немного отличаться. В этой ситуации важно понять, находится ли она в пределах нормы или детали были сделаны с нарушением технологии.
В таком случае для анализа доступны все сделанные измерения. На их основании нужно сделать вывод о том, какова вероятность того, что их отклонение от нормативной величины не слишком велико.
Для того чтобы найти ответ, нужно прибегнуть к точным формулировкам:
Если нормативная характеристика попадает в указанный промежуток (его называют доверительным интервалом с заданной вероятностью), то тестируемые изделия были сделаны качественно.
Здесь имеется несколько важных моментов, на которые надо обратить внимание:
- Все вычисления делаются в предположении, что исследуемая случайная величина имеет определённую функцию распределения. Часто её точное выяснение является сложной задачей. Однако в большинстве важных ситуаций речь идёт о нормальном распределении. Поэтому предполагается, что его надо применять в большинстве случаев.
- Для проведения статистических вычислений потребуется указать стандартное отклонение. В некоторых случаях его узнают, предварительно проводя дополнительные измерения. В других — его можно менее надёжно вычислить с помощью имеющихся значений.
На основании изложенных принципов можно вычислить доверительный промежуток с заданной надёжностью.
Получение случайных чисел в табличном процессоре Excel — Мегаобучалка
- Первый называется «альфа». Здесь нужно указать вероятность, с какой случайная величина должна попадать внутрь искомого интервала. Обычно в условиях задачи её указывают в процентах. Пусть речь идёт о 95%. Нужный параметр получают по формуле (100 — Процент)/100, где Процент =95. В рассматриваемом случае альфа=0,05.
- Здесь пишут стандартное отклонение. К моменту проведения вычислений оно должно быть известно. Это число является вторым параметром в формуле.
- На третьем месте нужно указать количество полученных результатов. Эту цифру можно ввести руками, а можно для этого использовать СЧЁТ(), которая считает количество ячеек в выбранной области.
Средство анализа «Двухвыборочный F-тест для дисперсии» надстройки «Пакет анализа» MS Excel служит для проверки гипотезы о равенстве дисперсий двух выборок. Для проверки необходимо заполнить диалоговое окно, приведенное на рис.4.6, назначение всех полей ввода очевидно.
Средство анализа «Двухвыборочный F-тест для дисперсии» надстройки «Пакет анализа» MS Excel
Средство анализа «Двухвыборочный F-тест для дисперсии» надстройки «Пакет анализа» MS Excel служит для проверки гипотезы о равенстве дисперсий двух выборок. Для проверки необходимо заполнить диалоговое окно, приведенное на рис.4.6, назначение всех полей ввода очевидно.
Рис. 4.6 Диалоговое окно средства анализа «Двухвыборочный F-тест для дисперсии» надстройки «Пакет анализа» MS Excel
Сравните полученные результаты с результатами, полученными вручную.
Критерий используется для проверки гипотезы о равенстве средних значений двух выборок, взятых из нормально распределенных совокупностей.
Значение вычисляют по формуле:
, | (4.8) |
где — средние арифметические выборок и ;
S — стандартная ошибка разности средних значений.
Из таблиц для заданного уровня значимости α и числа степеней свободы определяют tкрит (критическое значение).
Если , то гипотеза H0 принимается, в противном случае принимается альтернативная гипотеза.
Стандартная ошибка разности средних значений S вычисляется различными способами в зависимости от поставленной задачи:
Требуется сравнить средние значения двух независимых выборок. Здесь возможны два варианта:
Рассмотрим первый вариант (дисперсии выборок равны). В этом случае значение S вычисляется по формуле
, | (4.10) |
гдеn1 и n2 — объемы первой и второй выборки; и — средние арифметические выборок.
В двух группах учащихся — экспериментальной и контрольной — применялись две различные методики обучения: экспериментальная и традиционная. После завершения обучения был проведен тест и получены следующие результаты по учебному предмету (тестовые баллы; см. табл. 4.4).
Первая группа (экспериментальная), N1=11 человек |
Вторая группа (контрольная), N2=9 человек |
Имеет ли экспериментальный метод обучения преимущество по сравнению с традиционным?
Общее количество членов выборки: n1=11, n2=9; средние значения: =13,636; =9,444. По формуле (4.10) находим стандартную ошибку разности средних значений:
Рис. 4.8. Проверка гипотезы о совпадении двух выборочных средних (фрагмент рабочего листа MS Excel в режиме отображения данных).
Вычисляем значение
Вычислим табличное значение с помощью встроенной функции СТЬЮДРАСПОБР(). Для этого определим число степеней свободы по формуле ,
и с учетом уровня значимости α =5% (или α=0,05) получим . Так как , гипотеза H0 отклоняется, принимаетсягипотеза H1 . Из этого следует вывод о преимуществе экспериментального обучения.
Рис.4.9а. Проверка гипотезы о совпадении двух выборочных средних
(начало) (фрагмент рабочего листа MS Excel в режиме отображения формул)
Рис.4.9.б. Проверка гипотезы о совпадении двух выборочных средних (окончание) (фрагмент рабочего листа Excel в режиме отображения формул)
Описательная статистика в excel 2010 как сделать
Аналитические методы позволяют получить характеристики системы как некоторые функции от параметров ее функционирования. Однако, аналитическому решению поддается лишь довольно ограниченный круг задач теории массового обслуживания.
, | (4.10) |