No Image

Среднеквадратичное отклонение формула и расчет

СОДЕРЖАНИЕ
0 просмотров
22 января 2020

Среднее квадратичное отклонение — это квадратный корень из среднего арифметического всех квадратов разностей между данными величинами и их средним арифметическим. Среднее квадратичное отклонение принято обозначать греческой буквой сигма σ:

Вычислить, найти среднее квадратичное отклонение по формулам (1 и 2).

Среднее квадратичное отклонение, примечания

Если число измерений примерно равно 10 , то истинное значение величины может отличаться от среднего арифметического не более чем на величину среднего квадратичного отклонения σ. Отклонения, большие, чем σ, возможны лишь в исключительных случаях, число которых составляет около 0.5 % всех возможных случаев.

Если число измерений значительно больше десяти, то максимальное практически возможное отклонение истинной величины от среднего арифметического будет меньше чем σ. Отклонение не превысит значения:

Состояние отпатрулирована

Среднеквадрати́ческое отклоне́ние (среднее квадрати́ческое отклоне́ние, среднеквадрати́чное отклоне́ние, квадрати́чное отклоне́ние, станда́ртное отклоне́ние, станда́ртный разбро́с) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания. Обычно указанные термины означают квадратный корень из дисперсии случайной величины, но иногда могут означать тот или иной вариант оценки этого значения.

В литературе обычно обозначают греческой буквой σ <displaystyle sigma > (сигма).

Содержание

Основные сведения [ править | править код ]

Среднеквадратическое отклонение определяется как квадратный корень из дисперсии случайной величины: σ = D [ X ] <displaystyle sigma =<sqrt >> .

Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

На практике, когда вместо точного распределения случайной величины в распоряжении имеется лишь выборка, стандартное отклонение, как и математическое ожидание, оценивают (выборочная дисперсия), и делать это можно разными способами. Термины «стандартное отклонение» и «среднеквадратическое отклонение» обычно применяют к квадратному корню из дисперсии случайной величины (определённому через её истинное распределение), но иногда и к различным вариантам оценки этой величины на основании выборки.

В частности, если x i <displaystyle x_> i -й элемент выборки, n <displaystyle n> — объём выборки, x ¯ <displaystyle <ar >> — среднее арифметическое выборки (выборочное среднее — оценка математического ожидания величины):

x ¯ = 1 n ∑ i = 1 n x i = 1 n ( x 1 + … + x n ) , <displaystyle <ar >=<frac <1>>sum _^x_=<frac <1>>(x_<1>+ldots +x_),>

то два основных способа оценки стандартного отклонения записываются нижеследующим образом.

Оценка стандартного отклонения на основании смещённой оценки дисперсии (иногда называемой просто выборочной дисперсией [1] ):

S = 1 n ∑ i = 1 n ( x i − x ¯ ) 2 . <displaystyle S=<sqrt <<frac <1>>sum _^left(x_-<ar >
ight)^<2>>>.>

Это в буквальном смысле среднее квадратическое разностей измеренных значений и среднего.

Оценка стандартного отклонения на основании несмещённой оценки дисперсии (подправленной выборочной дисперсии [1] , в ГОСТ Р 8.736-2011 — «среднее квадратическое отклонение»):

S 0 = n n − 1 S 2 = 1 n − 1 ∑ i = 1 n ( x i − x ¯ ) 2 . <displaystyle S_<0>=<sqrt <<frac >S^<2>>>=<sqrt <<frac <1>>sum _^left(x_-<ar >
ight)^<2>>>.>

Само по себе, однако, S 0 <displaystyle S_<0>> не является несмещённой оценкой квадратного корня из дисперсии, то есть извлечение квадратного корня «портит» несмещённость.

Кроме того, среднеквадратическим отклонением называют математическое ожидание квадрата разности истинного значения случайной величины и её оценки для некоторого метода оценки [2] . Если оценка несмещённая (выборочное среднее — как раз несмещённая оценка для случайной величины), то эта величина равна дисперсии этой оценки.

Правило трёх сигм [ править | править код ]

Правило трёх сигм ( 3 σ <displaystyle 3sigma > ) гласит: вероятность того, что любая случайная величина отклонится от своего среднего значения менее чем на 3 σ <displaystyle 3sigma > — P ( | ξ − E ξ ∣ 3 σ ) ≥ 8 9 <displaystyle P(|xi -Exi mid .

Практически все значения нормально распределённой случайной величины лежат в интервале ( μ − 3 σ ; μ + 3 σ ) <displaystyle left(mu -3sigma ;mu +3sigma
ight)> , где μ = E ξ <displaystyle mu =Exi > — математическое ожидание случайной величины. Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале.

Интерпретация величины среднеквадратического отклонения [ править | править код ]

Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения.

Например, у нас есть три числовых множества: <0, 0, 14, 14>, <0, 6, 8, 14>и <6, 6, 8, 8>. У всех трёх множеств средние значения равны 7, а среднеквадратические отклонения, соответственно, равны 7, 5 и 1. У последнего множества среднеквадратическое отклонение маленькое, так как значения в множестве сгруппированы вокруг среднего значения; у первого множества самое большое значение среднеквадратического отклонения — значения внутри множества сильно расходятся со средним значением.

В общем смысле среднеквадратическое отклонение можно считать мерой неопределённости. К примеру, в физике среднеквадратическое отклонение используется для определения погрешности серии последовательных измерений какой-либо величины. Это значение очень важно для определения правдоподобности изучаемого явления в сравнении с предсказанным теорией значением: если среднее значение измерений сильно отличается от предсказанных теорией значений (большое значение среднеквадратического отклонения), то полученные значения или метод их получения следует перепроверить.

Читайте также:  Способы форматирования жесткого диска

Практическое применение [ править | править код ]

На практике среднеквадратическое отклонение позволяет оценить, насколько значения из множества могут отличаться от среднего значения.

Экономика и финансы [ править | править код ]

Среднее квадратическое отклонение доходности портфеля σ = D [ X ] <displaystyle sigma =<sqrt >> отождествляется с риском портфеля.

В техническом анализе среднеквадратическое отклонение используется для построения линий Боллинджера, расчёта волатильности.

Климат [ править | править код ]

Предположим, существуют два города с одинаковой средней максимальной дневной температурой, но один расположен на побережье, а другой на равнине. Известно, что в городах, расположенных на побережье, множество различных максимальных дневных температур меньше, чем у городов, расположенных внутри континента. Поэтому среднеквадратическое отклонение максимальных дневных температур у прибрежного города будет меньше, чем у второго города, несмотря на то, что среднее значение этой величины у них одинаковое, что на практике означает, что вероятность того, что максимальная температура воздуха каждого конкретного дня в году будет сильнее отличаться от среднего значения, выше у города, расположенного внутри континента.

Спорт [ править | править код ]

Предположим, что есть несколько футбольных команд, которые оцениваются по некоторому набору параметров, например, количеству забитых и пропущенных голов, голевых моментов и т. п. Наиболее вероятно, что лучшая в этой группе команда будет иметь лучшие значения по большему количеству параметров. Чем меньше у команды среднеквадратическое отклонение по каждому из представленных параметров, тем предсказуемее является результат команды, такие команды являются сбалансированными. С другой стороны, у команды с большим значением среднеквадратического отклонения сложно предсказать результат, что в свою очередь объясняется дисбалансом, например, сильной защитой, но слабым нападением.

Использование среднеквадратического отклонения параметров команды позволяет в той или иной мере предсказать результат матча двух команд, оценивая сильные и слабые стороны команд, а значит, и выбираемых способов борьбы.

Пример вычисления стандартного отклонения оценок учеников [ править | править код ]

Предположим, что интересующая нас группа (генеральная совокупность) это класс из восьми учеников, которым выставляются оценки по 10-бальной системе. Так как мы оцениваем всю группу, а не её выборку, можно использовать стандартное отклонение на основании смещённой оценки дисперсии. Для этого берём квадратный корень из среднего арифметического квадратов отклонений величин от их среднего значения.

Пусть оценки учеников класса следующие:

2 , 4 , 4 , 4 , 5 , 5 , 7 , 9. <displaystyle 2, 4, 4, 4, 5, 5, 7, 9.>

Тогда средняя оценка равна:

μ = 2 + 4 + 4 + 4 + 5 + 5 + 7 + 9 8 = 5 <displaystyle mu =<frac <2+4+4+4+5+5+7+9><8>>=5>

Вычислим квадраты отклонений оценок учеников от их средней оценки:

( 2 − 5 ) 2 = ( − 3 ) 2 = 9 ( 5 − 5 ) 2 = 0 2 = 0 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 5 − 5 ) 2 = 0 2 = 0 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 7 − 5 ) 2 = 2 2 = 4 ( 4 − 5 ) 2 = ( − 1 ) 2 = 1 ( 9 − 5 ) 2 = 4 2 = 16 <displaystyle <egin(2-5)^<2>=(-3)^<2>=9&&(5-5)^<2>=0^<2>=0\(4-5)^<2>=(-1)^<2>=1&&(5-5)^<2>=0^<2>=0\(4-5)^<2>=(-1)^<2>=1&&(7-5)^<2>=2^<2>=4\(4-5)^<2>=(-1)^<2>=1&&(9-5)^<2>=4^<2>=16\end>>

Среднее арифметическое этих значений называется дисперсией:

σ 2 = 9 + 1 + 1 + 1 + 0 + 0 + 4 + 16 8 = 4 <displaystyle sigma ^<2>=<frac <9+1+1+1+0+0+4+16><8>>=4>

Стандартное отклонение равно квадратному корню дисперсии:

σ = 4 = 2 <displaystyle sigma =<sqrt <4>>=2>

Эта формула справедлива только если эти восемь значений и являются генеральной совокупностью. Если бы эти данные были случайной выборкой из какой-то большой совокупности (например, оценки восьми случайно выбранных учеников большого города), то в знаменателе формулы для вычисления дисперсии вместо n = 8 нужно было бы поставить n − 1 = 7:

σ 2 = 9 + 1 + 1 + 1 + 0 + 0 + 4 + 16 7 ≈ 4 , 57 <displaystyle sigma ^<2>=<frac <9+1+1+1+0+0+4+16><7>>approx 4,57>

и стандартное отклонение равнялось бы:

σ = 4 , 57 ≈ 2 , 14 <displaystyle sigma =<sqrt <4,57>>approx 2,14>

Этот результат называется стандартным отклонением на основании несмещённой оценки дисперсии. Деление на n − 1 вместо n даёт неискажённую оценку дисперсии для больших генеральных совокупностей.

Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение ( ) равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической:

Среднее квадратическое отклонение простое:

Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:

Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение:

Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.

Дисперсия, ее виды, среднеквадратическое отклонение.

Дисперсия случайной величины — мера разброса данной случайной величины, т. е. её отклонения отматематического ожидания. В статистике часто употребляется обозначение или . Квадратный корень из дисперсии называется среднеквадратичным отклонением, стандартным отклонением или стандартным разбросом.

Читайте также:  Телефон теле2 не включается в чем причина

Общая дисперсия (σ 2 ) измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Вместе с тем, благодаря методу группировок можно выделить и измерить вариацию, обусловленную группировочным признаком, и вариацию, возникающую под влиянием неучтенных факторов.

Межгрупповая дисперсия (σ 2 м.гр) характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием признака – фактора, положенного в основание группировки.

Среднеквадратическое отклонение (синонимы: среднее квадратическое отклонение, среднеквадратичное отклонение, квадратичное отклонение; близкие термины: стандартное отклонение, стандартный разброс) — в теории вероятностей и статистике наиболее распространённый показатель рассеивания значений случайной величиныотносительно её математического ожидания. При ограниченных массивах выборок значений вместо математического ожидания используется среднее арифметическоесовокупности выборок.

Среднеквадратическое отклонение измеряется в единицах измерения самой случайной величины и используется при расчёте стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами. Определяется какквадратный корень из дисперсии случайной величины.

Среднеквадратическое отклонение:

Стандартное отклонение (оценка среднеквадратического отклонения случайной величины x относительно её математического ожидания на основе несмещённой оценки её дисперсии):

где — дисперсия; i-й элемент выборки; — объём выборки; — среднее арифметическое выборки:

Следует отметить, что обе оценки являются смещёнными. В общем случае несмещённую оценку построить невозможно. Однако оценка на основе оценки несмещённой дисперсии является состоятельной.

Сущность, область применения и порядок определения моды и медианы.

Кроме степенных средних в статистике для относительной характеристики величины варьирующего признака и внутреннего строения рядов распределения пользуются структурными средними, которые представлены ,в основном, модой и медианой.

Мода — это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем — значение модальной величины признака по формуле:

где:

— значение моды

— нижняя граница модального интервала

— величина интервала

— частота модального интервала

— частота интервала, предшествующего модальному

— частота интервала, следующего за модальным

Медиана — это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.

Для определения медианы в дискретном ряду при наличии частот сначала вычисляют полусумму частот , а затем определяют, какое значение варианта приходится на нее. (Если отсортированный ряд содержит нечетное число признаков, то номер медианы вычисляют по формуле:

Ме = (n(число признаков в совокупности) + 1)/2,

в случае четного числа признаков медиана будет равна средней из двух признаков находящихся в середине ряда).

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем — значение медианы по формуле:

где:

— искомая медиана

— нижняя граница интервала, который содержит медиану

— величина интервала

— сумма частот или число членов ряда

– сумма накопленных частот интервалов, предшествующих медианному

— частота медианного интервала

Пример. Найти моду и медиану.

Возрастные группы Число студентов Сумма накопленных частот ΣS
До 20 лет
20 — 25
25 — 30
30 — 35
35 — 40
40 — 45
45 лет и более
Итого

Решение:
В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).

Рассчитаем величину моды:

Это значит что модальный возраст студентов равен 27 годам.

Вычислим медиану. Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σfi/2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:

Это значит что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.

Кроме моды и медианы могут быть использованы такие показатели, как квартили, делящие ранжированный ряд на 4 равные части, децили – 10 частей и перцентили — на 100 частей.

Понятие выборочного наблюдения и область его применения.

Выборочное наблюдение применяется, когда применение сплошного наблюдения физически невозможно из-за большого массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением, например, дегустация, испытание кирпичей на прочность и т.п.

Читайте также:  Универсальное зарядное устройство для литий ионных аккумуляторов

Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив – генеральную совокупность (ГС). При этом числоединиц ввыборке обозначают n, а во всей ГС – N. Отношение n/N называется относительныйразмер или долявыборки.

Качество результатов выборочного наблюдения зависит от репрезентативности выборки, то есть от того, насколько она представительна в ГС. Для обеспечения репрезентативности выборки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.

Существует 4 способа случайного отбора в выборку:

  1. Собственно случайный отбор или «метод лото», когда статистическим величинам присваиваются порядковые номера, заносимые на определенные предметы (например, бочонки), которые затем перемешиваются в некоторой емкости (например, в мешке) и выбираются наугад. На практике этот способ осуществляют с помощью генератора случайных чисел или математических таблиц случайных чисел.
  2. Механический отбор, согласно которому отбирается каждая (N/n)-я величина генеральной совокупности. Например, если она содержит 100 000 величин, а требуется выбрать 1 000, то в выборку попадет каждая 100 000 / 1000 = 100-я величина. Причем, если они не ранжированы, то первая выбирается наугад из первой сотни, а номера других будут на сотню больше. Например, если первой оказалась единица № 19, то следующей должна быть № 119, затем № 219, затем № 319 и т.д. Если единицы генеральной совокупности ранжированы, то первой выбирается № 50, затем № 150, затем № 250 и так далее.
  3. Отбор величин из неоднородного массива данных ведется стратифицированным (расслоенным) способом, когда генеральная совокупность предварительно разбивается на однородные группы, к которым применяется случайный или механический отбор.
  4. Особый способ составления выборки представляет собой серийный отбор, при котором случайно или механически выбирают не отдельные величины, а их серии (последовательности с какого-то номера по какой-то подряд), внутри которых ведут сплошное наблюдение.

Качество выборочных наблюдений зависит и от типа выборки: повторная или бесповторная.

При повторном отборе попавшие в выборку статистические величины или их серии после использования возвращаются в генеральную совокупность, имея шанс попасть в новую выборку. При этом у всех величин генеральной совокупности одинаковая вероятность включения в выборку.

Бесповторный отбор означает, что попавшие в выборку статистические величины или их серии после использования не возвращаются в генеральную совокупность, а потому для остальных величин последней повышается вероятность попадания в следующую выборку.

Бесповторный отбор дает более точные результаты, поэтому применяется чаще. Но есть ситуации, когда его применить нельзя (изучение пассажиропотоков, потребительского спроса и т.п.) и тогда ведется повторный отбор.

Предельная ошибка выборки наблюдения, средняя ошибка выборки, порядок их расчета.

Рассмотрим подробно перечисленные выше способы формирования выборочной совокупности и возникающие при этом ошибки репрезентативности.
Собственно-случайная выборка основывается на отборе единиц из генеральной совокупности наугад без каких-либо элементов системности. Технически собственно-случайный отбор проводят методом жеребьевки (например, розыгрыши лотерей) или по таблице случайных чисел.

Собственно-случайный отбор «в чистом виде» в практике выборочного наблюдения применяется редко, но он является исходным среди других видов отбора, в нем реализуются основные принципы выборочного наблюдения. Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.

Ошибка выборочного наблюдения – это разность между величиной параметра в генеральной совокупности, и его величиной, вычисленной по результатам выборочного наблюдения. Для средней количественного признака ошибка выборки определяется


Показатель называется предельной ошибкой выборки.
Выборочная средняя является случайной величиной, которая может принимать различные значения в зависимости от того, какие единицы попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки , которая зависит от:

– объема выборки: чем больше численность, тем меньше величина средней ошибки;

– степени изменения изучаемого признака: чем меньше вариация признака, а, следовательно, и дисперсия, тем меньше средняя ошибка выборки.

При случайном повторном отборе средняя ошибка рассчитывается:
.
Практически генеральная дисперсия точно не известна, но в теории вероятности доказано, что
.
Так как величина при достаточно больших n близка к 1, можно считать, что . Тогда средняя ошибка выборки может быть рассчитана:
.
Но в случаях малой выборки (при n 0 или равномерное падение при b1 1 или замедляющееся падение при b1

Гипербола Замедляющееся падение при b1 > 0 или замедляющийся рост при b1

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: На стипендию можно купить что-нибудь, но не больше. 9136 – | 7298 – или читать все.

Комментировать
0 просмотров
Комментариев нет, будьте первым кто его оставит

Это интересно
Adblock detector