Атомная энергетика России Инженерная графика и машиностроительное черчение Математика Курс лекций и примеры решения задач Информатика Электротехника Физика курс лекций примеры решения задач
Аппарат дифференциальных уравнений в экономике Элементы линейного программирования

Математическая статистика

Полигон и гистограмма

Каждую пару значений (xi, ni) из распределения выборки можно трактовать как точку на координатной плоскости. Точно так же можно рассматривать и пары значений (хi, Wi) относительного распределения выборки. Ломаная, отрезки которой соединяют точки (xi, ni), называется полигоном частот. Ломаная, соединяющая на координатной плоскости точки (xi, Wi), называется полигоном относительных частот. На рис. 18.9 показан полигон относительных частот для распределения, приведенного в примере 2.

Для случая непрерывного признака Х удобно разбить интервал (xmin, xmax) его наблюдаемых значений на несколько частичных интервалов длиной h каждый и найти для каждого из этих интервалов сумму частот nj, попавших в него. Ступенчатая фигура, состоящая из прямоугольников с основаниями длиной h и высотами nj/h (плотность частоты), называется гистограммой частот. Геометрический смысл гистограммы: нетрудно видеть, что площадь ее равна сумме всех частот или объему выборки. На рис. 18.10 изображена гистограмма объема n = 100.

Аналогичным образом определяется и гистограмма относительных частот: в этом случае высоты прямоугольников, составляющих ступенчатую фигуру, определяются отношениями сумм относительных частот, попадающих в интервал (xmin + (j — 1)h, xmin + jh), к длине интервала h, т.е. величинами Wj/h. Нетрудно видеть, что площадь гистограммы относительных частот равна единице (сумме относительных частот выборки).

Статистические оценки параметров распределения

Значения количественного признака х1, х2, ..., хk в выборке можно рассматривать как независимые случайные величины. В таком случае нахождение статистической оценки неизвестного параметра теоретического распределения означает отыскание функции от наблюдаемых случайных величин, которая и даст нам приближенное значение искомого параметра. Укажем виды статистических оценок.

Несмещенной называется статистическая оценка , математическое ожидание которой равно оцениваемому параметру  при любой выборке:

Смещенной называется оценка, при которой условие (18.51) не выполнено. Эффективной называется оценка, которая имеет минимальную дисперсию при заданном объеме выборки п. Состоятельной называется статистическая оценка типа (18.50), которая при п >  стремится по вероятности к оцениваемому параметру.

Теперь укажем виды числовых характеристик оценок. Прежде всего, это средние. Генеральная средняя для изучаемого количественного признака Х по генеральной совокупности

и выборочная средняя

Если значения признака х1, x2, …, хk в выборке имеют соответственно частоты n1, n2, ..., nk, то последнюю формулу можно переписать в виде

Можно показать, что выборочная средняя (18.52) является несмещенной оценкой; это аналог математического ожидания случайной величины.

Введем в рассмотрение величины, характеризующие отклонение значений количественного признака Х от своего среднего значения. Это генеральная дисперсия:

и выборочная дисперсия:

Можно показать, что для вычисления этих характеристик справедливы более удобные формулы, аналогичные дисперсии случайной величины; так, формула (18.53) принимает вид

Генеральное среднее квадратическое отклонение определяется как

Аналогично вводится и выборочное среднее квадратическое отклонение

Пример 4. Выборка задана таблицей распределения

Найти выборочные характеристики: среднюю, дисперсию и среднее квадратическое отклонение.

Решение. По формуле (18.52) сначала находим в:

Затем по формулам (18.54) и (18.55) находим две другие искомые величины:

Виды дисперсий

Часто значения количественного признака Х совокупности разбиваются на определенное число групп. Каждую группу можно рассматривать как самостоятельную выборку, и для каждой группы можно определить групповую среднюю и дисперсию. Пусть r — число групп. Групповой дисперсией на зывается дисперсия значений признака в группе относительно групповой средней:

где ni — частота значения xi в группе, j — номер группы j — групповая средняя j-й группы, Nj = ni, — объем j-й группы.

Зная дисперсию каждой группы, можно определить их среднюю арифметическую. Внутригрупповой дисперсией называется средняя арифметическая дисперсий, где каждое слагаемое входит с весом объема группы:

В свою очередь, зная для всех групп средние j и общую среднюю , введем еще одно понятие. Межгрупповой дисперсией называется дисперсия групповых средних относительно общей средней:

где п = — объем всей совокупности.

Для общей дисперсии всей совокупности справедлива следующая теорема, которая приводится здесь без доказательства.

ТЕОРЕМА 6. Если совокупность состоит из нескольких групп, то общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий:

где слагаемые в правой части определяются соответственно формулами (18.57) и (18.58).

Поясним сказанное в этом пункте на примере.

Пример 5. Совокупность состоит из двух следующих групп:

Найти групповые, внутригрупповую, межгрупповую и общую дисперсии.

Решение. Объемы групп соответственно равны N1 = 10 и N2 = 5. Общий объем совокупности: п = 10 + 5 = 15. Найдем групповые средние:

Теперь находим групповые дисперсии по формуле (18.56):

Внутригрупповая дисперсия, согласно формуле (18.57), равна:

Теперь найдем межгрупповую дисперсию по формуле (18.58), для чего сначала определим общую среднюю:

Наконец, общая дисперсия, согласно формуле (18.59), равна:

Эмпирические моменты

Для вычисления сводных характеристик выборок используют эмпирические моменты, аналогичные соответствующим теоретическим моментам. Обычным эмпирическим моментом порядка s называется среднее значение s-x степеней разностей xi — С, где xi — наблюдаемая варианта, С — произвольная постоянная (ложный нуль — либо мода, либо любая варианта, расположенная примерно в середине вариационного ряда):

При C = 0 имеем начальные эмпирические моменты порядка s; в частности, в случае s = 1

Центральным эмпирическим моментом порядка s называется обычный момент (18.60) при С = в:

В частности,

Иными словами, выборочная дисперсия равна центральному эмпирическому моменту второго порядка. Центральные моменты выражаются через обычные по формулам, полностью аналогичным (18.19) и (18.20).

Пример. Найти асимптоты и построить график функции .

Прямая х = -2 является вертикальной асимптотой кривой.

Найдем наклонные асимптоты.

Итого, прямая у = х – 4 является наклонной асимптотой.

 

Замена переменных.

 Пусть задан интеграл , где f(x) – непрерывная функция на отрезке [a, b].

Введем новую переменную в соответствии с формулой x = j(t).

 Тогда если

1) j(a) = а, j(b) = b

2) j(t) и j¢(t) непрерывны на отрезке [a, b]

3) f(j(t)) определена на отрезке [a, b], то


Системы линейных алгебраических уравнений