Статистика - Среднее
Среднее - это тип среднего значения, которое описывает, где находится центр данных.
Среднее
Среднее значение обычно называют "средним".
Среднее значение - это сумма всех значений в данных, делённая на общее количество значений в данных.
Среднее значение рассчитывается для числовых переменных. Переменная - это что-то в данных, которое может варьироваться, например:
- Возраст
- Высота
- Доход
Примечание: Есть несколько типов средних значений. Самый распространенный тип среднего - это среднее арифметическое.
В этом учебнике под "средним" понимается среднее арифметическое.
Расчет среднего
Вы можете рассчитать среднее значение как для совокупности, так и для выборки.
Формулы одинаковы и используют разные символы для обозначения среднего по генеральной совокупности (\(\mu\)) и выборочного среднего (\(\bar{x}\)).
Расчёт среднего численного значения (\(\mu\)) выполняется по этой формуле:
\(\displaystyle \mu = \frac{\sum x_{i}}{n}\)
Расчёт среднего выборки (\(\bar{x}\)) выполняется по этой формуле:
\(\displaystyle \bar{x} = \frac{\sum x_{i}}{n}\)
Нижняя часть дроби (\(n\)) - это общее количество наблюдений.
\(\sum \) - это символ для сложения списка чисел.
\(x_{i}\) - это список значений в данных: \(x_{1}, x_{2}, x_{3}, \ldots \)
Верхняя часть дроби (\(\sum x_{i}\)) - это сумма \(x_{1}, x_{2}, x_{3}, \ldots \) сложенных вместе.
Итак, если в выборке есть 4 наблюдения со значениями: 4, 11, 7, 14, расчет будет:
\(\displaystyle \bar{x} = \frac{4 + 11 + 7 + 14}{4} = \frac{36}{4} = \underline{9} \)
Расчёт с программированием
Среднее значение можно легко вычислить с помощью многих языков программирования.
Использование программного обеспечения и программирования для расчета статистики более распространено для больших наборов данных, поскольку расчет вручную становится затруднительным.
Пример
В Python используйте метод mean()
библиотеки NumPy, чтобы найти среднее значение 4,11,7,14:
import numpy
values = [4,11,7,14]
x = numpy.mean(values)
print(x)
Попробуйте сами »
Пример
Используйте функцию R mean()
чтобы найти среднее значение 4,11,7,14:
values <- c(4,7,11,14)
mean(values)
Попробуйте сами »
Справка по символам статистики
Символ | Описание |
---|---|
\( \mu \) | Среднее совокупности. Произносится 'mu'. |
\( \bar{x} \) | Среднее значение выборки. Произносится как 'x-bar'. |
\( \sum \) | Оператор суммирования, 'заглавная сигма'. |
\( x \) | По переменной 'x' мы вычисляем среднее значение для неё. |
\( i \) | Индекс 'i' переменной 'x'. Это идентифицирует каждое наблюдение для переменной. |
\( n \) | Количество наблюдений. |