Алгоритм расчета размаха после исключения аномалий

Иван Корнев·15.05.2026·4 мин

Чтобы удалить выброс и найти размах оставшихся значений, необходимо сначала исключить из набора данных элемент, значительно отличающийся от остальных, а затем вычислить разницу между максимальным и минимальным значениями в очищенной выборке. Этот подход позволяет получить более объективную оценку вариативности данных, не искаженную случайными аномалиями.

Понятие выброса и размаха

В статистике выброс (аномальное значение) — это элемент выборки, который резко выделяется на фоне остальных наблюдений. Он может быть следствием ошибки измерения, опечатки или действительно редкого события. Если задача прямо не указывает конкретное число для удаления, выбросом обычно считают значение, находящееся на наибольшем расстоянии от основной группы данных.

Размах — это простейшая мера рассеяния, показывающая диапазон изменения признака. Она рассчитывается как разность между наибольшим и наименьшим значениями в рассматриваемом наборе.

Ключевое правило: размах всегда считается после удаления выброса. Использование исходных данных приведет к завышенному результату, который не отражает реальную картину распределения основной массы значений.

Пошаговое решение задачи

Для корректного выполнения задания следуйте этому алгоритму:

  1. Анализ ряда чисел. Выпишите все значения в порядке возрастания. Это поможет визуально оценить «кучность» данных и сразу заметить потенциальный выброс.
  2. Идентификация выброса. Определите число, которое нужно исключить. В учебных задачах оно часто указано явно или очевидно отличается по порядку величины (например, 5, 6, 7, 50).
  3. Формирование новой выборки. Исключите найденное значение из списка. Запишите оставшиеся числа отдельно, чтобы не перепутать их с исходными.
  4. Поиск экстремумов. В обновленном списке найдите:
    • $X_{min}$ — минимальное значение.
    • $X_{max}$ — максимальное значение.
  5. Расчет размаха. Примените формулу: $$R = X_{max} - X_{min}$$

При поиске минимума и максимума в оставшейся выборке будьте внимательны: после удаления самого большого числа новым максимумом станет второе по величине значение из исходного списка. Аналогично с минимумом.

Разбор примера

Рассмотрим типовой вариант задачи.

Дано: Набор значений времени ожидания (в минутах): 12, 14, 13, 15, 12, 45, 14

Условие: Число 45 является ошибкой измерения (выбросом). Удалите его и найдите размах оставшихся значений.

Решение

Шаг 1. Удаляем выброс. Исключаем 45 из ряда. Оставшиеся значения: 12, 14, 13, 15, 12, 14.

Шаг 2. Упорядочиваем данные (для наглядности). 12, 12, 13, 14, 14, 15

Шаг 3. Определяем границы.

  • Минимальное значение ($X_{min}$): 12
  • Максимальное значение ($X_{max}$): 15

(Обратите внимание: если бы мы не удалили 45, максимум был бы 45, а размах — 33, что искажало бы статистику).

Шаг 4. Вычисляем размах. $$R = 15 - 12 = 3$$

Ответ: Размах оставшихся значений равен 3.

Сравнение результатов до и после очистки

Чтобы понять важность исключения аномалий, полезно сравнить показатели.

ПараметрИсходный набор (с выбросом)Очищенный набор (без выброса)
Данные12, 14, 13, 15, 12, 45, 1412, 14, 13, 15, 12, 14
Минимум1212
Максимум4515
Размах333

Как видно из таблицы, наличие одного лишнего значения увеличило размах в 11 раз, создавая ложное впечатление о сильном разбросе данных.

Частые ошибки при решении

  1. Расчет по старым границам. Самая распространенная ошибка — удалить выброс из суммы или среднего, но забыть обновить максимум/минимум для размаха. Всегда проверяйте, не был ли удаленный элемент самым большим или самым маленьким в исходном списке.
  2. Путаница с определением. Иногда ученики пытаются найти размах до удаления выброса, а потом вычитают из него что-то «лишнее». Это неверно. Размах — это свойство конкретного набора чисел; изменился набор — пересчитывайте всё заново.
  3. Игнорирование дубликатов. Если минимальное или максимальное значение встречается несколько раз, удаление одного экземпляра другого числа не меняет экстремумы. Например, в ряду 2, 2, 5, 8 удаление 5 не изменит минимум (останется 2) и максимум (останется 8).

Если в задаче не сказано, какое именно число считать выбросом, ориентируйтесь на визуальный разрыв в упорядоченном ряду. Однако в школьных задачах выброс почти всегда указан явно или является единственным числом, сильно выпадающим из интервала.

FAQ

Всегда ли нужно удалять выбросы перед расчетом размаха? Только если этого требует условие задачи или методика анализа. В реальной статистике решение об удалении принимается после проверки природы аномалии (ошибка это или закономерность). В учебных задачах следуйте инструкции: если сказано «удалить выброс», значит, считаем размах по остатку.

Что делать, если после удаления выброса осталось всего два числа? Размах все равно считается по общей формуле: из большего вычитаем меньшее. Если осталось одно число, размах равен нулю.

Может ли выбросом быть минимальное значение? Да. Если дан ряд 2, 10, 11, 12, 10, то число 2 является выбросом (аномально низким). При его удалении новым минимумом станет 10, и размах будет считаться относительно него.