Как построить таблицу частот: полный гайд на примере данных о росте

Иван Корнев·08.05.2026·6 мин

Таблица частот — это инструмент систематизации данных, который показывает, сколько раз (с какой частотой) каждое значение или интервал значений встречается в выборке. Чтобы составить её, нужно упорядочить данные, определить диапазон, разбить его на интервалы и подсчитать количество попаданий в каждый интервал.

Этот метод превращает хаотичный список чисел в понятную структуру, позволяя мгновенно оценить распределение признаков — например, понять, какой рост является наиболее типичным для класса школьников.

Зачем это нужно? Без группировки большие массивы данных (от 20–30 значений и более) невозможно анализировать визуально. Таблица частот выявляет закономерности, моды (самые частые значения) и выбросы.

Алгоритм составления таблицы частот

Процесс создания таблицы делится на несколько логических этапов. Рассмотрим их на конкретном примере.

Шаг 1. Сбор и первичная обработка данных

Представим, что мы измерили рост (в см) 30 учащихся 9-го класса. Вот наши «сырые» данные:

162, 175, 168, 154, 170, 165, 172, 158, 169, 174, 161, 166, 171, 159, 163, 176, 167, 155, 173, 164, 160, 168, 170, 157, 165, 172, 169, 161, 174, 166

Первое действие — найти минимальное ($X_{min}$) и максимальное ($X_{max}$) значения.

  • $X_{min} = 154$ см
  • $X_{max} = 176$ см

Шаг 2. Определение размаха и количества интервалов

Размах вариации ($R$) — это разница между максимумом и минимумом: $$R = 176 - 154 = 22 \text{ см}$$

Теперь нужно решить, будем ли мы делать таблицу для каждого отдельного значения (дискретный ряд) или сгруппируем данные в интервалы (интервальный ряд).

  • Если значений мало (до 10–15 уникальных), можно перечислить их по отдельности.
  • Если размах большой или данных много, используют интервалы.

Для нашего примера с размахом 22 см удобно использовать интервалы длиной в 5 см. Это стандартный шаг для антропометрических данных.

Количество интервалов ($k$) можно рассчитать по формуле Стерджеса: $k = 1 + 3.322 \cdot \lg(n)$, где $n$ — объем выборки (30). $$k \approx 1 + 3.322 \cdot 1.477 \approx 5.9$$ Округляем до 6 интервалов. Однако при размахе 22 и шаге 5 у нас получится примерно 4–5 интервалов, что тоже допустимо и нагляднее. Выберем шаг $h = 5$ см.

Шаг 3. Формирование границ интервалов

Начнем с минимального значения или чуть меньше его, чтобы границы были «красивыми». Возьмем начало первого интервала за 154 см.

Интервалы будут выглядеть так:

  1. 154 – 158
  2. 159 – 163
  3. 164 – 168
  4. 169 – 173
  5. 174 – 178

Важное правило границ Если значение попадает точно на границу (например, 159), нужно заранее договориться, куда его относить. Обычно применяют принцип: [левая граница; правая граница). То есть левая граница включается, а правая — нет. Или наоборот. В школьной практике часто используют четкие непересекающиеся диапазоны: «от 154 до 158 включительно», «от 159 до 163 включительно». Мы будем использовать второй, более простой для понимания подход.

Шаг 4. Подсчет частот (Tallying)

Проходим по всему списку из 30 значений и ставим «галочку» в соответствующий интервал.

  • 154–158 см: 154, 158, 155, 157, 159 (ошибка: 159 входит в следующий).
    • Пересчет: 154, 158, 155, 157. Итого: 4 человека.
  • 159–163 см: 162, 161, 159, 163, 160, 161. Итого: 6 человек.
  • 164–168 см: 168, 165, 166, 167, 164, 168, 165, 166. Итого: 8 человек.
  • 169–173 см: 170, 172, 169, 171, 173, 170, 172, 169. Итого: 8 человек.
  • 174–178 см: 175, 174, 176, 174. Итого: 4 человека.

Проверка: $4 + 6 + 8 + 8 + 4 = 30$. Сумма частот совпадает с объемом выборки.

Готовая таблица частот

На основе подсчетов формируем итоговую таблицу. Для большей информативности добавим столбец с относительной частотой (доля от общего числа, в процентах).

Формула относительной частоты: $W_i = \frac{n_i}{N} \cdot 100%$, где $n_i$ — частота интервала, $N$ — общее число наблюдений.

Распределение роста учащихся 9-го класса

Интервал роста (см)Частота ($n_i$)Относительная частота ($W_i$)Накопленная частота
154 – 158413.3%4
159 – 163620.0%10
164 – 168826.7%18
169 – 173826.7%26
174 – 178413.3%30
Итого30100%-

Как читать накопленную частоту? Она показывает, сколько учащихся имеют рост меньше или равный верхней границе текущего интервала. Например, из третьей строки видно, что 18 человек (из 30) имеют рост 168 см или ниже.

Анализ полученной таблицы

Просто составить таблицу недостаточно — нужно сделать выводы. Глядя на данные выше, мы видим:

  1. Модальный интервал: У нас два интервала с максимальной частотой (8 человек) — это 164–168 см и 169–173 см. Это означает, что большинство учеников имеют средний рост в диапазоне 164–173 см.
  2. Симметрия: Распределение выглядит почти симметричным. Частоты плавно растут от краев к центру и так же плавно убывают.
  3. Отсутствие аномалий: Нет интервалов с нулевой частотой внутри диапазона, что говорит об однородности группы (нет резкого разделения на «очень низких» и «очень высоких» при отсутствии средних).

Типичные ошибки при составлении таблиц

При работе с данными новички часто допускают следующие промахи:

  • Наложение интервалов.
    • Неправильно: 150–160, 160–170. Куда деть значение 160?
    • Правильно: 150–159, 160–169 ИЛИ [150; 160), [160; 170).
  • Разная ширина интервалов. Не следует делать один интервал шириной 5 см, а другой 10 см, если для этого нет веских причин (например, специфического распределения данных). Это искажает визуальное восприятие на гистограммах.
  • Потеря данных. Всегда проверяйте сумму частот. Если $\sum n_i \neq N$, вы пропустили одно или несколько значений при подсчете.
  • Игнорирование выбросов. Если бы у нас был ученик с ростом 200 см, он попал бы в одиночный интервал. Такие значения нельзя «размазывать» по общей сетке, их лучше выносить отдельно или расширять последний интервал («174 и более»).

FAQ

В чем разница между частотой и относительной частотой? Частота — это абсолютное число объектов в группе (сколько человек?). Относительная частота — это доля этой группы от общего числа (какой процент?). Относительная частота позволяет сравнивать выборки разного размера.

Что делать, если значение попадает ровно на границу интервала? Используйте правило «левая граница включена, правая исключена» (или наоборот). Главное — зафиксировать это правило до начала подсчетов и придерживаться его последовательно для всех данных.

Можно ли использовать таблицу частот для качественных признаков (не чисел)? Да. Например, для цвета глаз или марки автомобиля. В этом случае интервалы не нужны, каждая категория (качественное значение) становится отдельной строкой таблицы.

Как выбрать оптимальную ширину интервала? Универсального правила нет, но есть эмпирические формулы (Стерджеса, Скотта, Фридмана-Диакониса). На практике для учебных задач часто выбирают шаг, который дает от 5 до 10 интервалов — это золотая середина между детализацией и наглядностью.