Глобальная статистика в одном месте: как работать с Our World in Data
Our World in Data (OWID) — это открытый научно-образовательный ресурс, который собирает, очищает и визуализирует данные о ключевых мировых проблемах: от бедности и здравоохранения до изменения климата и энергетики. Чтобы воспользоваться данными, найдите нужный показатель через поиск или каталог, настройте визуализацию в инструменте Grapher (выбрав страны, период и масштаб) и экспортируйте график в PNG/SVG или сырые данные в CSV для дальнейшего анализа.
Проект разрабатывается исследователями Оксфордского университета и некоммерческой организацией Global Change Data Lab. Его главная цель — сделать сложные статистические тренды понятными для журналистов, студентов, политиков и широкой аудитории, опираясь на проверенные источники.
Оглавление
Структура сайта и основные разделы
Сайт построен так, чтобы удовлетворить потребности разных пользователей: от тех, кому нужна готовая картинка для презентации, до аналитиков, работающих с сырыми массивами данных.
| Раздел | Назначение | Для кого полезно |
|---|---|---|
| Articles & Topics | Аналитические статьи с глубоким контекстом, объяснением методологии и встроенными графиками. | Журналисты, студенты, читатели, желающие понять суть явления. |
| Data Catalog | Полный перечень всех индикаторов с указанием источников, частоты обновления и покрытия по странам. | Исследователи, аналитики данных. |
| Grapher | Интерактивный конструктор графиков. Позволяет менять параметры визуализации в реальном времени. | Все пользователи, нуждающиеся в кастомизации charts. |
| SDG Tracker | Специализированный раздел для мониторинга Целей устойчивого развития ООН. | Политики, сотрудники НКО, отчетные отделы. |
Пошаговая инструкция: от поиска до экспорта
Чтобы получить нужную информацию максимально быстро, следуйте этому алгоритму:
- Поиск показателя. Используйте строку поиска в шапке сайта. Вводите запросы на английском языке (например,
life expectancy,CO2 emissions,extreme poverty). Если точного термина нет, browse через раздел Topics. - Оценка качества данных. Перейдя на страницу индикатора, обратите внимание на блок «Metadata». Проверьте:
- Coverage: за какие годы есть данные и по каким странам.
- Source: кто первоисточник (ВОЗ, Всемирный банк, национальные статслужбы).
- Processing: как данные были очищены или агрегированы командой OWID.
- Визуализация. Используйте встроенный график для быстрой оценки тренда. Если стандартный вид не подходит, перейдите к настройкам Grapher.
- Экспорт результата. Скачайте изображение для публикации или CSV-файл для собственного анализа.
Работа с интерактивным инструментом Grapher
Grapher — это «сердце» визуализации на сайте. Он позволяет трансформировать один и тот же набор данных под разные задачи.
Основные настройки
- Выбор стран (Entities): Вы можете добавить несколько стран для сравнения. Используйте поиск в боковой панели, чтобы найти конкретные государства или регионы (например, «European Union»).
- Временной диапазон (Time): Передвигайте ползунок лет или задайте точный период. Кнопка Play запускает анимацию изменения показателей во времени.
- Тип графика (Chart type):
- Line chart: для отслеживания динамики во времени.
- Bar chart: для сравнения величин в конкретном году.
- Scatter plot: для поиска корреляций между двумя разными показателями (ось X и ось Y).
- Map: хороплетная карта для географического распределения.
Лайфхак для сравнения: Если вы сравниваете страны с разным уровнем развития (например, США и Непал), переключите ось Y в логарифмический масштаб (Log scale). Это позволит увидеть темпы роста, а не только абсолютные разрывы. Также всегда проверяйте опцию Relative to population (на душу населения), если сравниваете экономические или экологические показатели крупных и мелких стран.
Кастомизация вида
В меню Edit graph можно изменить цвета линий, добавить сглаживание (smoothing), поменять подписи осей и добавить аннотации. Это особенно полезно при подготовке графиков для статей или презентаций, чтобы акцентировать внимание на конкретных событиях (например, «начало пандемии»).
Скачивание данных и интеграция
OWID является сторонником открытой науки, поэтому все данные доступны бесплатно.
Экспорт графиков
Под каждым графиком есть кнопка Download.
- PNG: растровое изображение высокого разрешения. Подходит для вставки в Word, PowerPoint или публикации в соцсетях.
- SVG: векторный формат. Идеален для полиграфии и дальнейшей редактирования в Illustrator или Figma.
- Embed: код
<iframe>для вставки интерактивного графика на ваш сайт или в блог.
Получение сырых данных (CSV/Excel)
Для глубокого анализа вам понадобятся сами цифры.
- На странице графика нажмите вкладку Data.
- Выберите кнопку Download CSV.
- Файл будет содержать столбцы:
Entity(страна),Code(код страны),YearиValue(значение показателя).
Программный доступ (API и Python)
Если вы работаете с большими массивами данных, скачивать файлы вручную неудобно. OWID предоставляет прямой доступ к данным через GitHub-репозиторий и API.
Пример быстрого получения данных через Python (библиотека pandas):
import pandas as pd
# Прямая ссылка на датасет (пример для CO2 emissions)
url = "https://nourish-data.s3.amazonaws.com/owid-covid-data.csv" # Замените на актуальную ссылку из Data Catalog
df = pd.read_csv(url)
# Фильтрация данных
df_russia = df[df['location'] == 'Russia']
print(df_russia[['date', 'new_cases']].head())
Ссылки на CSV-файлы могут меняться при обновлении структуры базы. Всегда проверяйте актуальные пути в разделе Data Catalog -> Download для конкретного индикатора.
Частые ошибки при анализе
Даже качественные данные можно интерпретировать неверно. Избегайте следующих ловушек:
- Сравнение абсолютных значений вместо относительных. Сравнивать общий объем выбросов CO2 Китая и Люксембурга бессмысленно без привязки к численности населения или ВВП. Всегда используйте метрики per capita (на душу населения) или intensity (интенсивность), когда это уместно.
- Игнорирование пробелов в данных. Во многих развивающихся странах статистика за 1950–1980 годы может быть фрагментарной или оценочной (imputed). Линия графика может выглядеть плавной, но на самом деле состоять из интерполированных данных. Читайте сноски.
- Путаница в определениях. Термин «бедность» может означать жизнь менее чем на $2.15 в день (черта крайней бедности по ППС) или национальную черту бедности. Эти показатели несопоставимы напрямую.
- Корреляция не равна причинности. Scatter plot может показать связь между потреблением шоколада и количеством нобелевских лауреатов, но это не означает, что одно вызывает другое. OWID дает данные, но причинно-следственные связи нужно обосновывать отдельно.
FAQ: популярные вопросы
Можно ли использовать графики OWID в коммерческих проектах? Да. Большинство данных и визуализаций распространяются под лицензией Creative Commons BY (CC BY). Это означает, что вы можете свободно использовать их, включая коммерческие цели, при условии обязательного указания авторства: «Source: Our World in Data» со ссылкой на оригинальную страницу.
Почему данные за последний год могут отсутствовать? Глобальной статистике требуется время на сбор, верификацию и публикацию национальными органами. Данные за текущий год часто являются предварительными прогнозами или доступны только для отдельных стран.
Как цитировать OWID в академической работе? Рекомендуемый формат:
Author(s) (Year). "Title of the Chart/Article". Published online at OurWorldInData.org. Retrieved from: 'URL' [Online Resource].
Отличаются ли данные OWID от данных Всемирного банка или ООН? Часто OWID использует первичные источники (те же самые, что и ВОЗ или МВФ), но проводит дополнительную очистку, гармонизацию названий стран и заполнение пропусков. Поэтому цифры могут незначительно отличаться от сырых отчетов агентств. Всегда сверяйтесь с разделом «Sources» на странице индикатора.