Конвертация PDF в Excel: от извлечения данных до идеальной таблицы

Иван Корнев·15.05.2026·6 мин

Чтобы качественно перевести PDF в Excel, важно определить тип исходного файла: цифровой документ с выделяемым текстом или скан-изображение. Для цифровых PDF лучший результат дает встроенный импорт данных в Excel (Power Query), который сохраняет структуру таблицы. Для сканов предварительно требуется оптическое распознавание символов (OCR). Ключ к успеху — не просто конвертация, а последующая проверка типов данных, удаление лишних строк и исправление «съехавших» столбцов.

Краткий ответ: Если у вас современный Excel, используйте вкладку ДанныеПолучить данныеИз файлаИз PDF. Это самый надежный способ для цифровых документов. Для сканов сначала примените OCR в Adobe Acrobat или онлайн-конвертере с поддержкой распознавания текста.

Если статья длиннее 3000 знаков, автоматически добавь перед первым H2:

Оглавление

Типы PDF и выбор инструмента

Результат конвертации на 90% зависит от того, как создан исходный файл.

  1. Цифровой PDF (Text-based). Создан экспортом из Word, Excel или другой программы. Текст в нем можно выделить курсором. Такие файлы содержат скрытую структурную разметку, которую Excel может считать напрямую.
  2. Скан или изображение (Image-based). Получен путем сканирования бумажного документа или сохранения страницы как картинки. Для Excel это «пустой лист» с изображением. Без предварительного OCR (оптического распознавания) данные извлечь невозможно.

Не пытайтесь импортировать скан напрямую через функцию «Получить данные» в Excel. Программа либо выдаст ошибку, либо загрузит пустую таблицу. Сначала распознайте текст.

Способ 1: Импорт через Excel (Power Query)

Это наиболее профессиональный метод, доступный в Excel 2016, 2019, 2021 и Microsoft 365. Он позволяет-preview данные и очистить их до загрузки на лист.

Пошаговая инструкция:

  1. Откройте пустую книгу Excel.
  2. Перейдите на вкладку Данные (Data).
  3. Нажмите Получить данные (Get Data) → Из файлаИз PDF (From PDF).
  4. Выберите нужный файл.
  5. В окне навигатора Excel покажет все обнаруженные таблицы и страницы.
    • Значок таблицы означает структурированные данные.
    • Значок страницы означает весь текст страницы подряд.
  6. Выберите нужную таблицу. Справа появится предпросмотр.
  7. Нажмите Преобразовать данные (Transform Data), если нужно удалить лишние заголовки, футеры или пустые строки, или Загрузить (Load), если структура идеальна.

Преимущества:

  • Данные не «склеиваются» в одну ячейку.
  • Можно отфильтровать лишние строки еще до появления их в таблице.
  • При обновлении исходного PDF можно обновить и таблицу в Excel одной кнопкой.

Способ 2: Экспорт через Adobe Acrobat

Если у вас установлен Adobe Acrobat Pro, этот метод быстрее для разовых задач.

  1. Откройте PDF в Acrobat.
  2. В правой панели выберите инструмент Экспорт PDF (Export PDF).
  3. Выберите формат Электронная таблицаКнига Microsoft Excel.
  4. Нажмите Экспорт.
  5. Сохраните файл .xlsx.

Нюансы: Acrobat пытается сохранить визуальное форматирование (цвета, шрифты, объединенные ячейки). Это хорошо для отчетов, но плохо для дальнейшего анализа данных. Объединенные ячейки часто мешают сортировке и формулам, поэтому их рекомендуется разъединять сразу после открытия.

Способ 3: Онлайн-конвертеры и OCR

Подходит, если нет доступа к платному софту или старой версии Excel. Популярные сервисы: ILovePDF, Smallpdf, Adobe Online.

Алгоритм для сканов:

  1. Выберите сервис с поддержкой OCR (Optical Character Recognition).
  2. Загрузите файл.
  3. Обязательно поставьте галочку «Распознать текст» или «OCR mode».
  4. Скачайте результат.

При использовании онлайн-сервисов внимательно проверяйте конфиденциальность данных. Не загружайте документы с персональными данными, банковской тайной или коммерческой секретностью на публичные платформы.

Проверка и очистка данных после конвертации

Даже лучшая конвертация требует ручной проверки. Вот чек-лист действий сразу после импорта:

1. Проверка типов данных

Excel часто импортирует числа как текст (особенно если в PDF были пробелы между разрядами, например 1 000 000).

  • Симптом: Числа выровнены по левому краю, функции СУММ их игнорируют.
  • Решение: Выделите столбец → ДанныеТекст по столбцам → Готово. Или используйте функцию «Преобразовать в число» через предупреждающий значок рядом с ячейкой.

2. Удаление «мусора»

В таблицах из PDF часто остаются повторяющиеся заголовки (если таблица шла на несколько страниц), номера страниц и футеры.

  • Используйте Фильтр, чтобы найти и удалить пустые строки или повторяющиеся заголовки.
  • Проверьте последние строки таблицы на наличие итогов, которые могли превратиться в обычный текст.

3. Исправление разделителей

В русских PDF разделитель дробной части — запятая, в английских — точка. При импорте может возникнуть путаница.

  • Проверьте столбцы с датами и валютами.
  • Если даты отображаются некорректно, измените формат ячеек на «Дата» и проверьте соответствие дня и месяца.

4. Разъединение ячеек

Если вы использовали экспорт через Acrobat, многие ячейки могут быть объединены.

  • Выделите всю таблицу.
  • На вкладке Главная нажмите Объединить и поместить в центре (чтобы отключить объединение).
  • Заполните пустые ячейки значениями из верхних ячеек (если это необходимо для сводных таблиц).

Решение частых проблем

Таблица «развалилась» на много столбцов

Если один логический столбец разбился на два (например, «Имя» и «Фамилия» оказались в разных колонках из-за лишнего пробела в PDF):

  1. Выделите оба столбца.
  2. Используйте формулу сцепки: =A2 & " " & B2.
  3. Скопируйте результат и вставьте как значения.

Данные идут в одну колонку

Если весь текст попал в столбец A:

  1. Выделите столбец A.
  2. Перейдите: ДанныеТекст по столбцам.
  3. Выберите формат С разделителями.
  4. Укажите пробел, табуляцию или другой символ, который разделяет данные в вашем случае.

Многострочные заголовки

В PDF заголовок таблицы может занимать 2–3 строки визуально, но при импорте каждая строка становится отдельной записью.

  • Удалите лишние строки заголовков, оставив только одну.
  • Переименуйте столбцы вручную, объединив смысл (например, вместо «Сумма» и «(руб.)» сделайте один заголовок «Сумма, руб.»).

Сравнение методов конвертации

МетодЛучше всего подходит дляТочность структурыТребует очистки
Excel (Power Query)Цифровых PDF, регулярной работыВысокаяМинимальная
Adobe AcrobatСохранения внешнего вида, разовых задачСредняяСредняя (много объединенных ячеек)
Онлайн-конвертер (без OCR)Простых цифровых таблицНизкая/СредняяВысокая
Онлайн-конвертер (с OCR)Сканированных документовЗависит от качества сканаОчень высокая (ошибки распознавания)

Частые ошибки

  1. Игнорирование предпросмотра. Пользователи нажимают «Загрузить», не проверив данные в Navigator Power Query. Это приводит к импорту сотен лишних строк с футерами.
  2. Работа со сканами без OCR. Попытка скопировать текст из скана мышкой или прямой импорт в Excel дают нечитаемый набор символов.
  3. Доверие форматам дат. Даты в формате «05.05.2026» могут импортироваться как текст. Всегда проверяйте возможность сортировки по дате.
  4. Копирование через буфер обмена. Простое Copy-Paste из PDF-ридера в Excel — самый ненадежный способ. Он почти всегда ломает структуру столбцов. Используйте специализированные инструменты импорта.

FAQ

Можно ли конвертировать защищенный паролем PDF? Да, но пароль нужно знать. В Excel при импорте появится запрос пароля. В онлайн-сервисах такие файлы обычно не обрабатываются.

Почему цифры суммируются неправильно? Скорее всего, они распознаны как текст из-за наличия неразрывных пробелов или апострофов в начале ячейки. Используйте «Текст по столбцам» или функцию ЗНАЧЕН() для преобразования.

Как обработать таблицу, которая идет через весь документ на 50 страницах? В Power Query (при импорте через Excel) можно выбрать несколько таблиц одновременно или использовать параметры запроса для объединения данных. В онлайн-конвертерах выбирайте опцию «Объединить страницы в одну таблицу», если она доступна.

Бесплатен ли импорт PDF в Excel? Да, функция «Получить данные из PDF» доступна во всех современных версиях Excel (Office 2016 и новее, подписка Microsoft 365) без дополнительных платежей.