Перевод PDF в Excel: от скана до рабочей таблицы

Иван Корнев·26.05.2026·5 мин

Чтобы перевести PDF в Excel, используйте встроенную функцию «Получить данные» в современных версиях Excel или специализированные конвертеры с поддержкой OCR (например, Adobe Acrobat Pro, ABBYY FineReader). Для простых текстовых PDF достаточно копирования через буфер обмена с последующей обработкой инструментом «Текст по столбцам». Ключ к успеху — проверка формата чисел и очистка лишних строк после импорта.

Ниже рассмотрены лучшие способы извлечения таблиц в зависимости от типа документа и инструкции по приведению данных в порядок.

Оглавление

Выбор метода: текст или изображение

Качество конвертации напрямую зависит от структуры исходного файла:

  1. Цифровой PDF (с текстовым слоем). Текст можно выделить курсором. Такие файлы конвертируются точно, сохраняя структуру ячеек. Подходят любые методы, включая бесплатные.
  2. Скан или фото (растровый PDF). Текст является частью картинки. Требуется оптическое распознавание символов (OCR). Без OCR вы получите пустой лист или нечитаемые символы. Качество зависит от четкости скана.

Способ 1: Встроенные инструменты Excel (для Office 365/2021+)

В современных версиях Microsoft Excel появилась функция прямого импорта данных из PDF. Это самый безопасный и быстрый способ для цифровых документов.

  1. Откройте пустую книгу Excel.
  2. Перейдите на вкладку Данные (Data).
  3. Нажмите Получить данныеИз файлаИз PDF.
  4. Выберите нужный файл.
  5. В окне навигатора Excel покажет все обнаруженные таблицы. Выберите нужную и нажмите Загрузить (Load) или Преобразовать данные (Transform Data), если требуется предварительная фильтрация в Power Query.

Если таблица распознана некорректно, используйте кнопку «Преобразовать данные». В редакторе Power Query можно легко удалить лишние заголовки, заполнить пустые ячейки и изменить тип данных перед выгрузкой в лист.

Способ 2: Профессиональные программы с OCR

Для сложных документов, сканов и больших объемов данных лучше использовать специализированный софт. Лидеры рынка — ABBYY FineReader PDF и Adobe Acrobat Pro.

Алгоритм действий (на примере ABBYY/FineReader):

  1. Откройте PDF в программе.
  2. Убедитесь, что выбран правильный язык распознавания (русский/английский).
  3. Выделите область таблицы инструментом «Область таблицы».
  4. Нажмите Сохранить как или Экспорт и выберите формат Microsoft Excel (.xlsx).
  5. В настройках экспорта укажите:
    • Сохранять внешний вид страницы (или только данные).
    • Распознавать фоновые изображения (обычно лучше отключить для чистоты таблицы).

Преимущества:

  • Высокая точность распознавания даже при плохом качестве скана.
  • Возможность обучения программы под специфические шрифты.
  • Конфиденциальность: данные не покидают ваш компьютер.

Способ 3: Онлайн-конвертеры (быстро, но с рисками)

Сервисы вроде Smallpdf, iLovePDF или Convertio подходят для разовых задач с несекретными данными.

  1. Загрузите файл на сайт.
  2. Выберите опцию «PDF в Excel» (иногда отдельно указана «PDF с OCR в Excel»).
  3. Дождитесь обработки и скачайте результат.

Безопасность данных: Не загружайте в онлайн-конвертеры документы с персональными данными, финансовой отчетностью или коммерческой тайной. Файлы временно хранятся на чужих серверах, и гарантия их полного удаления часто отсутствует.

Подготовка данных: очистка и форматирование

После конвертации данные редко бывают идеальными. Выполните следующие шаги для приведения таблицы в рабочий вид:

1. Исправление формата чисел

Часто числа импортируются как текст (выравниваются по левому краю, не суммируются).

  • Решение: Выделите столбец → вкладка ДанныеТекст по столбцам → Нажмите «Готово». Это принудительно преобразует текстовые числа в числовой формат.
  • Если разделитель дробной части неверен (точка вместо запятой), используйте замену (Ctrl+H): заменить . на ,.

2. Удаление мусора и пустых строк

OCR часто добавляет пустые строки между распознанными блоками.

  • Решение: Выделите таблицу → вкладка ГлавнаяНайти и выделитьПерейти к...Выделить группу ячеекПустые ячейки. Нажмите Ctrl + - (минус) и удалите строки целиком.

3. Объединение разбитых заголовков

Иногда заголовок таблицы разбивается на несколько строк или столбцов.

  • Решение: Используйте функцию «Объединить и поместить в центре» для визуального оформления или формулу СЦЕПИТЬ (CONCAT) для сбора текста в одну ячейку, если это нужно для дальнейшей сортировки.

Сравнение методов конвертации

МетодТочностьБезопасностьСложность настройкиДля каких файлов
Excel (Power Query)ВысокаяМаксимальнаяНизкаяЦифровые PDF с четкой структурой
ABBYY / Adobe ProОчень высокаяМаксимальнаяСредняяСканы, сложные таблицы, плохое качество
Онлайн-сервисыСредняяНизкаяМинимальнаяПростые документы без личных данных
Копипаст + Текст по столбцамНизкаяМаксимальнаяВысокаяОчень простые таблицы без объединенных ячеек

Частые ошибки при конвертации

  1. Разрыв таблицы на части.

    • Причина: Многостраничный документ, где таблица продолжается на следующем листе.
    • Решение: При конвертации в профессиональном ПО включите опцию «Обнаруживать многостраничные таблицы». В Excel вручную скопируйте продолжение таблицы под основную часть.
  2. Потеря нулей в начале чисел.

    • Причина: Excel автоматически определяет код телефона 095... как число 95....
    • Решение: Перед вставкой или импортом задайте формату столбца значение «Текстовый».
  3. Неверное распознавание похожих символов.

    • Причина: OCR путает 1 (единицу), l (строчную L) и I (заглавную i), а также 0 и O.
    • Решение: Используйте условное форматирование или поиск для выявления аномалий в числовых столбцах.

FAQ

Можно ли конвертировать защищенный паролем PDF? Да, но сначала необходимо снять защиту. В Adobe Acrobat Pro это делается через «Инструменты» → «Защита». Для этого нужно знать пароль владельца документа.

Почему таблица в Excel выглядит как одна сплошная колонка? Это происходит при простом копировании текста. Используйте инструмент «Текст по столбцам» на вкладке «Данные», выбрав разделитель (пробел, табуляция или другой символ), чтобы разбить данные по ячейкам.

Как сохранить формулы из PDF? PDF не хранит формулы Excel, только результаты вычислений (значения). Восстановить логику расчетов автоматически невозможно, формулы придется прописывать заново вручную.

Что делать, если таблица содержит объединенные ячейки? Объединенные ячейки часто ломают сортировку и фильтры в Excel. Рекомендуется отменить объединение (кнопка «Объединить и поместить в центре» → «Отменить объединение ячеек») и заполнить образовавшиеся пустоты значениями из верхней ячейки (можно сделать макросом или протягиванием с Ctrl).