Перенос таблиц из PDF в Excel: способы сохранить структуру

Иван Корнев·26.05.2026·5 мин

Чтобы конвертировать PDF в Excel (XLSX) без потери структуры таблиц, лучше всего использовать встроенную функцию «Получить данные» (Power Query) в современных версиях Microsoft Excel. Этот метод бесплатно и точно распознает табличные данные, сохраняя типы ячеек (числа, даты, текст). Для сложных сканированных документов или пакетной обработки эффективнее использовать Adobe Acrobat Pro или специализированные OCR-сервисы с поддержкой русского языка.

Главная проблема при конвертации — разрушение сетки таблицы, когда данные слипаются в одну ячейку или разбиваются неверно. Ниже приведены проверенные методы, отсортированные по качеству результата.

Оглавление

  1. Способ 1: Встроенный импорт в Excel (Рекомендуемый)
  2. Способ 2: Adobe Acrobat Pro (Для сложных макетов)
  3. Способ 3: Онлайн-конвертеры и OCR (Быстрый вариант)
  4. Как исправить ошибки после конвертации
  5. Частые ошибки
  6. FAQ

Способ 1: Встроенный импорт в Excel (Рекомендуемый)

Начиная с Excel 2016 (и в Office 365), Microsoft внедрила мощный инструмент Power Query, который умеет «читать» PDF-файлы. Это самый надежный способ, так как он не требует стороннего ПО и не загружает данные в облако.

Пошаговая инструкция:

  1. Откройте пустой лист в Excel.
  2. Перейдите на вкладку Данные (Data).
  3. Нажмите Получить данныеИз файлаИз PDF (Get Data > From File > From PDF).
    • Если кнопки нет, выберите «Из других источников» или убедитесь, что у вас обновленная версия Office.
  4. В открывшемся окне найдите нужный PDF-файл и нажмите Импорт.
  5. Excel просканирует документ и покажет список найденных объектов: Table001, Page001 и т.д.
    • Ищите значок таблицы рядом с названием. Наводите курсор на элементы, чтобы увидеть предпросмотр.
  6. Выберите нужную таблицу и нажмите Загрузить (Load) для мгновенного переноса или Преобразовать данные (Transform Data), если нужна очистка.

Используйте кнопку Преобразовать данные, если в таблице есть лишние заголовки, футеры или объединенные ячейки. В редакторе Power Query можно удалить верхние строки, заполнить пустые значения вниз и изменить тип данных (например, превратить текст «1 000 ₽» в числовой формат) до выгрузки на лист.

Преимущества:

  • Полностью бесплатно (входит в подписку Office).
  • Безопасность: файл обрабатывается локально на вашем ПК.
  • Гибкая настройка: можно отфильтровать мусорные данные перед вставкой.

Ограничения:

  • Плохо работает со сканированными PDF (картинками внутри PDF). В этом случае таблица не будет найдена.
  • Может неверно определить границы сложной таблицы с объединенными ячейками.

Способ 2: Adobe Acrobat Pro (Для сложных макетов)

Если у вас установлен платный Adobe Acrobat Pro DC, он предлагает один из лучших алгоритмов экспорта. Программа пытается не просто извлечь текст, а воссоздать структуру документа.

Инструкция:

  1. Откройте PDF в Adobe Acrobat Pro.
  2. В правой панели выберите инструмент Экспорт PDF (Export PDF).
  3. В формате файла выберите Электронная таблицаКнига Microsoft Excel (.xlsx).
  4. Нажмите на шестеренку (Настройки) рядом с выбором формата:
    • Поставьте галочку Включить комментарии (если нужно).
    • Важно: убедитесь, что выбран режим Сохранить поток текста или Распознавать таблицы (зависит от версии, обычно включено по умолчанию).
  5. Нажмите Экспорт.

Нюансы настройки:

  • Если документ является сканом, Acrobat сначала предложит выполнить OCR (Распознавание текста). Обязательно выберите язык документа (например, Русский), иначе цифры могут превратиться в символы.
  • После экспорта откройте файл в Excel и проверьте ширины столбцов — Acrobat часто делает их слишком узкими.

Способ 3: Онлайн-конвертеры и OCR (Быстрый вариант)

Если под рукой нет Excel новых версий или Acrobat, можно использовать онлайн-сервисы. Этот способ подходит для простых таблиц и файлов, не содержащих конфиденциальных данных.

Популярные сервисы:

  • Smallpdf, iLovePDF, Convertio.
  • Специализированные OCR-сервисы (например, ABBYY FineReader Online).

Алгоритм действий:

  1. Загрузите файл на сайт.
  2. Выберите опцию PDF в Excel.
  3. Если есть выбор режима, укажите Распознавание таблиц (Table Recognition) или OCR.
  4. Скачайте готовый XLSX файл.

Безопасность данных: Никогда не загружайте в бесплатные онлайн-конвертеры документы с персональными данными, финансовой отчетностью или коммерческой тайной. Файлы временно хранятся на чужих серверах.

Когда этот способ лучше:

  • Нужно быстро конвертировать один файл на телефоне или чужом компьютере.
  • Таблица простая (без объединенных ячеек и многострочных заголовков).

Как исправить ошибки после конвертации

Даже лучшие инструменты иногда ошибаются. Вот чек-лист быстрой постобработки в Excel:

  1. Разъединение ячеек: Если данные попали в одну ячейку через пробел или запятую, используйте вкладку ДанныеТекст по столбцам. Выберите разделитель (пробел, табуляция, запятая), чтобы разбить текст.
  2. Числа как текст: Если суммы не считаются, проверьте формат ячеек. Часто после PDF числа сохраняются как текст.
    • Решение: Выделите столбец → Данные → Текст по столбцам → Готово (это принудительно сбросит формат). Или используйте функцию ЗНАЧЕН().
  3. Лишние строки: Удалите пустые строки, которые появляются между данными из-за разного межстрочного интервала в PDF.
    • Решение: Выделите диапазон → F5 (Выделение) → Выделить группу ячеек → Пустые → Удалить строки.
  4. Переносы строк внутри ячейки: Иногда одна ячейка PDF превращается в несколько строк Excel. Используйте замену (Ctrl+H): найдите символ переноса строки (нажмите Ctrl+J в поле «Найти») и замените на пробел.

Частые ошибки

ОшибкаПричинаРешение
Все данные в одном столбцеИнструмент не увидел разделителиИспользуйте «Текст по столбцам» в Excel или Power Query
Цифры не суммируютсяФормат ячейки «Текстовый»Преобразуйте формат в «Числовой» или примените ЗНАЧЕН()
Исчезли нули в начале (00123)Excel автоматически убирает ведущие нулиПеред импортом задайте формату столбца вид «Текстовый»
«Каша» из символов вместо цифрНеверный язык OCR при распознавании сканаПовторите конвертацию, явно указав русский/английский язык

FAQ

Почему таблица из PDF разбивается на несколько частей в Excel? Обычно это происходит, если таблица в PDF пересекает разрыв страницы или имеет сложную структуру с объединенными заголовками. В Power Query можно попробовать объединить таблицы вручную, а в Acrobat — настроить экспорт с опцией «Сохранять макет».

Можно ли конвертировать сканированный документ (картинку) в Excel? Стандартный импорт Excel не справится с картинкой. Вам нужен инструмент с OCR (оптическим распознаванием символов): Adobe Acrobat Pro, ABBYY FineReader или онлайн-сервисы с пометкой OCR.

Как сохранить формулы из Excel, если они были в PDF? Никак. PDF — это формат финального представления, он не хранит формулы, только результаты вычислений (текст и цифры). После конвертации вам придется заново прописывать формулы в Excel.

Безопасно ли использовать бесплатные онлайн-конвертеры? Для публичных данных (прайс-листы из открытого доступа, расписания) — да. Для внутренних отчетов, баз клиентов или паспортов — нет. Используйте оффлайн-инструменты (Excel, Acrobat).