Перевод PDF-документов: от простого текста до сложных сканов

Иван Корнев·26.05.2026·5 мин

Чтобы перевести PDF на русский язык, выберите метод в зависимости от типа файла. Для документов с выделяемым текстом используйте конвертацию в Word или онлайн-переводчики с поддержкой сохранения верстки. Для сканов и изображений сначала примените OCR (оптическое распознавание символов) в программах вроде ABBYY FineReader или Google Docs, а затем переведите полученный текст. Ключ к успеху — последующая ручная вычитка и восстановление сложного форматирования.

Краткий алгоритм:

  1. Текстовый PDF: Конвертировать в DOCX → Перевести → Сохранить как PDF.
  2. Скан (картинка): Распознать текст (OCR) → Исправить ошибки распознавания → Перевести → Сверстать заново.

Чем отличается перевод обычного PDF от скана

Главное препятствие при работе с PDF — это природа содержимого. Файлы делятся на два типа:

  1. Цифровые (текстовые). Текст внутри файла является программным кодом. Его можно выделить мышью, скопировать и вставить в переводчик. Проблема здесь только в сложной верстке (колонки, таблицы), которая может «поехать» при копировании.
  2. Растровые (сканы/фото). Каждая страница — это просто картинка. Компьютер не видит букв, только пиксели. Чтобы перевести такой документ, его нужно сначала «научить читать» с помощью технологии OCR.

Неправильный выбор инструмента приведет либо к каше из символов, либо к потере исходного вида документа.

Как перевести PDF с копируемым текстом

Если вы можете выделить текст курсором, задача упрощается. Ваша цель — извлечь контент, перевести его и вернуть обратно, минимизировав правки верстки.

Способ 1: Через Microsoft Word (рекомендуемый)

Современные версии Word (2013 и новее) умеют открывать PDF и конвертировать их в редактируемый формат.

  1. Нажмите правой кнопкой мыши на PDF-файл → Открыть с помощьюWord.
  2. Подтвердите конвертацию. Word преобразует документ, сохранив заголовки, списки и базовую структуру.
  3. Используйте встроенную функцию перевода (если доступна) или скопируйте текст в онлайн-сервис.
  4. Отредактируйте огрехи верстки (смещение таблиц, разрывы страниц).
  5. Сохраните файл как PDF (ФайлСохранить как → тип файла PDF).

Способ 2: Онлайн-сервисы с сохранением верстки

Существуют специализированные сервисы (например, DocTranslator или аналоги), которые загружают ваш PDF, извлекают текст, переводят его через API (часто Google Translate или DeepL) и собирают файл обратно, стараясь сохранить расположение блоков.

  • Плюсы: Быстро, не нужно устанавливать ПО.
  • Минусы: Риск утечки данных (не загружайте конфиденциальные документы), качество верстки страдает на сложных макетах.

Конфиденциальность: Никогда не загружайте паспорта, финансовые отчеты или договоры с персональными данными в бесплатные онлайн-конвертеры. Используйте офлайн-программы.

Как перевести отсканированный документ (OCR)

Если текст не выделяется, вам нужен этап оптического распознавания. Качество перевода напрямую зависит от качества распознавания.

Шаг 1: Распознавание текста (OCR)

Вам понадобятся инструменты, поддерживающие русский язык как входной (если исходник на русском) или как выходной (если переводите на русский).

  • ABBYY FineReader PDF: Лидер рынка. Лучшее качество распознавания сложных таблиц, колонтитулов и многостолбцовых текстов. Позволяет сразу экспортировать результат в Word с сохранением форматирования.
  • Google Docs (Бесплатно):
    1. Загрузите PDF на Google Диск.
    2. Нажмите правой кнопкой → Открыть с помощьюGoogle Документы.
    3. Система создаст новый документ: сверху будет картинка-оригинал, снизу — распознанный текст.
    4. Скопируйте текст для перевода.
  • Adobe Acrobat Pro: Инструмент «Распознать текст» делает слой текста поверх изображения, позволяя искать по документу и копировать фрагменты.

Шаг 2: Перевод распознанного текста

После того как вы получили редактируемый текст (в Word или TXT):

  1. Очистка: Удалите артефакты распознавания (лишние пробелы, разорванные слова, неверно прочитанные символы, например, «1» вместо «l»).
  2. Перевод: Используйте глубокие нейросетевые переводчики (DeepL, Яндекс.Переводчик, Google Translate). Для технических текстов лучше подходит DeepL благодаря контекстуальному пониманию.
  3. Вставка: Вставьте переведенный текст обратно в шаблон документа.

Сравнение инструментов для разных задач

Тип задачиРекомендуемый инструментПреимуществаНедостатки
Быстрый перевод бытового документаОнлайн-сервисы (DocTranslator и др.)Не требует установки, сохраняет общую структуруНизкая безопасность, ошибки в таблицах
Деловая переписка, простые статьиMicrosoft Word + Онлайн-переводчикХорошее сохранение стилей, удобно редактироватьМожет ломать сложную верстку
Сканы, книги, сложные отчетыABBYY FineReaderЭталонное распознавание, работа с колонкамиПлатный, требователен к ресурсам ПК
Бесплатное решение для скановGoogle Docs (Google Drive)Доступно каждому, неплохое качество OCRТеряет сложное форматирование, требует ручной сборки

Частые ошибки при переводе PDF

  1. Игнорирование пост-редактуры. Машинный перевод часто искажает термины и падежные окончания. Юридические и медицинские документы требуют обязательной проверки человеком.
  2. Потеря нумерации и ссылок. При конвертации в Word и обратно часто сбиваются перекрестные ссылки и автоматическая нумерация страниц. Проверяйте оглавление после перевода.
  3. Проблемы со шрифтами. Если в оригинале использовались редкие кириллические шрифты, при сохранении нового PDF они могут замениться на стандартные, что изменит разметку страниц (текст «поедет»). Используйте стандартные шрифты (Arial, Times New Roman, Roboto) для финального файла.
  4. Неверный выбор языка OCR. Если вы распознаете английский текст, но в настройках стоит русский, программа выдаст бессмысленный набор символов. Всегда проверяйте язык источника перед запуском OCR.

FAQ: Ответы на популярные вопросы

Можно ли перевести PDF, сохранив 100% оригинальный дизайн? Автоматически — нет. Ни один инструмент не гарантирует идеального совпадения пиксель-в-пиксель, особенно если длина текста меняется при переводе (русский текст часто длиннее английского на 15–20%). Полное сохранение дизайна требует ручной верстки в InDesign или Illustrator.

Как перевести защищенный паролем PDF? Сначала необходимо снять защиту. Если вы знаете пароль, откройте файл в Adobe Acrobat или браузере, выберите «Печать» и сохраните как новый PDF («Microsoft Print to PDF»). Это создаст копию без пароля. Если пароль неизвестен, легальные способы перевода отсутствуют.

Что делать, если в PDF есть формулы и графики? Графики и формулы обычно являются изображениями. OCR их не переведет. Вам придется вручную пересоздать подписи к осям и легенды графиков в графическом редакторе или вставить поверх оригинала текстовые блоки с переводом.

Какой сервис дает самый естественный перевод? Для пары английский-русский сейчас лидируют DeepL и Яндекс.Переводчик (с включенной опцией «учитывать контекст»). Google Translate хорош для общего смысла, но чаще гремит канцеляризмами.