Как превратить скан PDF или фото в редактируемый документ Word

Иван Корнев·27.05.2026·6 мин

Чтобы перевести отсканированный PDF-файл или фотографию документа в формат Word с возможностью редактирования, необходимо использовать технологию оптического распознавания символов (OCR). Обычное изменение расширения файла не сработает, так как скан — это изображение. Самый быстрый способ для пользователей Windows — открыть файл непосредственно в Microsoft Word (версии 2013 и новее), который автоматически выполнит распознавание. Для более сложных документов или мобильных устройств лучше подойдут специализированные онлайн-сервисы или приложения с поддержкой русского языка.

Почему обычный конвертер не справляется со сканами

Важно различать два типа PDF-файлов:

  1. Текстовые PDF: созданы экспортом из Word или другой программы. Текст в них уже является цифровым кодом.
  2. Сканированные PDF (или фото): представляют собой набор картинок (растровых изображений). Компьютер «видит» их как фото, а не как буквы.

Если попытаться конвертировать скан обычным методом, вы получите документ Word, внутри которого будет просто картинка страницы. Редактировать такой текст невозможно. Технология OCR анализирует пиксели изображения, находит знакомые паттерны букв и заменяет их на печатные символы.

Быстрый тест: Откройте PDF и попробуйте выделить мышью любое слово. Если курсор меняется на «текстовый» и слово выделяется — это текстовый PDF, OCR не нужен. Если выделяется вся страница как объект или ничего не происходит — перед вами скан, требующий распознавания.

Способ 1. Microsoft Word (встроенный инструмент)

Этот метод идеален, если у вас уже установлен пакет Microsoft Office (Word 2013, 2016, 2019, 2021 или Microsoft 365). Программа имеет встроенный движок OCR, который активируется автоматически при открытии PDF.

Преимущества:

  • Не нужно загружать файлы на сторонние сайты (безопасность данных).
  • Не требует установки дополнительного ПО.
  • Хорошее качество распознавания простого текста.

Инструкция:

  1. Запустите Microsoft Word.
  2. Нажмите ФайлОткрытьОбзор.
  3. Выберите ваш PDF-файл (можно выбрать несколько, но лучше по одному).
  4. Появится предупреждение: «Word теперь преобразует ваш PDF-файл в редактируемый документ Word...». Нажмите ОК.
  5. Дождитесь окончания процесса. Word создаст новый документ с распознанным текстом.
  6. Сохраните результат как .docx.

Ограничения метода: Word может исказить сложное форматирование (таблицы, колонки, обтекание картинками). Также процесс может занять много времени для файлов объемом более 50–100 страниц.

Способ 2. Онлайн-сервисы (Convertio, OnlineOCR, iLovePDF)

Если Word не справляется или его нет под рукой, используйте облачные конвертеры. Они часто используют более мощные алгоритмы распознавания и лучше сохраняют структуру документа.

Популярные сервисы

СервисЛимиты бесплатноОсобенности
OnlineOCR.netДо 15 МБ, 10 файлов/часОтлично сохраняет таблицы и разметку. Поддерживает русский язык.
ConvertioФайлы до 100 МБУдобный интерфейс, поддержка множества форматов ввода (JPG, PNG, TIFF).
iLovePDF / SmallpdfОграниченное кол-во задач в деньПростые инструменты, часто требуют подписку для продвинутых функций OCR.

Общий алгоритм действий:

  1. Зайдите на сайт сервиса (например, OnlineOCR.net).
  2. Загрузите файл PDF или изображение (JPG/PNG).
  3. Важно: В настройках языка обязательно выберите Russian (Русский). По умолчанию часто стоит English, что приведет к «кракозябрам».
  4. Выберите формат вывода: Microsoft Word (docx).
  5. Нажмите кнопку «Конвертировать» или «Распознать».
  6. Скачайте готовый файл.

Безопасность: Не загружайте в онлайн-конвертеры документы с персональными данными (паспорта, финансовые отчеты, договоры с конфиденциальной информацией). Используйте офлайн-методы (Word или спецсофт).

Способ 3. Профессиональное ПО (ABBYY FineReader PDF)

Для регулярной работы, больших объемов или сложных макетов (журналы, газеты, книги с колонками) золотым стандартом остается ABBYY FineReader PDF. Это программа устанавливается на компьютер.

Почему это лучший выбор:

  • Высочайшая точность распознавания русского языка (разработчик российский).
  • Умное сохранение форматирования: таблицы остаются таблицами, шрифты подбираются автоматически.
  • Возможность исправления ошибок в специальном редакторе перед сохранением.
  • Пакетная обработка (сотни файлов за раз).

Как использовать:

  1. Откройте ABBYY FineReader.
  2. Перетащите файл в окно программы.
  3. Убедитесь, что в панели языков выбран Русский.
  4. Нажмите кнопку Преобразовать в Microsoft Word.
  5. Проверьте результат в окне предпросмотра и сохраните файл.

Программа платная, но есть пробный период (обычно 14 дней), которого хватит для разовой крупной задачи.

Способ 4. Мобильные приложения (Android и iOS)

Если документ лежит в виде фото в телефоне, удобнее всего обработать его прямо на устройстве.

Рекомендуемые приложения:

  • Microsoft Lens (Office Lens): Бесплатное приложение от Microsoft. Сканирует документ, выравнивает его, распознает текст и позволяет отправить сразу в Word.
  • Adobe Scan: Создает качественный PDF с поиском, который потом можно экспортировать.
  • CamScanner / FineReader for Mobile: Имеют встроенные функции OCR (часто требуют подписку для экспорта в Word).

Совет по съемке: Чтобы распознавание прошло успешно, фотографируйте документ при хорошем освещении, держа телефон параллельно листу. Избегайте теней от рук и бликов.

Как улучшить качество распознавания (Чек-лист)

Даже самая дорогая программа ошибется, если исходник плохого качества. Перед конвертацией проверьте файл:

  1. Разрешение (DPI): Оптимально — 300 dpi. Менее 150 dpi可能导致 мелкие буквы сольются. Более 600 dpi излишне и замедляет работу.
  2. Контрастность: Текст должен быть черным, фон — белым. Если фон серый или цветной, используйте фильтры «Черно-белый» или «Увеличение контраста» в графическом редакторе перед OCR.
  3. Ориентация: Страницы должны стоять ровно. Перевернутый текст многие сервисы не распознают.
  4. Чистота: Уберите пятна, скрепки и края стола из кадра. Лишние детали сбивают алгоритм с толку.

Частые ошибки и решения

ПроблемаПричинаРешение
Вместо текста «иероглифы» или бессвязные буквыНе выбран русский язык в настройках OCRПерезапустите конвертацию, выбрав язык Russian.
Текст распознался, но слился в одну строку без абзацевНизкое качество скана или сложный макетПопробуйте ABBYY FineReader или вручную расставьте разрывы строк в Word.
Word выдает ошибку при открытии PDFФайл поврежден или защищен паролемСнимите пароль с PDF (если знаете его) или используйте онлайн-конвертер.
Таблицы «поехали» и разъехались по ячейкамСложная структура таблицы без видимых границИспользуйте OnlineOCR.net (он лучше работает с таблицами) или пересоберите таблицу в Word вручную.

FAQ: Вопросы и ответы

Можно ли распознать рукописный текст? Стандартные OCR-системы (Word, Convertio, ABBYY) плохо справляются с почерком. Для этого нужны нейросети с ИИ (например, специализированные сервисы вроде Handwriting.io или функции в некоторых мобильных приложениях для заметок), но точность все равно будет ниже, чем с печатным текстом.

Бесплатно ли распознавать текст в Google Диске? Да. Загрузите PDF или JPG на Google Диск, нажмите правой кнопкой мыши → Открыть с помощьюGoogle Документы. Google выполнит OCR и откроет файл с текстом. Этот метод полностью бесплатен и достаточно точен, но часто ломает форматирование.

Что делать, если PDF состоит из разных ориентаций страниц (альбомная/портретная)? Онлайн-сервисы обычно обрабатывают каждую страницу независимо. В Microsoft Word могут возникнуть сбои. Лучше всего предварительно разделить такой PDF на части или использовать ABBYY FineReader, который корректно определяет ориентацию каждой страницы отдельно.

Сохраняются ли картинки при конвертации? Да, большинство современных конвертеров (Word, ABBYY, OnlineOCR) оставляют иллюстрации в документе. Однако они могут сместиться относительно текста. После конвертации всегда проверяйте расположение изображений.