Превращаем разрозненные сканы в умный PDF-документ

Иван Корнев·26.05.2026·6 мин

Чтобы преобразовать набор сканов (изображений JPG/PNG) в единый PDF-файл с распознаванием текста (OCR), необходимо выполнить два этапа: объединение файлов в правильном порядке и запуск оптического распознавания символов. Быстрый способ для большинства пользователей — использовать встроенные средства ОС (например, «Печать в PDF» в Windows или «Быстрые действия» в macOS) для сборки файла, а затем бесплатный инструмент вроде NAPS2 или онлайн-сервисы для наложения текстового слоя. Это делает документ searchable (доступным для поиска) и позволяет копировать текст.

Зачем объединять сканы и включать OCR

Разрозненные изображения неудобны для хранения и отправки. Единый PDF-файл решает эти проблемы, а технология OCR (Optical Character Recognition) добавляет документам функциональность:

  • Поиск по содержимому. Вы сможете найти нужную фразу через Ctrl+F, даже если исходник был картинкой.
  • Копирование текста. Возможность быстро перенести данные из скана в Word или Excel без ручного перепечатывания.
  • Уменьшение объема. Современные алгоритмы сжатия в PDF часто эффективнее, чем хранение десятков тяжелых PNG/JPG файлов.
  • Архивация. Один файл проще индексировать в облачных хранилищах и базах знаний.

Важно: Качество распознавания напрямую зависит от качества исходного скана. Размытый текст или низкое разрешение сведут на нет усилия даже самого мощного OCR-движка.

Подготовка исходных материалов

Перед конвертацией убедитесь, что ваши файлы готовы к обработке. Это сэкономит время на исправление ошибок потом.

  1. Единый формат. Приведите все файлы к одному расширению (лучше всего JPG или PNG).
  2. Читаемость. Убедитесь, что текст четкий, без сильных теней и засветов.
  3. Ориентация. Все страницы должны быть повернуты правильно (текст идет слева направо, сверху вниз).
  4. Именование. Для удобства сортировки переименуйте файлы по порядку: 01.jpg, 02.jpg, 03.jpg и т.д.

Способ 1: Бесплатные программы для ПК (Рекомендуемый)

Самый надежный и безопасный способ, особенно для конфиденциальных документов.

NAPS2 (Not Another PDF Scanner 2)

Это бесплатная утилита с открытым исходным кодом, которая отлично работает как со сканерами, так и с уже готовыми файлами изображений.

  1. Скачайте и установите NAPS2.
  2. Нажмите кнопку Import (Импорт) и выберите ваши изображения.
  3. Перетащите миниатюры мышкой, чтобы выстроить правильный порядок страниц.
  4. Нажмите кнопку OCR в верхней панели.
    • В настройках выберите язык документа (например, Russian + English).
    • Дождитесь завершения процесса (индикатор прогресса).
  5. Нажмите Save PDF. Выберите путь сохранения.

Результат: один PDF-файл, в котором поверх картинок лежит невидимый текстовый слой.

Adobe Acrobat Pro (Платный, профессиональный)

Если у вас есть подписка на Adobe Creative Cloud или Acrobat Pro:

  1. Откройте Acrobat, выберите ИнструментыОбъединить файлы.
  2. Добавьте все изображения. Отсортируйте их.
  3. Нажмите Объединить.
  4. В полученном файле выберите ИнструментыРаспознать текстВ этом файле.
  5. Выберите язык и нажмите Распознать текст.

Способ 2: Встроенные средства ОС (Без установки ПО)

Windows 10/11

В Windows нет встроенного качественного OCR «из коробки» для готовых картинок, но можно быстро собрать PDF:

  1. Выделите все изображения в папке.
  2. Нажмите правой кнопкой мыши → Печать.
  3. В выборе принтера укажите Microsoft Print to PDF.
  4. Сохраните файл.
  5. Для OCR: Полученный файл нужно открыть в стороннем приложении (например, бесплатном FineReader Online или том же NAPS2), так как стандартный просмотрщик Windows не создает поисковый слой.

macOS (Preview / Просмотр)

macOS имеет мощные встроенные инструменты.

  1. Выделите все изображения в Finder.
  2. Нажмите правой кнопкой → Быстрые действияСоздать PDF.
  3. Откройте полученный PDF в приложении Просмотр (Preview).
  4. Нажмите Cmd+A (выделить все страницы слева), затем Cmd+C и Cmd+V, если нужно перегруппировать.
  5. Для OCR: В новых версиях macOS (Ventura и новее) поиск по изображениям работает автоматически благодаря системе Live Text. Если у вас старая версия, используйте функцию Экспорт с выбором формата PDF и проверкой настроек Quartz Filter, либо воспользуйтесь онлайн-инструментами.

Лайфхак для Mac: Если вы используете macOS Sonoma или новее, просто откройте PDF в Preview. Попробуйте выделить текст мышкой. Если выделяется — OCR сработал автоматически на уровне системы. Если нет — используйте онлайн-конвертеры.

Способ 3: Онлайн-сервисы (Быстро, но с осторожностью)

Подходит для неконфиденциальных документов. Популярные сервисы: iLovePDF, Smallpdf, ABBYY FineReader Online.

  1. Зайдите на сайт сервиса (раздел «JPG в PDF» или «OCR PDF»).
  2. Загрузите файлы.
  3. Выберите опцию Распознавание текста (OCR) и укажите язык.
  4. Скачайте готовый файл.

Безопасность данных: Никогда не загружайте в онлайн-конвертеры паспорта, финансовые отчеты, договоры с персональными данными или коммерческую тайну. Используйте только офлайн-программы (Способ 1) для таких документов.

Способ 4: Смартфон (iOS и Android)

Современные телефоны позволяют сделать всю работу «на лету».

  • iOS (Заметки / Файлы):
    1. Откройте приложение Заметки, создайте новую.
    2. Нажмите иконку камеры → Сканировать документы.
    3. Отснимите все страницы. Приложение автоматически обрежет лишнее и улучшит контраст.
    4. Сохраните. Полученный PDF в iOS автоматически поддерживает поиск (Live Text).
  • Android (Google Диск / Microsoft Lens):
    1. В приложении Google Диск нажмите «+» → Сканировать.
    2. Сделайте фото страниц.
    3. Сохраните как PDF. Google автоматически применяет OCR к документам в своем облаке, делая их searchable через поиск по Диску.

Таблица сравнения методов

МетодКачество OCRБезопасностьСложностьСтоимость
NAPS2 (Windows/Mac)ВысокоеМаксимальнаяСредняяБесплатно
Adobe Acrobat ProОчень высокоеМаксимальнаяНизкаяПлатно
macOS PreviewСреднее/Высокое*МаксимальнаяНизкаяБесплатно
Онлайн-сервисыСреднееНизкаяОчень низкаяFreemium
Смартфон (iOS/Android)ХорошееСредняяНизкаяБесплатно

*Зависит от версии macOS.

Частые ошибки при создании PDF с OCR

  1. Неверный язык распознавания. Если документ на русском, а в настройках OCR выбран английский, качество распознавания упадет до 10–20%. Всегда проверяйте язык.
  2. Низкое разрешение скана. Разрешение ниже 150–200 DPI делает буквы неразборчивыми для машины. Оптимально: 300 DPI.
  3. Игнорирование порядка страниц. После объединения всегда пролистывайте файл. Часто страницы оказываются перепутаны или перевернуты вверх ногами.
  4. Попытка распознать рукописный текст. Стандартный OCR плохо работает с почерком. Для рукописных заметок нужны специализированные нейросети (например, в современных смартфонах), но результат все равно требует проверки.

FAQ

Можно ли редактировать текст в таком PDF? Стандартный OCR создает невидимый текстовый слой поверх картинки. Вы можете копировать текст, но не менять его прямо в PDF. Чтобы редактировать, нужно конвертировать PDF в Word (это делают те же Adobe Acrobat или FineReader), внести правки и сохранить обратно.

Почему поиск не находит слова, хотя я включил OCR? Возможно, была выбрана неверная кодировка или язык. Также проблема может быть в слишком декоративном шрифте оригинала или плохом качестве скана. Попробуйте пересохранить файл с другими настройками OCR.

Как уменьшить размер итогового PDF? При сохранении выбирайте опцию «Сжатие изображений» или «Black and White» (если документ черно-белый и текстовый). Это может уменьшить вес файла в 5–10 раз без потери читаемости текста.

Безопасно ли использовать бесплатные онлайн-конвертеры? Для публичных документов (брошюры, меню, старые книги) — да. Для личных данных — нет. Большинство сервисов удаляют файлы через несколько часов, но гарантий полной конфиденциальности они обычно не дают.