Превращаем разрозненные сканы в умный PDF-документ

Иван Корнев·26.05.2026·⏱6 мин

Чтобы преобразовать набор сканов (изображений JPG/PNG) в единый PDF-файл с распознаванием текста (OCR), необходимо выполнить два этапа: объединение файлов в правильном порядке и запуск оптического распознавания символов. Быстрый способ для большинства пользователей — использовать встроенные средства ОС (например, «Печать в PDF» в Windows или «Быстрые действия» в macOS) для сборки файла, а затем бесплатный инструмент вроде NAPS2 или онлайн-сервисы для наложения текстового слоя. Это делает документ searchable (доступным для поиска) и позволяет копировать текст.

Зачем объединять сканы и включать OCR

Разрозненные изображения неудобны для хранения и отправки. Единый PDF-файл решает эти проблемы, а технология OCR (Optical Character Recognition) добавляет документам функциональность:

Поиск по содержимому. Вы сможете найти нужную фразу через Ctrl+F, даже если исходник был картинкой.
Копирование текста. Возможность быстро перенести данные из скана в Word или Excel без ручного перепечатывания.
Уменьшение объема. Современные алгоритмы сжатия в PDF часто эффективнее, чем хранение десятков тяжелых PNG/JPG файлов.
Архивация. Один файл проще индексировать в облачных хранилищах и базах знаний.

Важно: Качество распознавания напрямую зависит от качества исходного скана. Размытый текст или низкое разрешение сведут на нет усилия даже самого мощного OCR-движка.

Подготовка исходных материалов

Перед конвертацией убедитесь, что ваши файлы готовы к обработке. Это сэкономит время на исправление ошибок потом.

Единый формат. Приведите все файлы к одному расширению (лучше всего JPG или PNG).
Читаемость. Убедитесь, что текст четкий, без сильных теней и засветов.
Ориентация. Все страницы должны быть повернуты правильно (текст идет слева направо, сверху вниз).
Именование. Для удобства сортировки переименуйте файлы по порядку: 01.jpg, 02.jpg, 03.jpg и т.д.

Способ 1: Бесплатные программы для ПК (Рекомендуемый)

Самый надежный и безопасный способ, особенно для конфиденциальных документов.

NAPS2 (Not Another PDF Scanner 2)

Это бесплатная утилита с открытым исходным кодом, которая отлично работает как со сканерами, так и с уже готовыми файлами изображений.

Скачайте и установите NAPS2.
Нажмите кнопку Import (Импорт) и выберите ваши изображения.
Перетащите миниатюры мышкой, чтобы выстроить правильный порядок страниц.
Нажмите кнопку OCR в верхней панели.
- В настройках выберите язык документа (например, Russian + English).
- Дождитесь завершения процесса (индикатор прогресса).
Нажмите Save PDF. Выберите путь сохранения.

Результат: один PDF-файл, в котором поверх картинок лежит невидимый текстовый слой.

Adobe Acrobat Pro (Платный, профессиональный)

Если у вас есть подписка на Adobe Creative Cloud или Acrobat Pro:

Откройте Acrobat, выберите Инструменты → Объединить файлы.
Добавьте все изображения. Отсортируйте их.
Нажмите Объединить.
В полученном файле выберите Инструменты → Распознать текст → В этом файле.
Выберите язык и нажмите Распознать текст.

Способ 2: Встроенные средства ОС (Без установки ПО)

Windows 10/11

В Windows нет встроенного качественного OCR «из коробки» для готовых картинок, но можно быстро собрать PDF:

Выделите все изображения в папке.
Нажмите правой кнопкой мыши → Печать.
В выборе принтера укажите Microsoft Print to PDF.
Сохраните файл.
Для OCR: Полученный файл нужно открыть в стороннем приложении (например, бесплатном FineReader Online или том же NAPS2), так как стандартный просмотрщик Windows не создает поисковый слой.

macOS (Preview / Просмотр)

macOS имеет мощные встроенные инструменты.

Выделите все изображения в Finder.
Нажмите правой кнопкой → Быстрые действия → Создать PDF.
Откройте полученный PDF в приложении Просмотр (Preview).
Нажмите Cmd+A (выделить все страницы слева), затем Cmd+C и Cmd+V, если нужно перегруппировать.
Для OCR: В новых версиях macOS (Ventura и новее) поиск по изображениям работает автоматически благодаря системе Live Text. Если у вас старая версия, используйте функцию Экспорт с выбором формата PDF и проверкой настроек Quartz Filter, либо воспользуйтесь онлайн-инструментами.

Лайфхак для Mac: Если вы используете macOS Sonoma или новее, просто откройте PDF в Preview. Попробуйте выделить текст мышкой. Если выделяется — OCR сработал автоматически на уровне системы. Если нет — используйте онлайн-конвертеры.

Способ 3: Онлайн-сервисы (Быстро, но с осторожностью)

Подходит для неконфиденциальных документов. Популярные сервисы: iLovePDF, Smallpdf, ABBYY FineReader Online.

Зайдите на сайт сервиса (раздел «JPG в PDF» или «OCR PDF»).
Загрузите файлы.
Выберите опцию Распознавание текста (OCR) и укажите язык.
Скачайте готовый файл.

Безопасность данных: Никогда не загружайте в онлайн-конвертеры паспорта, финансовые отчеты, договоры с персональными данными или коммерческую тайну. Используйте только офлайн-программы (Способ 1) для таких документов.

Способ 4: Смартфон (iOS и Android)

Современные телефоны позволяют сделать всю работу «на лету».

iOS (Заметки / Файлы):
1. Откройте приложение Заметки, создайте новую.
2. Нажмите иконку камеры → Сканировать документы.
3. Отснимите все страницы. Приложение автоматически обрежет лишнее и улучшит контраст.
4. Сохраните. Полученный PDF в iOS автоматически поддерживает поиск (Live Text).
Android (Google Диск / Microsoft Lens):
1. В приложении Google Диск нажмите «+» → Сканировать.
2. Сделайте фото страниц.
3. Сохраните как PDF. Google автоматически применяет OCR к документам в своем облаке, делая их searchable через поиск по Диску.

Таблица сравнения методов

Метод	Качество OCR	Безопасность	Сложность	Стоимость
NAPS2 (Windows/Mac)	Высокое	Максимальная	Средняя	Бесплатно
Adobe Acrobat Pro	Очень высокое	Максимальная	Низкая	Платно
macOS Preview	Среднее/Высокое*	Максимальная	Низкая	Бесплатно
Онлайн-сервисы	Среднее	Низкая	Очень низкая	Freemium
Смартфон (iOS/Android)	Хорошее	Средняя	Низкая	Бесплатно

*Зависит от версии macOS.

Частые ошибки при создании PDF с OCR

Неверный язык распознавания. Если документ на русском, а в настройках OCR выбран английский, качество распознавания упадет до 10–20%. Всегда проверяйте язык.
Низкое разрешение скана. Разрешение ниже 150–200 DPI делает буквы неразборчивыми для машины. Оптимально: 300 DPI.
Игнорирование порядка страниц. После объединения всегда пролистывайте файл. Часто страницы оказываются перепутаны или перевернуты вверх ногами.
Попытка распознать рукописный текст. Стандартный OCR плохо работает с почерком. Для рукописных заметок нужны специализированные нейросети (например, в современных смартфонах), но результат все равно требует проверки.

FAQ

Можно ли редактировать текст в таком PDF? Стандартный OCR создает невидимый текстовый слой поверх картинки. Вы можете копировать текст, но не менять его прямо в PDF. Чтобы редактировать, нужно конвертировать PDF в Word (это делают те же Adobe Acrobat или FineReader), внести правки и сохранить обратно.

Почему поиск не находит слова, хотя я включил OCR? Возможно, была выбрана неверная кодировка или язык. Также проблема может быть в слишком декоративном шрифте оригинала или плохом качестве скана. Попробуйте пересохранить файл с другими настройками OCR.

Как уменьшить размер итогового PDF? При сохранении выбирайте опцию «Сжатие изображений» или «Black and White» (если документ черно-белый и текстовый). Это может уменьшить вес файла в 5–10 раз без потери читаемости текста.

Безопасно ли использовать бесплатные онлайн-конвертеры? Для публичных документов (брошюры, меню, старые книги) — да. Для личных данных — нет. Большинство сервисов удаляют файлы через несколько часов, но гарантий полной конфиденциальности они обычно не дают.