Делаем сканированный PDF доступным для поиска и редактирования

Иван Корнев·27.05.2026·4 мин

Чтобы сделать скан в PDF «читаемым» (доступным для поиска, выделения и копирования текста), необходимо выполнить процедуру оптического распознавания символов (OCR). Это добавляет невидимый текстовый слой поверх изображения страниц. Быстрее всего это сделать через бесплатные онлайн-сервисы: загрузите файл, выберите язык документа (например, русский) и скачайте результат в формате Searchable PDF.

Что такое Searchable PDF и зачем он нужен

Обычный скан — это просто набор фотографий страниц. Компьютер «видит» их как картинки: вы не можете найти слово через Ctrl+F, скопировать фрагмент или озвучить текст скринридером.

OCR (Optical Character Recognition) анализирует изображение, находит буквы и слова, а затем создает под ними текстовый слой. Визуально документ не меняется, но функционально становится полноценным электронным файлом.

Как проверить, нужен ли вашему файлу OCR? Откройте PDF и попробуйте выделить мышкой любое слово. Если курсор не меняется на текстовый, а выделяется вся страница или ничего не происходит — перед вами чистый скан, требующий распознавания.

Лучшие онлайн-сервисы для OCR

Большинство современных конвертеров работают по схожему принципу, но отличаются лимитами и качеством движка распознавания.

Сравнение популярных инструментов

СервисПлюсыОграничения
Adobe Acrobat OnlineВысокое качество распознавания, сохранение сложной верстки.Требует входа в аккаунт для скачивания, есть лимиты на бесплатное использование.
Smallpdf / iLovePDFИнтуитивный интерфейс, быстрая обработка, поддержка русского языка.Лимит на размер файла (обычно до 5–15 МБ) и количество задач в день.
OCR.spaceСпециализированный движок, хорошо работает со сложными фонами.Интерфейс проще, может быть медленнее при больших объемах.
AvePDFХорошая работа с многостраничными документами.Наличие рекламы на странице загрузки.

Для документов на русском языке критически важно вручную выбрать язык распознавания (Russian или Russian + English). Режим «Автоопределение» часто ошибается, принимая кириллицу за похожие латинские символы.

Пошаговая инструкция: как распознать текст онлайн

Процесс занимает менее минуты для стандартного документа.

  1. Подготовьте файл. Убедитесь, что скан четкий, без сильных перекосов и теней.
  2. Выберите сервис. Перейдите на сайт (например, Smallpdf, iLovePDF или Adobe Online OCR).
  3. Загрузите PDF. Перетащите файл в рабочую область или выберите через кнопку «Загрузить».
  4. Настройте параметры.
    • Выберите язык документа (обязательно укажите русский, если текст на нем).
    • Если есть опция, выберите режим «С сохранением оригинального вида» (Searchable PDF), а не «Только текст».
  5. Запустите обработку. Нажмите кнопку «Распознать» или «Конвертировать».
  6. Скачайте результат. Сохраните новый файл и откройте его для проверки.

Как повысить точность распознавания

Качество результата на 80% зависит от исходного скана, а не только от сервиса.

  • Разрешение (DPI). Оптимально — 300 dpi. Если скан сделан на телефон, убедитесь, что фото не размыто.
  • Контрастность. Текст должен быть черным, фон — белым. Избегайте серых теней от пальцев или переплета книги.
  • Ориентация. Страницы должны стоять ровно. Если скан перевернут или повернут на 90 градусов, большинство сервисов распознают его некорректно.
  • Шрифты. Стандартные печатные шрифты распознаются идеально. Рукописный текст, факсимильные подписи или декоративные шрифты часто дают сбои.

Конфиденциальность данных Не загружайте в бесплатные онлайн-сервисы документы с паспортными данными, банковской тайной или коммерческой информацией. Файлы временно хранятся на сторонних серверах. Для таких задач используйте офлайн-программы (ABBYY FineReader, Adobe Acrobat Pro) или встроенные средства ОС.

Частые ошибки при OCR

  1. Игнорирование выбора языка. Распознавание английского текста как русского (или наоборот) приводит к замене букв на «кракозябры» (например, о на o, р на p).
  2. Попытка распознать фото низкого качества. Если текст на фото не читает человеческий глаз, компьютер тем более не справится.
  3. Выбор формата TXT вместо PDF. Если вам нужно сохранить таблицы, колонтитулы и расположение абзацев, выбирайте формат Searchable PDF. Экспорт в TXT или Word часто ломает верстку сложных документов.

FAQ

Можно ли распознать текст бесплатно и без регистрации?

Да, сервисы вроде OCR.space, Smallpdf (с ограничениями) и iLovePDF позволяют обработать несколько файлов в день без оплаты и создания аккаунта.

Почему после OCR текст выделяется, но поиск не работает?

Возможно, текстовый слой был добавлен некорректно или кодировка символов нарушена. Попробуйте другой сервис или пересохраните файл через «Печать в PDF» после открытия в браузере.

Распознает ли онлайн-OCR рукописный текст?

Большинство бесплатных онлайн-инструментов плохо справляются с почерком. Для рукописных заметок лучше использовать специализированные приложения (например, Microsoft Lens или OneNote), которые используют нейросети для анализа почерка.

Что делать, если файл весит больше 50 МБ?

Бесплатные онлайн-сервисы часто имеют лимит на размер. Разделите большой PDF на части с помощью любого splitter’а, обработайте каждую часть отдельно, а затем объедините их обратно в один файл.