Делаем сканированный PDF доступным для поиска и редактирования

Иван Корнев·27.05.2026·⏱4 мин

Чтобы сделать скан в PDF «читаемым» (доступным для поиска, выделения и копирования текста), необходимо выполнить процедуру оптического распознавания символов (OCR). Это добавляет невидимый текстовый слой поверх изображения страниц. Быстрее всего это сделать через бесплатные онлайн-сервисы: загрузите файл, выберите язык документа (например, русский) и скачайте результат в формате Searchable PDF.

Что такое Searchable PDF и зачем он нужен

Обычный скан — это просто набор фотографий страниц. Компьютер «видит» их как картинки: вы не можете найти слово через Ctrl+F, скопировать фрагмент или озвучить текст скринридером.

OCR (Optical Character Recognition) анализирует изображение, находит буквы и слова, а затем создает под ними текстовый слой. Визуально документ не меняется, но функционально становится полноценным электронным файлом.

Как проверить, нужен ли вашему файлу OCR? Откройте PDF и попробуйте выделить мышкой любое слово. Если курсор не меняется на текстовый, а выделяется вся страница или ничего не происходит — перед вами чистый скан, требующий распознавания.

Лучшие онлайн-сервисы для OCR

Большинство современных конвертеров работают по схожему принципу, но отличаются лимитами и качеством движка распознавания.

Сравнение популярных инструментов

Сервис	Плюсы	Ограничения
Adobe Acrobat Online	Высокое качество распознавания, сохранение сложной верстки.	Требует входа в аккаунт для скачивания, есть лимиты на бесплатное использование.
Smallpdf / iLovePDF	Интуитивный интерфейс, быстрая обработка, поддержка русского языка.	Лимит на размер файла (обычно до 5–15 МБ) и количество задач в день.
OCR.space	Специализированный движок, хорошо работает со сложными фонами.	Интерфейс проще, может быть медленнее при больших объемах.
AvePDF	Хорошая работа с многостраничными документами.	Наличие рекламы на странице загрузки.

Для документов на русском языке критически важно вручную выбрать язык распознавания (Russian или Russian + English). Режим «Автоопределение» часто ошибается, принимая кириллицу за похожие латинские символы.

Пошаговая инструкция: как распознать текст онлайн

Процесс занимает менее минуты для стандартного документа.

Подготовьте файл. Убедитесь, что скан четкий, без сильных перекосов и теней.
Выберите сервис. Перейдите на сайт (например, Smallpdf, iLovePDF или Adobe Online OCR).
Загрузите PDF. Перетащите файл в рабочую область или выберите через кнопку «Загрузить».
Настройте параметры.
- Выберите язык документа (обязательно укажите русский, если текст на нем).
- Если есть опция, выберите режим «С сохранением оригинального вида» (Searchable PDF), а не «Только текст».
Запустите обработку. Нажмите кнопку «Распознать» или «Конвертировать».
Скачайте результат. Сохраните новый файл и откройте его для проверки.

Как повысить точность распознавания

Качество результата на 80% зависит от исходного скана, а не только от сервиса.

Разрешение (DPI). Оптимально — 300 dpi. Если скан сделан на телефон, убедитесь, что фото не размыто.
Контрастность. Текст должен быть черным, фон — белым. Избегайте серых теней от пальцев или переплета книги.
Ориентация. Страницы должны стоять ровно. Если скан перевернут или повернут на 90 градусов, большинство сервисов распознают его некорректно.
Шрифты. Стандартные печатные шрифты распознаются идеально. Рукописный текст, факсимильные подписи или декоративные шрифты часто дают сбои.

Конфиденциальность данных Не загружайте в бесплатные онлайн-сервисы документы с паспортными данными, банковской тайной или коммерческой информацией. Файлы временно хранятся на сторонних серверах. Для таких задач используйте офлайн-программы (ABBYY FineReader, Adobe Acrobat Pro) или встроенные средства ОС.

Частые ошибки при OCR

Игнорирование выбора языка. Распознавание английского текста как русского (или наоборот) приводит к замене букв на «кракозябры» (например, о на o, р на p).
Попытка распознать фото низкого качества. Если текст на фото не читает человеческий глаз, компьютер тем более не справится.
Выбор формата TXT вместо PDF. Если вам нужно сохранить таблицы, колонтитулы и расположение абзацев, выбирайте формат Searchable PDF. Экспорт в TXT или Word часто ломает верстку сложных документов.

FAQ

Можно ли распознать текст бесплатно и без регистрации?

Да, сервисы вроде OCR.space, Smallpdf (с ограничениями) и iLovePDF позволяют обработать несколько файлов в день без оплаты и создания аккаунта.

Почему после OCR текст выделяется, но поиск не работает?

Возможно, текстовый слой был добавлен некорректно или кодировка символов нарушена. Попробуйте другой сервис или пересохраните файл через «Печать в PDF» после открытия в браузере.

Распознает ли онлайн-OCR рукописный текст?

Большинство бесплатных онлайн-инструментов плохо справляются с почерком. Для рукописных заметок лучше использовать специализированные приложения (например, Microsoft Lens или OneNote), которые используют нейросети для анализа почерка.

Что делать, если файл весит больше 50 МБ?

Бесплатные онлайн-сервисы часто имеют лимит на размер. Разделите большой PDF на части с помощью любого splitter’а, обработайте каждую часть отдельно, а затем объедините их обратно в один файл.