Как перевести обычный PDF в формат PDF/A-1
Чтобы конвертировать PDF в PDF/A-1 для сдачи в архив или госорганы, необходимо обеспечить полную самодостаточность файла: встроить все шрифты, удалить интерактивные элементы (JavaScript, видео), добавить корректные метаданные и выполнить OCR (распознавание текста) для сканов. Готовый файл должен успешно проходить валидацию по стандарту ISO 19005-1 с помощью специализированного ПО, такого как Adobe Acrobat Pro, ABBYY FineReader или бесплатного инструмента veraPDF.
Краткий ответ: Используйте функцию «Сохранить как другой PDF» → «PDF с поддержкой поиска (OCR)» или «Архивный PDF (PDF/A)» в Adobe Acrobat Pro. Для бесплатной конвертации подойдет связка Ghostscript + проверка через veraPDF.
Если статья длиннее 3000 знаков, автоматически добавь перед первым H2:
Оглавление
Что такое PDF/A-1 и почему его требуют
PDF/A-1 (ISO 19005-1) — это специализированный подформат PDF, созданный исключительно для долгосрочного хранения электронных документов. Главная особенность формата — запрет на любые зависимости от внешнего окружения.
Государственные органы и архивы требуют этот формат, потому что он гарантирует, что документ откроется и будет выглядеть идентично оригиналу через 10, 20 или 50 лет, независимо от того, какие операционные системы и шрифты будут установлены у пользователя в будущем.
Ключевые отличия от обычного PDF
| Параметр | Обычный PDF | PDF/A-1 |
|---|---|---|
| Шрифты | Могут ссылаться на системные шрифты | Все шрифты должны быть встроены в файл |
| Цвет | Любые цветовые профили | Только DeviceRGB, DeviceCMYK или DeviceGray |
| Интерактивность | JavaScript, видео, аудио, формы | Запрещены полностью |
| Шифрование | Возможно | Запрещено (файл должен быть открытым) |
| Метаданные | Опциональны | Обязательны (XMP-пакет) |
Существует два уровня соответствия внутри стандарта PDF/A-1:
- PDF/A-1b (Basic) — гарантирует визуальное сохранение документа. Самый распространенный вариант для бухгалтерии и архивов.
- PDF/A-1a (Accessible) — включает требования 1b, но также требует логической структуры документа (теги) для доступности людям с ограниченными возможностями. Требуется реже, обычно для публичных отчетов.
Инструменты для конвертации
Выбор инструмента зависит от объема задач и бюджета. Для работы с гостайной или персональными данными используйте только локальное ПО.
Платные решения (рекомендуется для бизнеса)
- Adobe Acrobat Pro DC. Золотой стандарт индустрии. Позволяет конвертировать в PDF/A-1 в пару кликов, автоматически встраивает шрифты и выполняет OCR. Имеет встроенный препфлайт-анализатор для поиска ошибок.
- ABBYY FineReader PDF. Лучший выбор для оцифрованных бумажных документов. Качественно распознает текст (OCR) и сохраняет результат в PDF/A-1b, сохраняя верстку.
Бесплатные и Open Source решения
- Ghostscript. Мощная консольная утилита. Требует навыков работы с командной строкой, но позволяет гибко настраивать параметры конвертации. Идеальна для пакетной обработки тысяч файлов через скрипты.
- LibreOffice Draw. Может открывать PDF и экспортировать их как PDF/A, хотя качество сохранения сложной верстки может уступать платным аналогам.
- Online-конвертеры. Не рекомендуются для документов с конфиденциальной информацией из-за рисков утечки данных при загрузке на чужие серверы.
Важно: Никогда не используйте бесплатные онлайн-сервисы для конвертации паспортов, договоров, налоговой отчетности и других документов, содержащих персональные данные.
Пошаговая инструкция
Рассмотрим процесс на примере самого надежного пути — использования Adobe Acrobat Pro, а также альтернативный вариант для сканов.
Шаг 1. Подготовка исходного файла
Откройте документ. Если это скан изображения без текстового слоя, сразу переходите к шагу OCR. Если это электронный документ (из Word, Excel), убедитесь, что в нем нет скрытых макросов или внешних ссылок на файлы, которые могут нарушить целостность.
Шаг 2. Распознавание текста (OCR)
Для архива критически важно, чтобы документ был машиночитаемым.
- В Adobe Acrobat: выберите
Инструменты→Распознавание текста→В этом файле. Выберите язык документа. - В ABBYY FineReader: откройте файл, дождитесь автоматического распознавания, проверьте качество текста в режиме «Правка» и нажмите
Сохранить.
Шаг 3. Конвертация в PDF/A-1
В Adobe Acrobat Pro:
- Нажмите
Файл→Сохранить как другой→Архивный PDF (PDF/A). - В настройках выберите стандарт PDF/A-1b (или 1a, если требуется).
- Нажмите
Сохранить. Программа автоматически внедрит шрифты и удалит запрещенные элементы.
В Ghostscript (для продвинутых пользователей):
Используйте команду вида:
gs -dPDFA=1 -dBATCH -dNOPAUSE -sColorConversionStrategy=UseDeviceIndependentColor -sDEVICE=pdfwrite -sOutputFile=output.pdf input.pdf
(Параметры могут варьироваться в зависимости от версии Ghostscript и требований к цвету).
Шаг 4. Проверка метаданных
Стандарт PDF/A требует наличия XMP-метаданных.
- Убедитесь, что заполнены поля:
Заголовок,Автор,Тема,Ключевые слова. - В Adobe Acrobat это можно проверить через
Файл→Свойства→Дополнительно→Метаданные PDF.
Шаг 5. Валидация (Проверка соответствия)
Даже после конвертации файл нужно проверить на ошибки.
- Используйте бесплатный инструмент veraPDF (разработан консорциумом PDF Association). Он покажет точный список нарушений стандарта, если они есть.
- В Adobe Acrobat используйте инструмент
Префлайт(Preflight) и профиль «Проверить соответствие PDF/A-1b».
Частые ошибки при подготовке
- Невстроенные шрифты. Самая частая ошибка. Если шрифт не встроен, на компьютере инспектора он заменится на другой, и документ будет выглядеть иначе. Всегда проверяйте вкладку «Шрифты» в свойствах PDF — там не должно быть пометок «Не встроен» или «Subset» без полного набора глифов.
- Прозрачность. PDF/A-1 не поддерживает прозрачность объектов. При конвертации прозрачные элементы должны быть сплющены (flattened). Если этого не сделать, валидатор выдаст ошибку.
- RGB/CMYK конфликты. Некоторые госорганы требуют строго CMYK для печати, другие допускают RGB. Уточните требования принимающей стороны. PDF/A-1 поддерживает оба пространства, но они не должны смешиваться хаотично.
- Отсутствие тегов структуры (для PDF/A-1a). Если вы выбрали уровень «A», но не создали теги заголовков и абзацев, файл не пройдет проверку. Для уровня «B» это не требуется.
Чек-лист перед отправкой
Перед тем как отправить документ в государственную информационную систему (ГИС) или архив, пройдитесь по пунктам:
- [ ] Файл открывается и читается без искажений.
- [ ] Весь текст распознан (можно выделить и скопировать любой фрагмент).
- [ ] Все шрифты встроены в файл.
- [ ] Отсутствуют JavaScript, видео, аудио и внешние ссылки.
- [ ] Заполнены базовые метаданные (Автор, Название).
- [ ] Файл успешно прошел проверку в валидаторе (veraPDF или встроенном средстве редактора) без ошибок уровня «Fatal» или «Error».
- [ ] Размер файла оптимизирован (нет избыточного разрешения изображений, если это не требуется по закону).
FAQ
В чем разница между PDF/A-1, PDF/A-2 и PDF/A-3? PDF/A-1 — самый строгий и старый стандарт, основанный на PDF 1.4. PDF/A-2 поддерживает прозрачность и слои. PDF/A-3 позволяет внедрять в PDF файлы любых других форматов (например, исходный Excel внутрь PDF). Госорганы РФ чаще всего требуют именно PDF/A-1 или PDF/A-2, так как они наиболее стабильны. Всегда уточняйте актуальные требования в методических рекомендациях конкретного ведомства.
Можно ли защитить PDF/A паролем? Нет. Стандарт PDF/A запрещает шифрование и установку паролей на открытие или редактирование, так как это может препятствовать долгосрочному доступу к информации в будущем, если ключи будут утеряны.
Что делать, если валидатор выдает ошибку «Transparency used»? Это значит, в документе есть полупрозрачные объекты. В Adobe Acrobat используйте инструмент «Префлайт» → «Исправить» → «Преобразовать в PDF/A-1b», программа автоматически сплющит прозрачность. В других редакторах может потребоваться экспорт в изображение и обратная сборка PDF, что ухудшит качество текста.