Как убрать искажения символов и выбрать правильную кодировку в Word

Иван Корнев·09.05.2026·4 мин

Убрать «кракозябры» поможет «Файл» → «Открыть» → «Обзор» → тип «Кодировка текста». Выберите UTF-8 или Windows-1251. Для открытого файла используйте «Сохранить как». Проблема возникает, когда Microsoft Word пытается прочитать байты файла, закодированные в одном стандарте, как символы другого. Без ручного выбора программа применяет системную кодировку по умолчанию, что ломает кириллицу, если документ создан в Linux, macOS или старых текстовых редакторах.

Оглавление

Почему текст превращается в набор символов

Word по умолчанию использует UTF-16 для внутренних процессов и ориентируется на системную локаль Windows при импорте. Когда вы открываете файл извне, программа сканирует первые байты. Если в файле нет метки BOM (Byte Order Mark) или заголовок отсутствует, Word угадывает стандарт. Неудачное угадывание приводит к замене кириллических символов на латиницу с диакритикой, знаки вопроса или нечитаемые глифы.

Чаще всего конфликтуют два стандарта:

  • UTF-8 — современный универсальный стандарт, поддерживает все языки и эмодзи.
  • Windows-1251 — устаревший, но до сих пор широко используемый в бухгалтерии, госсекторе и старых базах данных для корректного отображения русского алфавита.

Пошаговая инструкция: исправляем отображение при открытии

Не открывайте проблемный файл двойным щелчком. Word сразу применит стандартный декодер и закэширует искажённый текст. Действуйте последовательно:

  1. Запустите пустой документ Word.
  2. Перейдите в ФайлОткрытьОбзор.
  3. В правом нижнем углу диалогового окна измените тип файлов с «Все документы Word» на **Восстановление текста (.txt; .rtf) или Все файлы (.).
  4. Выделите нужный файл и нажмите кнопку Открыть.
  5. Появится окно «Преобразование файла». Выберите пункт Другая кодировка.
  6. В списке найдите Юникод (UTF-8) или Кириллица (Windows-1251). Окно предпросмотра внизу покажет, какой вариант читается корректно.
  7. Нажмите ОК.

Если вы регулярно работаете с файлами из разных сред, включите автоматический запрос кодировки: ФайлПараметрыДополнительно → раздел «Общие» → отметьте «Подтверждать преобразование формата файла при открытии».

Как сохранить файл в нужной кодировке

Для формата .docx кодировка задаётся автоматически (XML внутри архива всегда в UTF-8). Выбор актуален при экспорте в .txt, .csv или .html.

  1. Откройте корректно отображаемый документ.
  2. Нажмите ФайлСохранить как.
  3. Выберите папку и в выпадающем списке формата укажите Обычный текст (*.txt).
  4. Рядом с кнопкой «Сохранить» нажмите СервисВеб-параметры.
  5. Перейдите на вкладку Кодирование и в пункте «Сохранять документы как» выберите Юникод (UTF-8).
  6. Сохраните файл. При появлении окна «Преобразование файла» выберите тот же стандарт, который использовался при открытии.

Сравнение кодировок для русскоязычных документов

КодировкаПоддержка символовГде используетсяСовместимость
UTF-8Все языки, математические знаки, эмодзиСовременный веб, кроссплатформенные скрипты, новые ОСМаксимальная
Windows-1251Кириллица, базовая латиницаСтарые версии Windows, 1С, банковские выпискиВысокая в РФ
KOI8-RКириллицаUnix-системы 90-х, legacy-серверыНизкая
ISO-8859-5КириллицаМеждународные стандарты ISO, архивные документыСредняя

Никогда не переименовывайте расширение .docx в .txt и не открывайте офисные файлы в «Блокноте» с последующим пересохранением. Это ломает внутреннюю ZIP-структуру документа и делает его нечитаемым для Word.

Частые ошибки

  • Попытка исправить «кракозябры» сменой шрифта. Если байты декодированы неверно, замена Arial на Times New Roman или Calibri не вернёт русские буквы. Проблема на уровне сопоставления кодов, а не глифов.
  • Игнорирование предпросмотра. Выбор кодировки вслепую часто приводит к потере части текста. Всегда сверяйтесь с окном предпросмотра в диалоге «Преобразование файла».
  • Двойное кодирование. Сохранение файла в UTF-8, а затем повторный импорт с выбором Windows-1251 создаёт «слоёный пирог» из искажений, который уже не восстановить без исходника.
  • Отсутствие BOM в UTF-8 для старых систем. Некоторые парсеры (Excel, старые ERP) требуют UTF-8 с сигнатурой BOM. В Word это включается в том же окне «Веб-параметры» → галочка «Сохранять сигнатуру UTF-8».

FAQ

Почему в Word нет выбора кодировки для формата .docx? Формат .docx представляет собой упакованный XML-архив, который по спецификации OpenXML всегда хранит текст в UTF-8. Настройка кодировки доступна только для плоских текстовых файлов и веб-страниц.

Как конвертировать старый файл в UTF-8 без потери русских букв? Откройте его через диалог «Преобразование файла», принудительно указав Windows-1251. Убедитесь, что текст в предпросмотре читается верно. Затем используйте «Сохранить как» → TXT/HTML → выберите кодировку UTF-8.

Можно ли изменить кодировку уже открытого документа без сохранения? Нет. Word считывает и декодирует байты только в момент загрузки. Чтобы применить другой стандарт, нужно закрыть файл и открыть его заново через ручное преобразование, либо сохранить копию в нужном формате.

Что делать, если в тексте вместо букв отображаются знаки вопроса (????)? Знаки вопроса означают, что программа не нашла соответствия между байтом и символом в текущей таблице кодировки. Это часто случается при открытии UTF-8 в Windows-1251. Закройте файл и откройте его заново, выбрав UTF-8 в диалоге преобразования.