Как в консольном приложении отображать русские символы c
Отображаемый текст в консольном приложении на русском языке.
В программе присутствует ввод со стороны пользователя, всё на русском.
Так вот присутствует безысходное состояние когда при использовании cout <<
русский текст отображается отлично если я в кавычках где строка использую русский текст.
Но, там где я использую cin >> и все данные записываю в текстовую переменную после её дальнейшего вывода на экран получается кракозябра,
std::string name;
cout << "Введите ваше имя: " ;
cin >> name;
Что я в результате получаю на экране:
Введите ваше имя: Архис
Ваше имя: @قسKسRسbra
Загвоздка в том, что когда я использую одну функцию в программе не считая мэйна все работает хорошо, но когда подключаю другие функции в которых также присутствуют отображение русского текста то в них получается кракозябра, ниже на скринах я пытался решить эту проблему, и скрины соответствуют полученным отрицательным и "положительным" результатам:
void enter_data()
using namespace std;
string name;
cout << Rus("Введите ваше имя: ");
cin >> name;
cout << name;
>
Но если усложнить программу добавив к примеру хотябы одну функцию где также присутствует русский текст то получаем кракозябру в той функции, можно это увидеть на втором скрине.
Пробуя решить проблему как порядочный начинающий программист добавил в инклуды locale
и в майне прописал setlocale(LC_ALL, "Russian"); результат на 3 скрине
также, пробовал решить проблемму другим способом
удалив setlocale(LC_ALL, "Russian"); но добавив
в результате кракозябра в вводе, и дальнейшем выводе, это можно увидеть на 4-м скрине.
Дальше я пытался поменять значения с 1251 на 866 - результат как на скрине номер два.
Потом я отчаялся полностью и решил совместить SetConsoleCP (1251);
SetConsoleOutputCP(1251); и setlocale(LC_ALL, "Russian"); и даже при этом менял значения с 1251 на 866 результаты отрицательные, или шапка программы отображается не корректно или выводимые символы как на скрине номер 3.
Если у вас есть дельный совет, буду рад услышать, хочу довести эту программу до полной работоспособности.
Заранее спасибо за дельные советы
Модераторы, в подобном вопросе который задавал несколько минут назад перепутал категорию, его пожалуйста удалите
используй SetConsoleCP и SetConsoleOutputCP
без setlocale
установи шрифт консоли Lucida Console или Consolas в настройках консоли
Писал что также использовал раздельно.
Может конечному пользователю еще изобрести велосипед, что бы поехать на моей программе? :)
К сожалению сразу вывод данных в консоль на языке C++ позволяет выводить только английский текст. Для вывода информации на русском языке необходимо настроить некоторые параметры программы. К сожалению не все параметры пока что можно настроить через программный код хотя в будущем я надеюсь что найду решение.
В программе добавляем библиотеку windows.h которая позволяет взаимодействовать с ОС и вызывать определенные системные команды.
Слушающим шагом в главной функции приложения вызываем две функции из библиотеки windows.h
SetConsoleCP (1251); задаем кодировку для вывода символов на экран
SetConsoleOutputCP(1251); задаем кодировку для ввода символов с клавиатуры в консоль
На самом деле можно пользоваться любыми операциями ввода вывода. Это не имеет значения, но без подключения дополнительных библиотек C++ уже умеет работать в 2 функциями ввода/вывода которыми мы воспользуемся.
Чтобы окно не закрывалось будем ждать нажатия от пользователя любой клавиши вызвав функцию char * key; scanf (key);
Если запустить программу то можно увидеть что вся эта морока была бесполезной программа все равно пишет непонятные иероглифы вместо русских букв.
Это к сожалению исправляется в ручную. Чтобы буквы стали русскими нужно нажать на заголовок окна и вызвать контекстное меню. И вызвать параметр свойства (Properties)
В свойствах окна выбрать вкладку Шрифт и в шрифте выбрать шрифт Lucida Console
Таким образом консоль будет выводить буквы в нужной нам кодировке которая есть в данном шрифте.
Консольные приложения до сих пор остаются наиболее востребованным видом приложений, большинство разработчиков оттачивают архитектуру и бизнес-логику именно в консоли. При этом они нередко сталкиваются с проблемой локализации - русский текст, который вполне адекватно отражается в исходном файле, при выводе на консоль приобретает вид т.н. "кракозябр".
В целом, локализация консоли Windows при наличии соответствующего языкового пакета не представляется сложной. Тем не менее, полное и однозначное решение этой проблемы, в сущности, до сих пор не найдено. Причина этого, главным образом, кроется в самой природе консоли, которая, являясь компонентом системы, реализованным статическим классом System.Console, предоставляет свои методы приложению через системные программы-оболочки, такие как командная строка или командный процессор (cmd.exe), PowerShell, Terminal и другие.
По сути, консоль находится под двойным управлением - приложения и оболочки, что является потенциально конфликтной ситуацией, в первую очередь в части использования кодировок.
Данный материал не предлагает строгий алгоритм действий, а направлен на описание узловых проблем, с которыми неизбежно сталкивается разработчик локализованного консольного приложения, а также некоторые возможные пути их разрешения. Предполагается, что это позволит разработчику сформировать стратегию работы с локализованной консолью и эффективно реализовать существующие технические возможности, большая часть которых хорошо описана и здесь опущена.
Виды консолей
В общем случае функции консоли таковы:
управление операционной системой и системным окружением приложений на основе применения стандартных системных устройств ввода-вывода (экран и клавиатура), использования команд операционной системы и/или собственно консоли;
запуск приложений и обеспечение их доступа к стандартным потокам ввода-вывода системы, также с помощью стандартных системных устройств ввода-вывода.
Отдельным видом консоли можно считать консоль отладки Visual Studio (CMD-D ).
Конфликт кодировок
Полностью локализованная консоль в идеале должна поддерживать все мыслимые и немыслимые кодировки приложений, включая свои собственные команды и команды Windows, меняя "на лету" кодовые страницы потоков ввода и вывода. Задача нетривиальная, а иногда и невозможная - кодовые страницы DOS (CP437, CP866) плохо совмещаются с кодовыми страницами Windows и Unicode.
Совет 1. Выполнять разработку текстовых файлов (программных кодов, текстовых данных и др.) исключительно в кодировке UTF-8. Мир любит Юникод, а кроссплатформенность без него вообще невозможна.
Совет 2. Периодически проверять кодировку, например в текстовом редакторе Notepad++. Visual Studio может сбивать кодировку, особенно при редактировании за пределами VS.
Поскольку в консоли постоянно происходит передача управления от приложений к собственно командному процессору и обратно, регулярно возникает "конфликт кодировок", наглядно иллюстрируемый таблица 1 и 2, сформированных следующим образом:
Команды и код приложения под катом
> Echo ffffff фффффф // в командной строке
PS> Echo ffffff фффффф // в PowerShell
PS> Echo ffffff . // так выглядит та же команда в Windows PowerShell
код тестового приложения:
Командную часть задания все консоли локализовали практически без сбоев во всех кодировках, за исключением: в WPS неверно отображена русскоязычная часть команды во всех кодировках.
Табл. 1. Результат выполнения команды консоли Echo ffffff фффффф
Вывод тестового приложения локализован лишь в 50% испытаний, как показано в табл.2.
Табл. 2. Результат запуска приложения LoggingConsole.Test
Сoвет 3. Про PowerShell забываем раз и навсегда. Ну может не навсегда, а до следующей мажорной версии.
По умолчанию Windows устанавливает для консоли кодовые страницы DOS. Чаще всего CP437, иногда CP866. Актуальные версии командной строки cmd.exe способны локализовать приложения на основе русифицированной кодовой страницы 866, но не 437, отсюда и изначальный конфликт кодировок консоли и приложения. Поэтому
Совет 4. Перед запуском приложения необходимо проверить кодовую страницу консоли командой CHCP и ей же изменить кодировку на совместимую - 866, 1251, 65001.
Проблемы консолей Visual Studio
В Visual Studio имеется возможность подключения консолей, по умолчанию подключены командная строка для разработчика и Windows PowerShell для разработчика. К достоинствам можно отнести возможности определения собственных параметров консоли, отдельных от общесистемных, а также запуск консоли непосредственно в директории разработки. В остальном - это обычные стандартные консоли Windows, включая, как показано ранее, установленную кодовую страницу по умолчанию.
Отдельной опцией Visual Studio является встроенная односеансная консоль отладки, которая перехватывает команду Visual Studio на запуск приложения, запускается сама, ожидает компиляцию приложения, запускает его и отдает ему управление. Таким образом, отладочная консоль в течение всего рабочего сеанса находится под управлением приложения и возможность использования команд Windows или самой консоли, включая команду CHCP, не предусмотрена. Более того, отладочная консоль не воспринимает кодовую страницу по умолчанию, определенную в реестре, и всегда запускается в кодировке 437 или 866.
Совет 6. Тестирование приложения целесообразно выполнять во внешних консолях, более дружелюбных к локализации.
Анализ проблем консолей был бы не полон без ответа на вопрос - можно ли запустить консольное приложение без консоли? Можно - любой файл ".exe" запустится двойным кликом, и даже откроется окно приложения. Однако консольное приложение, по крайней мере однопоточное, по двойному клику запустится, но консольный режим не поддержит - все консольные вводы-выводы будут проигнорированы, и приложение завершится
Локализация отладочной консоли Visual Studio
Отладочная консоль - наиболее востребованная консоль разработчика, гораздо более удобная, чем внешняя консоль, поэтому резонно приложить максимум усилий для ее локализации.
На самом деле, правильнее говорить о локализации приложения в консоли - это важное уточнение. Microsoft по этому поводу высказывается недвусмысленно: "Programs that you start after you assign a new code page use the new code page. However, programs (except Cmd.exe) that you started before assigning the new code page will continue to use the original code page". Иными словами, консоль можно локализовать когда угодно и как угодно, но приложение будет локализовано в момент стабилизации взаимодействия с консолью в соответствии с текущей локализацией консоли, и эта локализация сохранится до завершения работы приложения. В связи с этим возникает вопрос - в какой момент окончательно устанавливается связь консоли и приложения?
Важно! Приложение окончательно стабилизирует взаимодействие с консолью в момент начала ввода-вывода в консоль, благодаря чему и появляется возможность программного управления локализацией приложения в консоли - до первого оператора ввода-вывода.
Ниже приведен пример вывода тестового приложения в консоль, иллюстрирующий изложенное. Метод Write получает номера текущих страниц, устанавливает новые кодовые страницы вводного и выводного потоков, выполняет чтение с консоли и записывает выводную строку, содержащий русский текст, в том числе считанный с консоли, обратно в консоль. Операция повторяется несколько раз для всех основных кодовых страниц, упомянутых ранее.
приложение запущено в консоли с кодовыми страницами 1251 (строка 2);
приложение меняет кодовые страницы консоли (current, setted);
приложение остановлено в консоли с кодовыми страницами 1252 (строка 11, setted);
по окончании работы приложения изменения консоли сохраняются (строка 14 - Active codepage 1252);
Приложение адекватно локализовано только в случае совпадения текущих кодовых страниц консоли (setted 1251:1251) с начальными кодовыми страницами (строки 8 и 10).
Совет 7. Обязательный и повторный! Функции SetConsoleCP должны размещаться в коде до первого оператора ввода-вывода в консоль.
Стратегия локализации приложения в консоли
Удалить приложение PowerShell (если установлено), сохранив Windows PowerShell;
Установить в качестве кодовую страницу консоли по умолчанию CP65001 (utf-8 Unicode) или CP1251 (Windows-1251-Cyr), см. совет 5;
Разработку приложений выполнять в кодировке utf-8 Unicode;
Контролировать кодировку файлов исходных кодов, текстовых файлов данных, например с помощью Notepad++;
Реализовать программное управление локализацией приложения в консоли, пример ниже под катом:
БлогNot. Ещё раз про setlocale и SetConsoleCP/SetConsoleOutputCP в Studio.
Ещё раз про setlocale и SetConsoleCP/SetConsoleOutputCP в Studio.
Типовая проблема начинающих - "кракозябры" вместо кириллицы при разработке консольных приложений в MS Visual Studio.
Решения известны, но с ними тоже бывают нюансы. В частности, не надо мешать в одной программе setlocale - стандартную функцию из <clocale> и SetConsoleCP / SetConsoleOutputCP - пропиетарные функции от Microsoft из <windows.h> . Что они делают - одному микрософту известно, скорее всего, мешают работать setlocale :)
При этом, если указываем кодировку 1251, то при использовании микрософтовских функций необходимо выбрать в свойствах консоли шрифт Lucida Console, а для стандартной setlocale может и не помочь.
Методом научного тыка можно сделать такие выводы:
- SetConsoleOutputCP() устанавливает кодировку вывода на консоль;
- SetConsoleCP() устанавливает кодировку ввода из консоли и из редактора кода;
- setlocale(LC_ALL,".1251") проверяет, какая кодировка установлена сейчас, и если она не 1251, то меняет ее на 1251, а если уже 1251, то ничего не делает.
Поэтому, если уже установлена кодировка ввода из редактора функцией SetConsoleCP(1251) , то после неё setlocale() ничего менять не будет, и попросту выведет символы в кодировке CP866, решив, что они и так уже в windows 1251.
Если же уже выполнена функция SetConsoleOutputCP(1251) , то setlocale() проверит, какая кодировка ввода установлена, и обнаружит, что кодировка ввода по-прежнему CP866, поэтому она возьмет номера этих уже преобразованных символов (с помощью SetConsoleOutputCP(1251) ), но из кодовой таблицы cp866, и выведет символы с этими номерами из таблицы windows 1251 :)
При этом, иногда мешать два способа всё же придётся. Например, если нужно обрабатывать ввод русских букв с помощью сишных функций проверки класса символов.
Вот такой код, при вводе русских букв, не будет корректно проверять, введена ли буква:
Читайте также: