0 / 0 / 0
Регистрация: 16.03.2018
Сообщений: 52
1

ASCII в UTF-8 и обратно

09.05.2019, 13:45. Показов 9227. Ответов 7

Как можно кодировать строку в ASCII из UTF-8, и наобарот?
__________________
Помощь в написании контрольных, курсовых и дипломных работ, диссертаций здесь
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
09.05.2019, 13:45
Ответы с готовыми решениями:

Конвертация из ASCII в UTF-32 или UTF-8 в UTF-32
Собсно сабж.

Перекодировать текст с UTF-8 в ASCII
Даже не знаю с чего начать Задача такова: Есть файл в формате UTF8. Нужно его перекодировать в...

Преобразовать utf-8 в cp1251 и обратно
Преобразовать надо без использования сторонних библиотек(windows.h тоже сторонняя библиотека)....

Преобразовать кодировку utf-8 в cp1251 и обратно
Здорова господа!!! Пишу парсер веб страниц с русским текстом, но тут проблемка страницы записаны...

7
3539 / 2098 / 389
Регистрация: 09.09.2017
Сообщений: 8,634
09.05.2019, 14:04 2
man iconv
Полностью обратимо - никак. Просто в ASCII всего 127 символов (цифры, латинские буквы и некоторые знаки), а Unicode (UTF-8, UTF-16, UTF-32) ~2 миллиона.
Если хотите конвертировать какую-то национальную раскладку, указывайте именно ее. Скажем, CP1251 или KOI8-R для русских.
0
Эксперт С++
8719 / 4262 / 950
Регистрация: 15.11.2014
Сообщений: 9,669
09.05.2019, 14:31 3
Цитата Сообщение от KirillConsolelr Посмотреть сообщение
в ASCII из UTF-8, и наобарот?
ASCII не отличим от UTF-8.

коды ASCII-символов в кодировке UTF-8 точно такие же,
как и в кодировке ASCII

поэтому, если вы введете текст,
который содержит только ASCII-символы,
и сохраните как ASCII, и как UTF-8,
то в обоих случаях получите абсолютно идентичные файлы.


а вот из UTF-8 в ASCII не гарантируется.
текст в UTF-8 может содержать символы, которых попросту нет в ASCII.
и что в таком случае вы предлагаете вывести?

различные текстовые редакторы в качестве
отсутствующих символов печатают знаки ?
0
Just Do It!
3375 / 1841 / 618
Регистрация: 23.09.2014
Сообщений: 5,831
09.05.2019, 14:42 4
Цитата Сообщение от KirillConsolelr Посмотреть сообщение
Как можно кодировать строку в ASCII из UTF-8, и наобарот?
если возник такой вопрос, то вы виндузятник

multibytetowidechar
widechartomultibyte

работающий пример:
Test.rar
0
Just Do It!
3375 / 1841 / 618
Регистрация: 23.09.2014
Сообщений: 5,831
09.05.2019, 14:59 5
Преобразуем utf-8 кодированный файл в ANSI файл:
C++
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
///----------------------------------------------------------------------------|
#include <iostream>
#include <string>
#include <locale>
#include <fstream>
#include <windows.h>
 
 
wchar_t* get_wstr(std::string& str)
{
    int len = MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, 0, 0);
    wchar_t *unicode_text = new wchar_t[len];
    MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, unicode_text, len);
    return unicode_text;
}
 
///----------------------------------------------------------------------------|
/// Тест.
///----------------------------------------------------------------------------|
int main()
{
    system("color 0A");
    setlocale(0,"");
 
    std::ifstream inStream("input_utf-8.txt");
    std::string   inText;
    std::getline(inStream, inText,'\0');
    inStream.close();
 
    std::wstring ss(get_wstr(inText));
    std::wcout << ss << L"\n\n";
    
    std::wofstream oStream("out.txt");
    oStream << ss;
    oStream.close();
 
    system("pause");
    return 0;
}
///----------------------------------------------------------------------------|
1
0 / 0 / 0
Регистрация: 16.03.2018
Сообщений: 52
09.05.2019, 15:00  [ТС] 6
В терминал вводиться ссылка, которую нужно передать скрипту на python с помощью TCP сокета. Python принимает только в utf8, и отправляет тоже. Если отправить обычный текст из терминала, то в питоне появляется иселючение.
0
28 / 21 / 7
Регистрация: 21.01.2019
Сообщений: 110
09.05.2019, 15:06 7
Цитата Сообщение от hoggy Посмотреть сообщение
и сохраните как ASCII, и как UTF-8,
то в обоих случаях получите абсолютно идентичные файлы.
маркер utf8
0
Just Do It!
3375 / 1841 / 618
Регистрация: 23.09.2014
Сообщений: 5,831
09.05.2019, 15:42 8
Цитата Сообщение от KirillConsolelr Посмотреть сообщение
В терминал вводиться ссылка
так
Цитата Сообщение от KirillConsolelr Посмотреть сообщение
Если отправить обычный текст
что?

отправляйте же ссылку, а не обычный текст.

обычный текст из латинских символов вызывает исключение?

для латинских символов текст в utf-8 и ansi будет полностью аналогичный.
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
09.05.2019, 15:42
Помогаю со студенческими работами здесь

масив Char (Windows-1251, ASCII, UTF-8)
Перехожу с мелкомяхких на linux (с Delphi на С++), так как все мои программы занимаются обработкой...

Разные кодировки файлов (ASCII, UTF-8, UTF-16)
Привет всем! Нужно написать программу поиска файлов, содержащих заданную строку. Т.е....

Преобразование Unicode (UTF-16) в UTF-8 и обратно
Здравствуйте. Признаюсь, снова нужна подмога профессионалов. :help: Перейду к проблеме: Есть файл...

С ASCII в UTF-8
Есть строка playername в ASCII надо перевести в UTF-8 И на выходи должно быть string play; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2022, CyberForum.ru