|
63 / 48 / 12
Регистрация: 28.12.2014
Сообщений: 270
|
||||||
Перекодировка в UTF-8 в VB6.0 средствами MultiByteToWideChar07.04.2024, 16:43. Показов 1056. Ответов 10
Метки нет (Все метки)
Добрый день. Подскажите, пожалуйста, в чем может быть проблема при перекодировке в UTF-8 с использованием функции win API MultiByteToWideChar. В зависимости от версии операционной системы при использовании данной функции получается разный результат, который не получается назвать соответствующим кодировке UTF-8. При этом в операционной системе используется кодовая страница 1251, локаль вызывающего потока 1049 он же LCID. Текст программы:
Кликните здесь для просмотра всего текста
Результат работы функции MultiByteToWideChar - 2 байта записаны в выходном буфере, значение первого байта 253, второго 255. Система счисления десятеричная или &HFD, &HFF. Спасибо.
0
|
||||||
| 07.04.2024, 16:43 | |
|
Ответы с готовыми решениями:
10
Перекодировка ANSI в utf-8 Перекодировка из UTF-8 в KOI8 Перекодировка UTF в кириллицу |
|
Испарился
1741 / 637 / 45
Регистрация: 10.09.2021
Сообщений: 2,769
|
|||
| 07.04.2024, 20:42 | |||
|
Запись BOM в кодировке UTF-8 должна начинаться с байтов EF BB BF
Добавлено через 3 минуты Добавлено через 43 секунды IDK, код который вы предоставили не полный Добавлено через 10 минут
0
|
|||
|
63 / 48 / 12
Регистрация: 28.12.2014
Сообщений: 270
|
||||||||
| 08.04.2024, 03:03 [ТС] | ||||||||
|
https://www.fileformat.info/in... /index.htm Добавлено через 3 минуты Приведенный результат работы функции в первом сообщении для win8.1. Для win xp соответствующий результат- 1 байт записан в выходной буфер, значение байт в буфере после записи 0, 0. Добавлено через 19 секунд Приведенный результат работы функции в первом сообщении для win8.1. Для win xp соответствующий результат- 1 байт записан в выходной буфер, значение байт в буфере после записи 0, 0.
0
|
||||||||
| 08.04.2024, 07:57 | |
|
IDK, я посмотрел, у вас ошибка вот в чем, 200 это 1байтный код Ansi для буквы "И", в Utf-8 это соответствует 2 байтам 203(D9), 152(98). Если с них конвертировать функцией MultiByteToWideChar, то результат будет правильным.
0
|
|
|
63 / 48 / 12
Регистрация: 28.12.2014
Сообщений: 270
|
||
| 08.04.2024, 08:14 [ТС] | ||
|
Ps Есть значение FFFD на которое заменяется символ, который нет возможности кодировать. И порядок байт, похоже, обратный. Т.е. будто бы кодировка идет в UTF-16.
0
|
||
| 08.04.2024, 08:32 | |
|
IDK, из Utf8 в Unicode. Но, да, я понял еще одну вещь вы хотите конвертировать наоборот в utf8, но для этого нужна др. функция WideChartoMultibyte
Добавлено через 12 минут И в таком случае нужно опять же конвертировать не из Ansi, а из Юникода, т.е. код 200 не подойдет
1
|
|
|
Испарился
1741 / 637 / 45
Регистрация: 10.09.2021
Сообщений: 2,769
|
|
| 08.04.2024, 13:25 | |
|
testuser2 прав, я сразу этого не заметил просто. Функция MultiByteToWideChar используется для загрузки, а не сохранения. Для записи/сохранения и преобразования в результатирующею кодировку используется функция WideCharToMultiByte.
Добавлено через 2 минуты IDK, ваш код изначально полностью неправильный а неполный он потому что я не вижу продолжения. Я не вижу куда сохраняется массив данных UTF-8 и как он дальше используется. Да и по регламенту функцию WideCharToMultiByte нужно вызывать дважды, первый раз для узнавания выходного буфера, второй раз для записи массива с уже известным количеством байтов.
1
|
|
|
63 / 48 / 12
Регистрация: 28.12.2014
Сообщений: 270
|
|||||||||||||
| 08.04.2024, 13:32 [ТС] | |||||||||||||
Если передавать двухбайтную BSTR строку в WideCharToMultibyte:
Функция MultiByteToWideChar судя по декомпиляции не определяет code page операционной системы и не запрашивает LCID потока.
0
|
|||||||||||||
|
Испарился
1741 / 637 / 45
Регистрация: 10.09.2021
Сообщений: 2,769
|
|||||||
| 08.04.2024, 14:22 | |||||||
|
Добавлено через 3 минуты Забудьте вы уже про ANSI. В VB6 строки хранятся в UTF-16 LE Добавлено через 45 минут IDK, я же совсем недавно писал код, который работает, здесь на форуме в соседней теме:
1
|
|||||||
|
Модератор
|
||
| 08.04.2024, 14:22 | ||
|
3
|
||
| 08.04.2024, 14:22 | |
|
Помогаю со студенческими работами здесь
11
перекодировка из ANSI в UTF-8 Перекодировка текста из CP1251 в UTF-8 Перекодировка с windows-1251 в utf-8 Перекодировка ANSI -> UTF-8 программно. Перекодировка из однобайтовой кодировки в UTF-16 Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает
монорепозиторий в котором находятся все исходники.
При создании нового решения, мы просто добавляем нужные проекты
и имеем. . .
|
|
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение:
В этой книге («Подход, основанный на вариантах использования») Ивар утверждает,
что архитектура программного обеспечения — это
структуры,. . .
|
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога
Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
|
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip
На первой гифке отладочные линии отключены, а на второй включены:. . .
|
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога
Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем.
. . .
|