Форум программистов, компьютерный форум, киберфорум
С++ для начинающих
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.55/11: Рейтинг темы: голосов - 11, средняя оценка - 4.55
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
1

Из кодировки * в UTF8 и обратно в *

01.11.2015, 19:37. Показов 1895. Ответов 11
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Добрый вечер.
Звездочка(*) это кодировка, которая мне не известна.

Суть вот в чем.
Есть файл html, который был открыт через расширение *.doc в Word'е и сохранен с нужными параметрами.
Далее программа открывает этот html файл, посылает JavaScript'y, преобразуя содержимое файла в UTF8.
Потом JavaScript отправляет обратно содержимое, а программа создает новый файл и наполняет его принятым содержимым.

Теперь открываю созданный файл через расширение *.doc в Word'e и там кракозябры. Почему так?

Перед началом всей операции пробовал преобразовывать кодировку исходного файла в UTF8, UTF8 без BOM и другие в программе Notepad++.

Подскажите, уважаемые знатоки, как быть?

Добавлено через 1 минуту
И, да, уточню. Пробовал создавать файл, наполняя исходным содержимым, без преобразования в UTF8 и передачи JavaScript'y. Всё чисто. В смысле как надо)

Добавлено через 16 минут
Проблема в преобразовании в UTF8. Как можно обратно преобразовать? Да и в какую...
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
01.11.2015, 19:37
Ответы с готовыми решениями:

Кодировки win1251-UTF8
Подскажите как осуществить сиё действие? К примеру имею $mytext='Яндекс '; //Яндекс зы...

Перевод кодировки в Win1251/UTF8
Вместо русского "Яндекс" пишутся такие кракозябры "Яндекс" как поменять...

Конвертирование неизвестной кодировки в utf8
как переконвертировать любую (неизвестную) кодировку в utf-8 ?

Декодирование из старой однобайтовой кодировки в utf8
Почему output.txt такой же как input.txt? #include <windows.h> #include <stdio.h> #include...

11
76 / 76 / 32
Регистрация: 14.04.2014
Сообщений: 408
01.11.2015, 19:46 2
тоесть тебе интересно, почему результатом работы твоего скрипта, открытом в ворде является набор крокозябр?И в какую кодировку надо его преобразовать, чтобы было читабельно? И почему не помогает сохранение через ворд в кодировке утф?
отвечу сразу на все вопросы - хрен его знает.
для начала попробуй открыть файл html не вордом, а каким нибудь нормальным редактором например sublime.
0
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
01.11.2015, 19:54  [ТС] 3
Fallenworld, sublime не сравнить с Word'ом. Как вы можете называть sublime нормальным по отношению к ворду. Это Совершенно разные программы. Странно...
Как мне поможет решить вопрос открытие документа в sublime?

В общем попробовал кое-что.
Перед операцией ставлю кодировку UTF-8. Только её распознает html, в остальных случаях кракозябры.
Созданный файл открываю в браузере и вижу кракозябры.
Открываю Notepad'ом и вижу, стоит кодировка UTF-8.

Что могло произойти с содержимым? Для меня, жалкого человека, с содержимым ничего не произошло. А умная программа видит по другому. Что она видит?
0
76 / 76 / 32
Регистрация: 14.04.2014
Сообщений: 408
01.11.2015, 20:00 4
Цитата Сообщение от Randen Посмотреть сообщение
Как вы можете называть sublime нормальным по отношению к ворду
прошу прощения, имелось ввиду "нормальный html редактор"
0
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
01.11.2015, 20:13  [ТС] 5
Fallenworld, Word это Office Word, а тот ворд что вы подумали это WordPad
0
Неэпический
17870 / 10635 / 2054
Регистрация: 27.09.2012
Сообщений: 26,737
Записей в блоге: 1
01.11.2015, 20:19 6
Цитата Сообщение от Randen Посмотреть сообщение
Это Совершенно разные программы.
Бинго! Осталось только сделать выводы.
0
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
01.11.2015, 20:21  [ТС] 7
Croessmah, ваш комментарий здесь ни к чему вообще. Бессмысленный
0
Неэпический
17870 / 10635 / 2054
Регистрация: 27.09.2012
Сообщений: 26,737
Записей в блоге: 1
01.11.2015, 20:27 8
Цитата Сообщение от Randen Посмотреть сообщение
Бессмысленный
ну значит
Цитата Сообщение от Croessmah Посмотреть сообщение
Осталось только сделать выводы.
выводы не сделаны.

а по поводу
Цитата Сообщение от Randen Посмотреть сообщение
Теперь открываю созданный файл через расширение *.doc в Word'e и там кракозябры. Почему так?
Кто его знает че там у Вас. У меня вот тоже кое-что не работает. Почему? Вопросы эти аналогичны.
0
Ушел с форума
Эксперт С++
16473 / 7436 / 1187
Регистрация: 02.05.2013
Сообщений: 11,617
Записей в блоге: 1
01.11.2015, 20:36 9
Цитата Сообщение от Randen Посмотреть сообщение
Далее программа открывает этот html файл, посылает JavaScript'y, преобразуя содержимое файла в UTF8.
Вот здесь подробнее. Как программа определяет, в какой кодировке исходное содержимое ?

Цитата Сообщение от Randen Посмотреть сообщение
Потом JavaScript отправляет обратно содержимое, а программа создает новый файл и наполняет его принятым содержимым.
И здесь тоже вопрос: как программа определяет, в какой кодировке ответ ?

Цитата Сообщение от Randen Посмотреть сообщение
Пробовал создавать файл, наполняя исходным содержимым, без преобразования в UTF8 и передачи JavaScript'y. Всё чисто. В смысле как надо
Может, тогда так и оставить ?
1
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
01.11.2015, 21:25  [ТС] 10
Убежденный,
Цитата Сообщение от Убежденный Посмотреть сообщение
Может, тогда так и оставить ?
не вариант. Вот далее было:
Цитата Сообщение от Randen Посмотреть сообщение
Перед операцией ставлю кодировку UTF-8. Только её распознает html, в остальных случаях кракозябры.
Созданный файл открываю в браузере и вижу кракозябры.
Открываю Notepad'ом и вижу, стоит кодировка UTF-8.
Т.е. даже без передачи JavaScript'y всё портится.

Цитата Сообщение от Убежденный Посмотреть сообщение
Вот здесь подробнее. Как программа определяет, в какой кодировке исходное содержимое ?
Нет никакого определения. Просто для передачи строки JavaScript'y надо пользоваться типом WebString от фреймворка Awesomium, иначе не передать.
Это выглядит так:
C++
1
2
std::string code = "здесь код";
WebString HTML_String = WebString::CreateFromUTF8(code.c_str(), strlen(code.c_str()));
0
Ушел с форума
Эксперт С++
16473 / 7436 / 1187
Регистрация: 02.05.2013
Сообщений: 11,617
Записей в блоге: 1
01.11.2015, 21:30 11
Цитата Сообщение от Randen Посмотреть сообщение
Т.е. даже без передачи JavaScript'y всё портится.
Либо HTML некорректный (например, в meta charset указана не та кодировка).

Цитата Сообщение от Randen Посмотреть сообщение
Нет никакого определения.
Ну как же нет ? Ведь было написано выше:
"программа открывает этот html файл, посылает JavaScript'y, преобразуя содержимое файла в UTF8."

Цитата Сообщение от Randen Посмотреть сообщение
WebString HTML_String = WebString::CreateFromUTF8(code.c_str(), strlen(code.c_str()));
CreateFromUTF8 - это, если верить названию, преобразование ИЗ UTF-8, а не В.

Короче, надо смотреть вход и выход всех операций на каждом шаге.
Определить, в UTF-8 текст или нет, достаточно несложно, если знать
представления нужных символов в этой кодировке (не латиницы, само собой).
1
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
01.11.2015, 21:41  [ТС] 12
Хм.
В общем проблему решило сохранение документа через word как "Веб страница с фильтром". Ну и кодировка UTF8 в дополнение
0
01.11.2015, 21:41
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
01.11.2015, 21:41
Помогаю со студенческими работами здесь

Изменение кодировки файла dbf из utf8 в 1251
Доброго дня Прошу Вашей помощи в решении следующей задачи. Существует фалик dbf, кодировка...

Изменение кодировки Win1251 в UTF8 (необычный случай)
Всем привет! ... обычно кодировка проблем не доставляла, а вот недавно столкнулся с проблемой...

Изменение кодировки строки в UTF8 без BOM
Здравствуйте. Есть код: Dim Encw1252 As Encoding = Encoding.GetEncoding("windows-1252") ...

Как сохранить в csv utf8 кодировки файл из exсel?
Как сохранить в csv utf8 кодировки файл из exel?

Текст в кодировке cp1251 перевести в utf8 и обратно?
Здорова! Вот есть код: #include <iostream> using std::cout; using std::endl; using std::cerr;...

Написать программу конвертер текстовых файлов с одной кодировки в другую из файла (CP1251, UTF8, KOIR8)
Написать программу конвертер текстовых файлов с одной кодировки в другую из файла (текст кириллица....


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
12
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru