35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
|
|
1 | |
Из кодировки * в UTF8 и обратно в *01.11.2015, 19:37. Показов 1895. Ответов 11
Метки нет (Все метки)
Добрый вечер.
Звездочка(*) это кодировка, которая мне не известна. Суть вот в чем. Есть файл html, который был открыт через расширение *.doc в Word'е и сохранен с нужными параметрами. Далее программа открывает этот html файл, посылает JavaScript'y, преобразуя содержимое файла в UTF8. Потом JavaScript отправляет обратно содержимое, а программа создает новый файл и наполняет его принятым содержимым. Теперь открываю созданный файл через расширение *.doc в Word'e и там кракозябры. Почему так? Перед началом всей операции пробовал преобразовывать кодировку исходного файла в UTF8, UTF8 без BOM и другие в программе Notepad++. Подскажите, уважаемые знатоки, как быть? Добавлено через 1 минуту И, да, уточню. Пробовал создавать файл, наполняя исходным содержимым, без преобразования в UTF8 и передачи JavaScript'y. Всё чисто. В смысле как надо) Добавлено через 16 минут Проблема в преобразовании в UTF8. Как можно обратно преобразовать? Да и в какую...
0
|
01.11.2015, 19:37 | |
Ответы с готовыми решениями:
11
Кодировки win1251-UTF8 Перевод кодировки в Win1251/UTF8 Конвертирование неизвестной кодировки в utf8 Декодирование из старой однобайтовой кодировки в utf8 |
76 / 76 / 32
Регистрация: 14.04.2014
Сообщений: 408
|
|
01.11.2015, 19:46 | 2 |
тоесть тебе интересно, почему результатом работы твоего скрипта, открытом в ворде является набор крокозябр?И в какую кодировку надо его преобразовать, чтобы было читабельно? И почему не помогает сохранение через ворд в кодировке утф?
отвечу сразу на все вопросы - хрен его знает. для начала попробуй открыть файл html не вордом, а каким нибудь нормальным редактором например sublime.
0
|
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
|
|
01.11.2015, 19:54 [ТС] | 3 |
Fallenworld, sublime не сравнить с Word'ом. Как вы можете называть sublime нормальным по отношению к ворду. Это Совершенно разные программы. Странно...
Как мне поможет решить вопрос открытие документа в sublime? В общем попробовал кое-что. Перед операцией ставлю кодировку UTF-8. Только её распознает html, в остальных случаях кракозябры. Созданный файл открываю в браузере и вижу кракозябры. Открываю Notepad'ом и вижу, стоит кодировка UTF-8. Что могло произойти с содержимым? Для меня, жалкого человека, с содержимым ничего не произошло. А умная программа видит по другому. Что она видит?
0
|
76 / 76 / 32
Регистрация: 14.04.2014
Сообщений: 408
|
|
01.11.2015, 20:00 | 4 |
0
|
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
|
|
01.11.2015, 20:13 [ТС] | 5 |
Fallenworld, Word это Office Word, а тот ворд что вы подумали это WordPad
0
|
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
|
|
01.11.2015, 20:21 [ТС] | 7 |
Croessmah, ваш комментарий здесь ни к чему вообще. Бессмысленный
0
|
Неэпический
|
|
01.11.2015, 20:27 | 8 |
ну значит
выводы не сделаны.
а по поводу Кто его знает че там у Вас. У меня вот тоже кое-что не работает. Почему? Вопросы эти аналогичны.
0
|
Ушел с форума
|
|
01.11.2015, 20:36 | 9 |
Вот здесь подробнее. Как программа определяет, в какой кодировке исходное содержимое ?
И здесь тоже вопрос: как программа определяет, в какой кодировке ответ ? Может, тогда так и оставить ?
1
|
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
|
||||||
01.11.2015, 21:25 [ТС] | 10 | |||||
Убежденный,
не вариант. Вот далее было:
Т.е. даже без передачи JavaScript'y всё портится. Нет никакого определения. Просто для передачи строки JavaScript'y надо пользоваться типом WebString от фреймворка Awesomium, иначе не передать. Это выглядит так:
0
|
Ушел с форума
|
|
01.11.2015, 21:30 | 11 |
Либо HTML некорректный (например, в meta charset указана не та кодировка).
Ну как же нет ? Ведь было написано выше: "программа открывает этот html файл, посылает JavaScript'y, преобразуя содержимое файла в UTF8." CreateFromUTF8 - это, если верить названию, преобразование ИЗ UTF-8, а не В. Короче, надо смотреть вход и выход всех операций на каждом шаге. Определить, в UTF-8 текст или нет, достаточно несложно, если знать представления нужных символов в этой кодировке (не латиницы, само собой).
1
|
35 / 35 / 15
Регистрация: 06.01.2014
Сообщений: 707
|
|
01.11.2015, 21:41 [ТС] | 12 |
Хм.
В общем проблему решило сохранение документа через word как "Веб страница с фильтром". Ну и кодировка UTF8 в дополнение
0
|
01.11.2015, 21:41 | |
01.11.2015, 21:41 | |
Помогаю со студенческими работами здесь
12
Изменение кодировки файла dbf из utf8 в 1251 Изменение кодировки Win1251 в UTF8 (необычный случай) Изменение кодировки строки в UTF8 без BOM Как сохранить в csv utf8 кодировки файл из exсel? Текст в кодировке cp1251 перевести в utf8 и обратно? Написать программу конвертер текстовых файлов с одной кодировки в другую из файла (CP1251, UTF8, KOIR8) Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |