|
979 / 196 / 33
Регистрация: 26.09.2012
Сообщений: 2,041
|
|
Преобразовать кодировку utf-8 в cp1251 и обратно03.10.2013, 10:41. Показов 8828. Ответов 5
Метки нет (Все метки)
Здорова господа!!!
Пишу парсер веб страниц с русским текстом, но тут проблемка страницы записаны в двух кодировках utf8 и cp1251, получается неудобно, если у меня будет сайт в cp1251, и я допустим скопировал туда статью в кодировке utf8, то она не правильно отобразится - крякозябры появятся, раньше я когда писал парсер на пхп, то просто обходил те страницы которые в utf8, парсил токо те которые в cp1251, но щас хочу сделать универсальный парсер, там в принципе нужно только русские символы перевести в cp1251. Мб есть готовые решения? Мне нужна функция которая б принимала строку в utf8 а на выходе давала строку в cp1251. И функция нужна еще просто для определения в кокой кодировке текст???? Добавлено через 10 минут Ладно функцию я нашол, нужна функция которая будет определять в какой кодировке текст, просто есть текст, но неизвестно в какой он кодировке, как определить кодировку??? Добавлено через 3 минуты Есть строка текста, как определить в какой она кодировке? Добавлено через 8 минут Ладно буду парсить строку которая показывает браузеру в какой кодировке текст <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">, Если будет в utf8, то преобразую в сп1251, если в cп1251, то ничего не делать, а если в какой нить другой - то это мало вероятно.
0
|
|
| 03.10.2013, 10:41 | |
|
Ответы с готовыми решениями:
5
Преобразовать utf-8 в cp1251 и обратно Не удалось преобразовать файл в кодировку UTF-8. Редактирование невозможно XmlSerializer.Serialize() как поменять кодировку с UTF-16 на UTF-8 |
|
В астрале
8049 / 4806 / 655
Регистрация: 24.06.2010
Сообщений: 10,562
|
|
| 03.10.2013, 11:10 | |
|
ninja2, И зачем это делать руками? N либ же есть. К примеру iconv
1
|
|
|
979 / 196 / 33
Регистрация: 26.09.2012
Сообщений: 2,041
|
||
| 03.10.2013, 11:28 [ТС] | ||
|
Добавлено через 1 минуту У меня iconv нету ее еще подключать нада скачивать.
0
|
||
|
В астрале
8049 / 4806 / 655
Регистрация: 24.06.2010
Сообщений: 10,562
|
|
| 03.10.2013, 11:36 | |
|
ninja2, Вах, какая проблема. Ведь лучше написать
2
|
|
|
What a waste!
1610 / 1302 / 180
Регистрация: 21.04.2012
Сообщений: 2,733
|
|
| 03.10.2013, 11:38 | |
|
1
|
|
|
979 / 196 / 33
Регистрация: 26.09.2012
Сообщений: 2,041
|
|||||||||||
| 04.10.2013, 09:40 [ТС] | |||||||||||
|
Я сам не делал я готовую функцию нашол готовую построеную на винапи или хз я в нее не вникал:
Добавлено через 1 минуту Мне щас главное просто работающий прототип сделать, потом уже если что модернизирую с iconv. Добавлено через 21 час 8 минут Все таки подумал и решил iconv установить, но чо то не найду где ее скачать, и примеров использования нету. Добавлено через 3 минуты Вообще что бы не долго думать я вычитал что можно мою функцию доработать для остальных кодировок, там вроде говорится что переводим сначала в utf-16, потом в любую другую кодировку, так от ее можно доработать и переводить в любую кодировку. Добавлено через 19 минут От функция:
Добавлено через 15 минут Ладно разобрался, там ничего изменять не нада оставить как и было 1251, а коi8r это 20866 кодировка.
1
|
|||||||||||
| 04.10.2013, 09:40 | |
|
Помогаю со студенческими работами здесь
6
Изменить кодировку из utf-8 без bom в просто utf-8 Русский CP1251 в UTF-8
Преобразование кодировки cp1251 в UTF-8 Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Символьное дифференцирование
igorrr37 13.02.2026
/ *
Логарифм записывается как: (x-2)log(x^2+2) - означает логарифм (x^2+2) по основанию (x-2).
Унарный минус обозначается как !
*/
#include <iostream>
#include <stack>
#include <cctype>. . .
|
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
|
И ясному Солнцу
zbw 12.02.2026
И ясному Солнцу,
и светлой Луне.
В мире
покоя нет
и люди
не могут жить в тишине.
А жить им немного лет.
|
«Знание-Сила»
zbw 12.02.2026
«Знание-Сила»
«Время-Деньги»
«Деньги -Пуля»
|
|
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога
Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога
Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
|
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога
Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
|
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
|