Форум программистов, компьютерный форум, киберфорум
C++ Builder
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.89/9: Рейтинг темы: голосов - 9, средняя оценка - 4.89
0 / 0 / 0
Регистрация: 05.09.2011
Сообщений: 20

RichEdit и кодировка

16.05.2014, 12:38. Показов 1786. Ответов 12
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте!

Задача такая: Читаю код страницы в интернете, парсю его и вывожу в richedit:

C++
1
2
3
4
5
String htmltext = IdHTTP1->Get(адрес_страницы);
.
.
.
RE->Lines->Add(htmltext);
проблема в том что страница содержит текст: Estádio Mineirão
а в штмл коде он отображается как:
HTML5
1
<a href="8/">Estádio Mineirão</a>
(вместо букв с тильдой и апострофом коды символов)
соответственно IdHTTP читает тоже самое и в ричэдит пишется Estádio Mineirão (вместо букв с тильдой и апострофом коды символов)

Подскажите как решить проблему? Как в рич эдит вывести Estádio Mineirão?
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
16.05.2014, 12:38
Ответы с готовыми решениями:

RichEdit и кодировка
В общем проблема - когда загружаю в искомый РичЕдит текстовые файлики (LoadFromFile) то если кодировка АНСИ то все прекрасно, а если УТФ-8...

Кодировка в RichEdit
При выводе текста в RichEdit1 вместо букв выводит какие-то иероглифы Пробовал setlocale(LC_ALL,&quot;Rus&quot;); тоже не работает int...

RichEdit кодировка?
у меня возникла проблемка .... создавал подобие текстового редактора(очень слабое) .... использовал RichEdit, при сохранении текста в...

12
 Аватар для Dinkin
783 / 556 / 136
Регистрация: 31.05.2013
Сообщений: 3,153
Записей в блоге: 3
16.05.2014, 14:09
мб?
C
1
2
WideString htmltext = IdHTTP1->Get(адрес_страницы);
RichEdit1->Text=AnsiToUtf8( htmltext );
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
 Аватар для volvo
33399 / 21509 / 8236
Регистрация: 22.10.2011
Сообщений: 36,907
Записей в блоге: 12
16.05.2014, 14:12
Rate93, для начала - какая версия Билдера, и как именно вот это происходит:
Цитата Сообщение от Rate93 Посмотреть сообщение
парсю его
? Без этой информации имеем гадание на кофейной гуще.
0
0 / 0 / 0
Регистрация: 05.09.2011
Сообщений: 20
16.05.2014, 14:55  [ТС]
UI, билдер xe2. Парсинг заключается в поиске конкретных кусков (Pos) и вырезании найденных кусков (SubString) из htmltext. В процессе используются промежуточные переменные типа String.
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
 Аватар для volvo
33399 / 21509 / 8236
Регистрация: 22.10.2011
Сообщений: 36,907
Записей в блоге: 12
16.05.2014, 15:47
В таком случае показывай с какого сайта происходит чтение, и как именно вырезаешь куски, потому что у меня ничего на коды не заменяется:



(сам сайт, с которого я читал - в кодировке UTF8, проект Билдера тоже Юникодный)
0
0 / 0 / 0
Регистрация: 05.09.2011
Сообщений: 20
16.05.2014, 15:59  [ТС]
вот страничка для примера
Как проверить в какой кодировке проект в билдере?
Куски вырезаю по тупому, ничего хитрого:

C++
1
htmltext = htmltext.SubString(htmltext.Pos("<a href="8/">"), htmltext.Pos("</a></td><td>"));
все в таком роде.
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
 Аватар для volvo
33399 / 21509 / 8236
Регистрация: 22.10.2011
Сообщений: 36,907
Записей в блоге: 12
16.05.2014, 16:14
Открой исходный код страницы и посмотри, в каком виде там хранятся данные:



Точно так же они и получаются... Кодировка-то у страницы Win1251, а не UTF8...
0
0 / 0 / 0
Регистрация: 05.09.2011
Сообщений: 20
16.05.2014, 16:29  [ТС]
Так я про это и написал в первом сообщении, вопрос в том и состоит, что как вывести подобный текст в ричэдит в нормальном виде?
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
 Аватар для volvo
33399 / 21509 / 8236
Регистрация: 22.10.2011
Сообщений: 36,907
Записей в блоге: 12
16.05.2014, 17:01
Лучший ответ Сообщение было отмечено Rate93 как решение

Решение

Никак. Вывести тот текст в нормальном виде может только браузер, но никак не RE. Зайди вот сюда: http://www.minasarena.com.br/empresa/ и посмотри в исходнике страницы, как она должна выглядеть, чтобы можно было нормально отобразить ее в текстовом редакторе.

Добавлено через 4 минуты
Хотя...

C++
1
2
3
4
5
#include <Web.HTTPApp.hpp>
 
// ...
    htmltext = htmltext.SubString(htmltext.Pos("<a href=\"8/\">"), htmltext.Pos("</a></td><td>"));
    RichEdit1->Text = HTMLDecode(htmltext); // <--- попробуй
1
0 / 0 / 0
Регистрация: 05.09.2011
Сообщений: 20
16.05.2014, 18:54  [ТС]
Цитата Сообщение от UI Посмотреть сообщение
Хотя...
на это он мне выдаёт:
Миниатюры
RichEdit и кодировка  
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
 Аватар для volvo
33399 / 21509 / 8236
Регистрация: 22.10.2011
Сообщений: 36,907
Записей в блоге: 12
16.05.2014, 19:00
Ну тогда не знаю. Брал тот сайт, который ты привел, "парсил" его тем же кодом, который ты привел, версия Билдера совпадает. Однако:


, и никакого вылета.

Проверь Project->Options->_TCHAR maps to во что выставлено, может оно как-то влияет. У меня там всегда wchar_t
0
0 / 0 / 0
Регистрация: 05.09.2011
Сообщений: 20
16.05.2014, 19:09  [ТС]
Цитата Сообщение от UI Посмотреть сообщение
Проверь Project->Options->_TCHAR maps to во что выставлено, может оно как-то влияет. У меня там всегда wchar_t
Сразу это проверил, в итоге понял что это не влияет.
Цитата Сообщение от UI Посмотреть сообщение
"парсил" его тем же кодом
изначально пробовал полный htmltext выводить, выдавало вышеприведенную ошибку, ради интереса попробовал вывести обрезав htmltext и результат положительный! Здорово! Спасибо!
интересно теперь почему полный htmltext не выводит, хотя мне это не надо, реально в программе нужно выводить "Estádio Mineirão - Belo Horizonte (puzzle 1)" и т.д.
0
Супер-модератор
Эксперт Pascal/DelphiАвтор FAQ
 Аватар для volvo
33399 / 21509 / 8236
Регистрация: 22.10.2011
Сообщений: 36,907
Записей в блоге: 12
16.05.2014, 19:21
Цитата Сообщение от Rate93 Посмотреть сообщение
интересно теперь почему полный htmltext не выводит
Хм... Попробуй вот к такой строке применить HTMLDecode:
C++
1
String htmltext = L"<html><body>&nbsp;</body></html>";
, увидишь почему То есть, как минимум надо сначала все entity "пробелов" заменить на реальные пробелы, и только потом декодировать. Сбоит, получается, функция...
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
16.05.2014, 19:21
Помогаю со студенческими работами здесь

Кодировка UTF-8 в RichEdit
Дело во какое: через cmd создал текст txt в кодировке UTF-8 (потому что в нём сохраняются русские символы и не превращаются в иероглифы). ...

IdPoP Richedit кодировка калябаля
программисты может кто сталкивался с этим вот так получаю сообщение: IdPOP31.Host:='****'; IdPOP31.Port:=110; ...

В поле RichEdit удалить html-теги; при вставке в RichEdit замена старого текста на новый
Всем привет! помогите пожалуйста с написание кода на две процедуры : - В поле RichEdit удалить html-теги; - при вставке в RichEdit...

Из RichEdit в RichEdit без потери форматирования
Есть RichEdit1 с форматированным текстом(цвет, стиль и тп.) нужно передать этот текст в переменную а затем в RichEdit2 чтобы при вставке в...

Кодировка программы и кодировка базы данных
В общем в архиве стандартный пример и одна из программ по редактированию sqlite. Проблема заклчается в следующем: при редактировании...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
13
Ответ Создать тему
Новые блоги и статьи
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru