Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.93/15: Рейтинг темы: голосов - 15, средняя оценка - 4.93
0 / 0 / 0
Регистрация: 13.09.2018
Сообщений: 90

Сбой кодировки в TextBox

12.10.2018, 11:07. Показов 3286. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Пропарсил сайт. Вывожу инфу из интересующих меня тегов в TextBox. С английским все в порядке, но с русским текстом происходит жесть. То иероглифы, то знаки вопроса. Что только с этим не пробовал сделать - ничего не получается. Код вывода :

C#
1
2
3
4
5
6
7
8
foreach (Match matchess in matches)
{
    textBox1.AppendText(matchess.Value + Environment.NewLine);
    textBox1.AppendText("Содержание : " + Environment.NewLine);
    textBox1.AppendText(matchess.Groups["tegData"].Value + Environment.NewLine); 
    textBox1.AppendText("_-_-_-_-_-_-_-_-_-_-_-_-_-_-_-_-_-_-_" + Environment.NewLine);
    textBox1.AppendText(Environment.NewLine);
}
На сайте кодировка текста : windows - 1251.
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
12.10.2018, 11:07
Ответы с готовыми решениями:

Сбой кодировки при чтении кириллицы
Друзья, помогите пожалуйста! Программа не хочет читать кириллицу Console.Write("Выберите файл: "); ...

Сбой кодировки при установке драйвера
Как исправить вот этот глюк? Новая винда, а шрифты не читает.

Entity Framework: сбой кодировки при создании базы данных
Всем доброго дня! Происходит следующая ситуация. Разрабатываю систему на одном компе, SQL express, Entity Framework, VS2017 Делаю...

7
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18295 / 14219 / 5368
Регистрация: 17.03.2014
Сообщений: 28,896
Записей в блоге: 1
12.10.2018, 12:33
Batch7992, значит текст с сайта в неверной кодировке получаете. Показывайте код загрузки html.
0
0 / 0 / 0
Регистрация: 13.09.2018
Сообщений: 90
12.10.2018, 12:46  [ТС]
OwenGlendower, Пожалуйста :
C#
1
2
3
4
5
6
7
8
9
10
string data = GetHtmlPageText("здесь строка сайта");
 
Encoding srcEncodingFormat = Encoding.GetEncoding("windows-1252");
byte[] originalByteString = srcEncodingFormat.GetBytes(data);
data = Encoding.Default.GetString(originalByteString);
 
string tag = "div";
string pattern = string.Format(@"\<{0}.*?\>(?<tegData>.+?)\<\/{0}\>", tag.Trim());
Regex regex = new Regex(pattern, RegexOptions.ExplicitCapture);
MatchCollection matches = regex.Matches(data);
На данный момент в textBoxe идут знаки вопроса
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18295 / 14219 / 5368
Регистрация: 17.03.2014
Сообщений: 28,896
Записей в блоге: 1
12.10.2018, 12:49
Batch7992, строки 3-5 лишние. Метод GetHtmlPageText должен сразу возвращать строку правильной кодировке. Показывайте код метода GetHtmlPageText.
0
0 / 0 / 0
Регистрация: 13.09.2018
Сообщений: 90
12.10.2018, 12:53  [ТС]
OwenGlendower, Воть :
C#
1
2
3
4
5
6
7
8
9
10
11
12
 public static string GetHtmlPageText(string url)
        {
            WebClient client = new WebClient();
            using (Stream data = client.OpenRead(url))
            {
                using (StreamReader reader = new StreamReader(data))
                {
                    return reader.ReadToEnd();
                }
            }
            
        }
Цитата Сообщение от OwenGlendower Посмотреть сообщение
строки 3-5 лишние.
Их просто снести?
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18295 / 14219 / 5368
Регистрация: 17.03.2014
Сообщений: 28,896
Записей в блоге: 1
12.10.2018, 13:09
Лучший ответ Сообщение было отмечено Batch7992 как решение

Решение

Batch7992, класс StreamReader использует кодировку UTF-8. В конструктор можно передать свою кодировку.
C#
1
2
3
4
5
6
7
8
9
public static string GetHtmlPageText(string url)
{
    using (WebClient client = new WebClient())
    using (Stream data = client.OpenRead(url))
    using (StreamReader reader = new StreamReader(data, Encoding.GetEncoding(1251)))
    {
        return reader.ReadToEnd();
    }
}
Обрати внимание что WebClient тоже нужно Dispose()-ить.

Раз загружается текст, то код можно упростить.
C#
1
2
3
4
5
6
7
8
public static string GetHtmlPageText(string url)
{
    using (WebClient client = new WebClient())
    {
        client.Encoding = Encoding.GetEncoding(1251);
        return client.DownloadString(url);
    }
}
Цитата Сообщение от Batch7992 Посмотреть сообщение
Их просто снести?
Да
1
0 / 0 / 0
Регистрация: 13.09.2018
Сообщений: 90
12.10.2018, 13:22  [ТС]
OwenGlendower, Спасибо большое, теперь буду знать. Как модер, не можете ли вы мне объяснить как, как работает репутация, и как ее повышать(кому либо, имею ввиду)?
0
12.10.2018, 15:29

Не по теме:

Цитата Сообщение от Batch7992 Посмотреть сообщение
как работает репутация, и как ее повышать(кому либо, имею ввиду)?
https://www.cyberforum.ru/abou... 09691.html

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
12.10.2018, 15:29
Помогаю со студенческими работами здесь

Кодировки - TextBox
Здравствуйте форумчане! У меня в программе выводится текст в TextBox1, но он вот такого вида &quot;Европа Плюс&quot; Как...

Смена кодировки в TextBox
Подскажите , имеется переменная , типа char* , как вывести в TextBox, (проект С++CLR) пытаюсь сделать так char buf; char *p =...

СМА INDESIT IWB 6105CIS непонятный сбой, Сбой программы
Добрый вечер.Проблема:машинка начинает работать,через пару-тройку минут остановка и начинает моргать всеми индикаторами(то 2 раза,потом...

В чём отличия кодировки ms dos от кодировки ms windows?
Всем привет, подскажите в чём отличия кодировки ms dos от кодировки ms windows?

Кодировки (ошибки кодировки) в логировании
Здравствуйте. Работаю с WINAPI и оттуда нормально приходят наименования на русском. Вот решил логирование организовать и на этом повалился...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru