Форум программистов, компьютерный форум, киберфорум
Наши страницы
C# .NET
Войти
Регистрация
Восстановить пароль
 
puma3085
38 / 1 / 0
Регистрация: 27.03.2014
Сообщений: 38
1

Избавление от &_shy_; при парсинге страницы

30.08.2016, 23:56. Просмотров 259. Ответов 1
Метки нет (Все метки)

Доброго времени суток. Пытаюсь спарсить страницу вот таким вот кодом
C#
1
2
3
4
5
6
7
WebClient wClient = new WebClient();
wClient.Encoding = Encoding.UTF8;
wClient.Proxy = null;
Uri uri = new Uri(url);
html = wClient.DownloadString(uri);
html = html.Replace("&_shy_;", "");//без подчеркиваний. Киберфорум заменяет автоматом без них
html = html.Replace(" ", " ");
При этом часть этих переносов(вроде так они называются) исчезает, но половина, вероятнее всего при получении html кода заменяется на -, т.е. получается такой текст дво-ич-ная за-пись ко-то-ро-го со-дер-жит 5 единиц. Каким образом можно такое исправить и можно ли вообще?
Если нет, то тогда для отображения консоль использовать нельзя, надо использовать что-то на подобие WebView(не писал не разу проект Windows Forms, поэтому не знаю названий точных) или как-то можно по другому? Заранее спасибо
0
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
30.08.2016, 23:56
Ответы с готовыми решениями:

Слетела кодировка при парсинге html-страницы
Здравствуйте! Начал писать программу которая парсит сайт. В заголовке...

Ошибка при парсинге IP
Какая-то странная ошибка возникает при парсинге строки Ip. Сама строка берётся...

Out of memory при парсинге с webBrowser
Друзья, посоветуйте почему выдает out of memory??? Есть множество ссылок на...

Исключение при парсинге JArray
Здравствуйте! Имеется JSON строка следующего типа: { "employees": } ...

Пустой cellRange.Value при парсинге Excel
Здравствуйте! Пишу парсер Excel. Написал шаблоны уже для множества файлов, но...

1
imbananko
0 / 0 / 0
Регистрация: 05.09.2016
Сообщений: 3
06.09.2016, 14:47 2
Привет
попробуй использовать WebUtility.HtmlDecode
0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
06.09.2016, 14:47

При парсинге с помощью XDocument данные не выводятся
Добрый день, Есть хмл файл примерно с такой структурой <Шапка ...

Валидатор указывает на ошибочную ссылку, вместо & нужно & amp
Использую браузер FF 8.0, на нем установлен HTML Vallidator. Так вот этот...

Избавление от рефлексии
Добрый день, уважаемые форумчане. Такой вопрос. Имеется несколько классов,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru