Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/6: Рейтинг темы: голосов - 6, средняя оценка - 4.67
 Аватар для Vigi
641 / 481 / 179
Регистрация: 28.05.2012
Сообщений: 1,419

Распарсить полученую html страницу

03.09.2015, 12:17. Показов 1320. Ответов 5
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
ссылка: http://soft.softodrom.ru/ap/Tr... ctor-p4360

Написал метод получить ее html код:

C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
public string Get_Html(string url)
        {
            string result = null;
 
            WebRequest req = WebRequest.Create(url);
            WebResponse resp = req.GetResponse();
            Stream stream = resp.GetResponseStream();
            StreamReader rdr = new StreamReader(stream, Encoding.GetEncoding("utf-8"));
 
            result = rdr.ReadToEnd();
            resp.Close();
 
            return result;
        }
Нужно из этой страницы выдернуть все комменарии (Отзывы). Подскажите чем лучше это сделать регуляркой, а может какой нить библиотекой ?

Спасибо...
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
03.09.2015, 12:17
Ответы с готовыми решениями:

Распарсить HTML-страницу
например я Напишу страницу в техбох1 а при нажатие на кнопки спарсить он должен загрузить себе весь код страницы а потом выбрать все...

Распарсить HTML страницу
Здрям! На форме будут размещен элемент webBrowser и через него буду открывать страницу. Код страницы выглядит так: <tr> ...

Распарсить локальную HTML-страницу
Привет ! Я вот только начинаю знакомство с языком C#.. Хочу спросить у вас, с помощью каких операций и классов лучше реализовать следующие...

5
TheGreatCornholio
 Аватар для Woldemar89
1255 / 733 / 285
Регистрация: 30.07.2015
Сообщений: 2,408
03.09.2015, 12:32
Цитата Сообщение от Vigi Посмотреть сообщение
может какой нить библиотекой
Html Agility Pack: распарсить страницу
1
43 / 43 / 21
Регистрация: 24.08.2015
Сообщений: 136
03.09.2015, 12:37
Полно библиотек для парсинга HTML и примеров с регуляркой
http://habrahabr.ru/post/112325/
http://stackoverflow.com/quest... ading-html
1
TheGreatCornholio
 Аватар для Woldemar89
1255 / 733 / 285
Регистрация: 30.07.2015
Сообщений: 2,408
03.09.2015, 12:50
По быстрому накатал - сам поправь, что нужно)
Вложения
Тип файла: zip comments.zip (107.7 Кб, 10 просмотров)
1
TheGreatCornholio
 Аватар для Woldemar89
1255 / 733 / 285
Регистрация: 30.07.2015
Сообщений: 2,408
03.09.2015, 13:03
Лучший ответ Сообщение было отмечено Vigi как решение

Решение

Так - исчезнут дубли заголовков.
C#
1
var findclasses = htmlDoc.DocumentNode.Descendants("div").Where(d => d.Attributes.Contains("class") && d.Attributes["class"].Value.Contains("comment") && !d.Attributes["class"].Value.Contains("comment_header"));
Добавлено через 7 минут
А так хлам почистить из строк. Вроде все)
C#
1
2
foreach (var clas in findclasses)
richTextBox1.Text += clas.InnerText.Replace("\r", "").Replace("\t", "").Replace("  ", "").Replace("  ", "").Substring(2);
1
 Аватар для Vigi
641 / 481 / 179
Регистрация: 28.05.2012
Сообщений: 1,419
03.09.2015, 13:26  [ТС]
Всем спасибо!!! Буду курить библиотеки
Woldemar89 отделное сенькс. То что надо...
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
03.09.2015, 13:26
Помогаю со студенческими работами здесь

HTml Agility Pack: распарсить страницу
Три дня не могу распарсить таблицу списка файлов на сайте rutracker.org. Помогите, мне нужно данные с таблицы добавить в свой datagrid.

Html Agility Pack: распарсить страницу
Имеется HTML код <tr> <td class=""> Побед: </td> <td class="td-number-nowidth">...

Распарсить страницу через Html Agility Pack
Имеется страница с разметкой такого Типа : <span id='1_46' class='tree1_1' onclick="collapse('1_46','2_46')";>ФАКТОРЫ...

Составление регулярных выражений. Распарсить HTML-страницу
Всем доброго времени суток! Этой темы касаюсь впервые, а так как опыта программирования мало никак не могу самостоятельно понять, поэтому...

Распарсить HTML страницу для получения теста между тегами
Собственно проблема заключается в том что не получается спарсить текст между тэгов, пробовал все возможные способы. Есть html код: ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 12.02.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами и вызывать обработчики событий столкновения. . . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 11.02.2026
Содержание блога Библиотека SDL3 содержит встроенные инструменты для базовой работы с изображениями - без использования библиотеки SDL3_image. Пошагово создадим проект для загрузки изображения. . .
SDL3 для Web (WebAssembly): Загрузка PNG с прозрачным фоном с помощью SDL3_image
8Observer8 10.02.2026
Содержание блога Библиотека SDL3_image содержит инструменты для расширенной работы с изображениями. Пошагово создадим проект для загрузки изображения формата PNG с альфа-каналом (с прозрачным. . .
Установка Qt-версии Lazarus IDE в Debian Trixie Xfce
volvo 10.02.2026
В общем, достали меня глюки IDE Лазаруса, собранной с использованием набора виджетов Gtk2 (конкретно: если набирать текст в редакторе и вызвать подсказку через Ctrl+Space, то после закрытия окошка. . .
SDL3 для Web (WebAssembly): Работа со звуком через SDL3_mixer
8Observer8 08.02.2026
Содержание блога Пошагово создадим проект для загрузки звукового файла и воспроизведения звука с помощью библиотеки SDL3_mixer. Звук будет воспроизводиться по клику мышки по холсту на Desktop и по. . .
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru