Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.73/11: Рейтинг темы: голосов - 11, средняя оценка - 4.73
0 / -1 / 0
Регистрация: 08.03.2017
Сообщений: 159

Тонкости парсинга через Fizzler и HtmlAgilityPack

17.01.2019, 21:07. Показов 2151. Ответов 1

Студворк — интернет-сервис помощи студентам
Привет. Есть простой код для парсинга сайта на HtmlAgilityPack с поддержкой Fizzler. В целом все было бы хорошо, если бы не проблема, из-за которой я уже несколько раз оставлял проект на неопределенный срок. Если выводит полученную страницу как текст, то получаю вот такие дефекты:
HTML5
1
2
3
4
<strong>
    <svg><use xlink:href="#i-chapter"></use></svg>
    <span>42 Chapters</span>
</strong>
Мне выводит "голую" страницу.
Как я понял, это из-за того, что не успевают выполняться ajax запросы. Как мне избежать этого и получить нормальную полноценную страницу?
Код софта:
C#
1
2
3
4
5
var data = new HttpRequest();
            string response = data.Get(url).ToString();
            HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
            doc.LoadHtml(response);
            richTextBox1.Text = response;
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
17.01.2019, 21:07
Ответы с готовыми решениями:

Можно ли увеличить скорость парсинга в HtmlAgilityPack?
Привет всем, я написал код для парсинга одного сайт, код рабочий, но срабатывает довольно долго(от 1-5 секунд). Hap.HtmlWeb webDoc1 =...

Обмен переменных через XOR - тонкости
main() { int a=5, b=10; a^=b; b^=a; a^=b; printf(&quot;%d %d&quot;, a, b); } main() {

Не удается полностью спарсить через HtmlAgilityPack
Пытаюсь спарсить все имена на сайте,но почему то парсинг начинается с буквы Д,а не с буквы А namespace ConsoleApplication13 { ...

1
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18243 / 14157 / 5366
Регистрация: 17.03.2014
Сообщений: 28,847
Записей в блоге: 1
17.01.2019, 21:54
Disaine, HtmlAgilityPack вообще не выполняет JavaScript. Если ты точно уверен что это из-за AJAX запросов, то посмотри какие именно запросы делает страницы, отправляй их и парси ответ.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
17.01.2019, 21:54
Помогаю со студенческими работами здесь

Выбор дочерних HTML элементов через HtmlAgilityPack
Добрый день. Я новичок в C#, поэтому не могу разобраться с таким моментом. В Python существует библиотека BeautifulSoup для парсинга...

Не открывается ссылка через webbrowser для парсинга
Есть ссылка : http://s4.radioboss.fm:8158/ Как её открыть для парса?

Тонкости наследования C#
Имееются следующие классы: public class Parent { public virtual void Foo() { ...

Тонкости с TIdMultipartFormDataStream
Есть простой код и он раньше работал на одном хостинге: var Stream: TIdMultipartFormDataStream; begin Stream :=...

Тонкости наследования
Допустим я написал класс, описывающий некую структуру данных, поля которой содержат указатели на этот же класс. Как обернуть структуру в...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru