Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 28.05.2016
Сообщений: 47

WebScrapper + htmlagilitypack

18.05.2020, 14:01. Показов 408. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
я начал разрабатывать приложение. Мне нужно взять некоторую информацию с веб-сайта после загрузит ее в базу данных.Ну, мне не хватает опыта и буду благодарен за любые ваши рекомендации. например - я буду работать со спортивным сайтом. (https://terrikon.com/football/spain/championship/) Мне нужно получить информацию из таблицы и загрузить эти данные в БД. Я попробовал несколько способов загрузки данных и понял, что лучший способ - использовать «htmlagilitypack». Я прочитал документацию о работе с этой библиотекой и самое лучшее, что я сделал:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
using System;
using System.Xml;
using HtmlAgilityPack;
 
namespace Parser
{
    class Program
    {
        static void Main(string[] args)
        {
            var html = @"https://terrikon.com/football/spain/championship/";
 
            HtmlWeb web = new HtmlWeb();
 
            var htmlDoc = web.Load(html);
 
            var node = htmlDoc.DocumentNode.SelectSingleNode("//head/title");
 
            Console.WriteLine("Node Name: " + node.Name + "\n" + node.OuterHtml);
        }
    }
}
Я могу получить название сайта или всю информацию, если я изменю эту строку
C#
1
 var node = htmlDoc.DocumentNode.SelectSingleNode("//head");
Не могли бы вы дать мне совет, как я могу получать информацию только из таблицы? спасибо за внимание
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
18.05.2020, 14:01
Ответы с готовыми решениями:

HtmlAgilityPack шалит
Здравствуйте. Как-то странно ведет себя HtmlAgilityPack, или я дурак. У меня переберется список нодов и извлекается из них некие данные,...

HtmlAgilityPack - неверная кодировка
Существует метод, который получает русский текст на странице как: В нем я создал переменную кодировки encrus которую не могу понять...

Авторизация на сайте и HtmlAgilityPack
Я знаю как войти на сайте с помощью webbrowser. Как автоматизировать нажатие кнопки и т.д. НО, я не гребу как сделать это с Html...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
18.05.2020, 14:01
Помогаю со студенческими работами здесь

Парсинг сайта, HtmlAgilityPack
Использую HtmlAgilityPack, чтобы считать информацию с сайта string rate =...

HtmlAgilityPack. Обращение к элементам
структура: <a> <b>name1</b> <с>name2</с> <d> <e>name3</e> <f>name4</f> </d> ...

Парсинг Instagram с HtmlAgilityPack
Задача простая, но у меня проблема с реализацией. Нужно спарсить, например, количество подписчиков аккаунта. Написал такой код using...

Не работает HtmlAgilityPack по Xpath
В общем есть сайт к примеру http://antikey.moy.su/news/rozy_sokolov_n_i_1991/2014-01-19-6158 в хроме достал Xpath к телу новости...

HtmlAgilityPack. Исправить NullReferenceException
задача - достать имена из файла хтмл. работает не так как мне надо к сожелению. срабатывает Catch и выдает следующие сообщение 3 раза:...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru