Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.94/18: Рейтинг темы: голосов - 18, средняя оценка - 4.94
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
.NET 4.x

Как вытащить текст со Html странички? Html Agility Pack

10.10.2018, 12:38. Показов 4078. Ответов 7

Студворк — интернет-сервис помощи студентам
Всё очень просто как вытащить текст с Html странички с помощью Html Agility Pack? К примеру у нас есть страничка того же сайта
html-agility-pack.net, и нам к примеру нужна втащить текст количества скачиваний вопрос как?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
10.10.2018, 12:38
Ответы с готовыми решениями:

Парс html строки с использованием Html Agility Pack
Есть строка: <ul><li><a href="./pm.php?action=inbox" title="Всего сообщений: 0">Входящие</a><span class="tliul">:</span>...

Html Agility Pack. Как получить код только одного класса?
как я уже понял, что лучше всего будет использовать html agility pack, но пока не понимаю как именно. у меня есть код веб страницы, мне...

Html Agility Pack в Windows Phone и ошибка "Следует добавить ссылку на сборку "System.Xml.XPath"
public BashPage() { InitializeComponent(); HtmlDocument doc = new HtmlDocument(); ...

7
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18244 / 14158 / 5366
Регистрация: 17.03.2014
Сообщений: 28,847
Записей в блоге: 1
10.10.2018, 14:02
MacTony, в случае с Html Agility Pack главное это найти XPath для нужного узла. В данном можно искать по атрибуту class
C#
1
2
3
var web = new HtmlWeb();
HtmlDocument doc = web.Load("http://html-agility-pack.net/");
string downloads = doc.DocumentNode.SelectSingleNode("//div[contains(@class, 'style-4')]").InnerText.Trim();
1
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
11.10.2018, 16:54  [ТС]
OwenGlendower. Здравствуйте! Спасибо за такой исчерпывающий ответ! Но у меня вопрос, как вы нашли XPath, через какие инструменты?
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18244 / 14158 / 5366
Регистрация: 17.03.2014
Сообщений: 28,847
Записей в блоге: 1
11.10.2018, 17:12
MacTony, взял CSS селектор из инструментов разработчика в браузере и переписал в xpath. Есть расширения позволяющие сразу получать xpath из html.
0
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
11.10.2018, 17:56  [ТС]
А какой браузер вы использовали?
0
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18244 / 14158 / 5366
Регистрация: 17.03.2014
Сообщений: 28,847
Записей в блоге: 1
11.10.2018, 18:12
MacTony, Firefox, но это не имеет значения. Инструменты веб-разработчика есть во всех современных браузерах.
0
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
11.10.2018, 18:48  [ТС]
Просто у меня в Google XPacth видимо не корректно работает, я копирую к примеру вот этот XPacth под Downloaded more than значение XPacth: //*[@id="downloadCount"]/div[2] я его подставляю в поле
C#
1
2
3
string downloads = doc.DocumentNode
                .SelectSingleNode("//*[@id='downloadCount']/div[2]")
                .InnerText.Trim();
но в строке downloads 0 почему?
0
1 / 0 / 1
Регистрация: 29.01.2018
Сообщений: 22
11.10.2018, 18:51  [ТС]
Вот весь код:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using HtmlAgilityPack;
using System.Net;
using System.Net.Http;
using System.IO;
 
namespace Parser
{
    class Program
    {
        static void Main(string[] args)
        {
 
            var web = new HtmlWeb();
            HtmlDocument doc = web.Load("http://html-agility-pack.net/");
            string downloads = doc.DocumentNode
                .SelectSingleNode("//*[@id='downloadCount']/div[2]")
                .InnerText.Trim();////div[contains(@class, 'style-4')]
 
            Console.WriteLine(downloads);
            Console.ReadLine();
 
        }
    }
}
Вывод:
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
11.10.2018, 18:51
Помогаю со студенческими работами здесь

Вытаскивание слова из html странички
Здраствуйте, В исходном коде странички есть строка <tr><th>Страна:</th><td>Китай</td></tr> как вытащить значение поля страны...

Как мне вытащить значение из (HTML table) по нажатию на button
Есть в aspx вот это: <asp:Table ID="FindCompanyTable" runat="server" style="width:100%; height:100%"></asp:Table> Я заполняю...

Как получить html-код странички в переменную string
Доброго времени суток, как получить html код странички в стринг? На впф: WebClient client = new WebClient(); ...

Html Agility Pack. Не работает SelectNodes
Вро де не большой код отказывается работать, все делал по примерам, и все равно не работает пишет "ссылка на объект не указывает на...

Программа с Html Agility Pack у пользователя
Доброго времени суток, использую HAP в своей программе, и когда скидую exe другу, у него появляеться такой вот эрор: ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru