Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
2 / 2 / 0
Регистрация: 05.12.2013
Сообщений: 271

Подскажите по парсингу, не могу понять почему не работает xpath

29.08.2018, 12:43. Показов 1016. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Есть программка, хочу парсить страницу, использую HtmlAgilityPack, беру элемент нужный из кода по пути xpath, но нахожу только один элемент, а как найти Все элементы. Парсинг вот этой страницы https://www.rabota66.ru/resume как правильно построить выражение. Хочу получить все ссылки категорий резюме например Бухгалтерия, финансы и экономика предприятия и тд.



C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net;
using System.Text;
using System.Threading.Tasks;
using HtmlAgilityPack;
 
namespace probaparser
{
    class Program
    {
        static void Main(string[] args)
        {
 
 
            string uri1 = "https://www.rabota66.ru/resume";
            
                 
            
            
            HtmlAgilityPack.HtmlDocument Doc=new HtmlDocument();
 
            Doc.LoadHtml(Get(uri1));
 
            var c = Doc.DocumentNode.SelectNodes("//*[@id='categoryTreeFull']/tbody[2]/tr/td[1]/a"); // вот выражение xpath
 
            //*[@id="categoryTreeFull"]
            foreach (var VARIABLE in c)
            {
                Console.WriteLine(VARIABLE);
            }
            
            
            
            Console.ReadKey();
 
 
        }
 
 
 
        public static string Get(string url)
        {
 
            try
            {
 
                var httpWebRequest = (HttpWebRequest)WebRequest.Create(url);
                httpWebRequest.AllowAutoRedirect = false;
                httpWebRequest.Referer = "http://google.com"; // Реферер. Тут можно указать любой URL
                using (var httpWebResponse = (HttpWebResponse)httpWebRequest.GetResponse())
                {
                    using (var stream = httpWebResponse.GetResponseStream())
                    {
                        using (var reader = new StreamReader(stream, Encoding.GetEncoding(httpWebResponse.CharacterSet)))
                        {
                            return reader.ReadToEnd();
                        }
                    }
                }
 
 
            }
            catch (Exception e)
            {
                return string.Empty;
 
            }
 
 
 
        }
    }
}
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.08.2018, 12:43
Ответы с готовыми решениями:

Подскажите, не работает код, не могу понять почему - вроде бы все правильно
Доброго времени суток Есть задача - при клике на кнопку должен создаваться параграф в теле документа, в который добавляется значение...

Не могу понять, почему программа работает неправильно( Знаю, что где-то ошибки, но не могу найти
{Ввести последовательность натуральных чисел Aj j=1...n (n<=1000). Упорядочить последовательность по неубыванию наименььшей цифры...

Не работает изменение, не могу понять почему, Update не работает, ошибку выдает
Помогите, изменение с помощью button string u = заявкиDataGridView.CurrentRow.Cells.Value.ToString(); ...

3
Эксперт .NET
 Аватар для kolorotur
17823 / 12973 / 3382
Регистрация: 17.09.2011
Сообщений: 21,261
29.08.2018, 12:47
Цитата Сообщение от Мдфв1234 Посмотреть сообщение
но нахожу только один элемент
У вас же в пути указано брать только второй элемент tbody: //*[@id='categoryTreeFull']/tbody[2]/tr/td[1]/a
Уберите индексатор и будете получать все элементы tbody.
0
2 / 2 / 0
Регистрация: 05.12.2013
Сообщений: 271
29.08.2018, 14:16  [ТС]
Ок спасибо

Добавлено через 1 час 22 минуты
А как искать внутри самого тега, например вот взял я страницу, нашел блоки допустим с резюме на странице их 30 штук, теперь по логике мне нужно,в каждом резюме вытащить нужные мне теги. Вопрос как вытаскивать нужные теги. Например заголовок резюме, у заголовка такой тег <h2 data-ga="resumeListItem">Главный бухгалтер</h2>
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net;
using System.Text;
using System.Threading.Tasks;
using HtmlAgilityPack;
 
namespace probaparser
{
    class Program
    {
        static void Main(string[] args)
        {
 
 
        
            
            string uri = "https://www.rabota66.ru/resume/rbranch1";
            
            
            
           
 
            HtmlAgilityPack.HtmlDocument Doc1 = new HtmlDocument();
 
            Doc1.LoadHtml(Get(uri));
 
            ////*[@id='resume-list']/ul  // лист с резюме
 
 
          
 
            var g = Doc1.DocumentNode.SelectNodes("//*[@class='vrl-one vrl-one-2 vrl-detaled- show- clearfix']/div[3]"); // вот нашел я все блоки с резюме на странице 
 
            foreach (var n in g) в каждом блоке хочу вытащить Теги  с заголовком и описанием резюме.
            {
                var zagolovok = n.;
 
 
 
 
            }
 
 
 
            
            Console.ReadKey();
 
 
 
        }
 
 
 
        public static string Get(string url)
        {
 
            try
            {
 
                var httpWebRequest = (HttpWebRequest)WebRequest.Create(url);
                httpWebRequest.AllowAutoRedirect = false;
                httpWebRequest.Referer = "http://google.com"; // Реферер. Тут можно указать любой URL
                using (var httpWebResponse = (HttpWebResponse)httpWebRequest.GetResponse())
                {
                    using (var stream = httpWebResponse.GetResponseStream())
                    {
                        using (var reader = new StreamReader(stream, Encoding.GetEncoding(httpWebResponse.CharacterSet)))
                        {
                            return reader.ReadToEnd();
                        }
                    }
                }
 
 
            }
            catch (Exception e)
            {
                return string.Empty;
 
            }
 
 
 
        }
    }
 
   
}
0
 Аватар для zewer
2357 / 1775 / 212
Регистрация: 07.01.2011
Сообщений: 10,342
30.08.2018, 21:44
Цитата Сообщение от Мдфв1234 Посмотреть сообщение
в каждом резюме вытащить нужные мне теги
какие еще теги? Может текст?
tag - h2 в вашем примере, зачем оно вам?

Добавлено через 9 минут
Цитата Сообщение от Мдфв1234 Посмотреть сообщение
C#
1
2
3
4
            foreach (var n in g) в каждом блоке хочу вытащить Теги *с заголовком и описанием резюме.
            {
                  var zagolovok = n.;
            }
C#
1
         var headerText = g.Select(x => x.InnerText).ToList();
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
30.08.2018, 21:44
Помогаю со студенческими работами здесь

Не могу понять почему не работает (или правильно не работает)
#include &lt;iostream.h&gt; #include &lt;conio.h&gt; #define N 5 #define M 3 void main() { int a; int i,j; cout&lt;&lt;&quot;nachalnya...

не могу понять почему не работает js
&lt;form&gt;&lt;div style=&quot;color:red; text-decoration:underline&quot;&gt; &lt;p onmouseover=&quot;f1&quot;()&gt;Группа 1&lt;/p&gt; &lt;ul id=&quot;group_1&quot; name=&quot;group_1&quot;&gt;&lt;/ul&gt; ...

Не могу понять, почему не работает
В общем, заметил странную особенность. Когда пытаюсь обратиться к пустому указателю в двумерном массиве, программа просто крашится. Хотя...

Не могу понять почему не работает
#include &lt;iostream&gt; #include &lt;string&gt; using namespace std; const int arrSize = 15; int main() { string Phone; ...

Не могу понять, почему не работает
Не могу понять, почему не не рабоате background, путь к изображению прописал нормально, в файле css тоже вреде все норм. Должно быть...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
Как я обхитрил таблицу Word
Alexander-7 21.03.2026
Когда мигает курсор у внешнего края таблицы, и нам надо перейти на новую строку, а при нажатии Enter создается новый ряд таблицы с ячейками, то мы вместо нервных нажатий Энтеров мы пишем любые буквы. . .
Krabik - рыболовный бот для WoW 3.3.5a
AmbA 21.03.2026
без регистрации и смс. Это не торговля, приложение не содержит рекламы. Выполняет свою непосредственную задачу - автоматизацию рыбалки в WoW - и ничего более. Однако если админы будут против -. . .
Программный отбор значений справочника
Maks 21.03.2026
Установка программного отбора значений справочника "Сотрудники" из модуля формы документа. В качестве фильтра для отбора служит предопределенное значение перечислений. Процедура. . .
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru