|
5 / 8 / 4
Регистрация: 31.08.2013
Сообщений: 350
|
||||||
Найти число в HTML по по атрибуту. (Парсинг сайта)22.12.2016, 22:12. Показов 1319. Ответов 12
Мне нужно на страницах сайта найти числа в ссылке (тег <a>)
Сама ссылка имеет такую структуру:
Я ни разу не парсил, поэтому не в курсе как это делается. В инете нашел кое-что, сам принцип. Но мне нужно составить регулярное выражение на эту строку( как я понял). С регулярными выражениями то же дело не имел.
0
|
||||||
| 22.12.2016, 22:12 | |
|
Ответы с готовыми решениями:
12
Найти элемент в HTML по атрибуту class
|
|
979 / 874 / 350
Регистрация: 26.04.2012
Сообщений: 2,647
|
|
| 23.12.2016, 00:56 | |
|
Worldmen, HTML парсится HtmlAgilityPackом или аналогами. Регулярками его парсить-моветон.
0
|
|
|
Администратор
|
||||||
| 23.12.2016, 03:53 | ||||||
|
Worldmen, поддерживаю EvilFromHell - html лучше парсить специальными библиотеками. С другой стороны никто не запрещает комбинировать разные подходы. Вот пример с использованием HtmlAgilityPack:
2
|
||||||
|
5 / 8 / 4
Регистрация: 31.08.2013
Сообщений: 350
|
||||||||||||||||
| 23.12.2016, 23:12 [ТС] | ||||||||||||||||
|
Как всегда забыл. Еще нужно в том же коде имя вытянуть и ссылку на пользователя. Оно храниться в таком виде:
Добавлено через 10 минут Все данные находятся в одном теге div:
0
|
||||||||||||||||
|
Администратор
|
|||||||||||
| 23.12.2016, 23:18 | |||||||||||
|
Worldmen, как-то так
Дополнение
1
|
|||||||||||
|
5 / 8 / 4
Регистрация: 31.08.2013
Сообщений: 350
|
||
| 24.12.2016, 00:34 [ТС] | ||
|
почему-то на этой строке ошибка "ссылка на объект не указывает на экземпляр объекта"
что-то могло быть не инициализировано?
0
|
||
|
Администратор
|
||||||
| 24.12.2016, 00:51 | ||||||
|
Worldmen, возможно NextSibling возвращает не span, а текстовый узел между <a> и <span>. Попробуй вот такой вариант
0
|
||||||
|
5 / 8 / 4
Регистрация: 31.08.2013
Сообщений: 350
|
||||||
| 24.12.2016, 00:57 [ТС] | ||||||
|
Похоже из-за круглых скобок:
0
|
||||||
|
Администратор
|
|
| 24.12.2016, 01:00 | |
|
Worldmen, скобки можно обрезать. Или добавить вызов SelectSingleNode("a") как в примере выше.
1
|
|
|
5 / 8 / 4
Регистрация: 31.08.2013
Сообщений: 350
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
| 24.12.2016, 18:29 [ТС] | |||||||||||||||||||||||||||||||||||||||||||||||||||
|
Хочу убедиться точно, что выводит
поэтому изменил тип :
если просто написать:
Добавлено через 35 минут Еще дума, что в это поле не попадает FeedBack = nodeUserLink.NextSibling.SelectSingleNod e("a").InnerText потому, что мы выбираем по
Кликните здесь для просмотра всего текста
Добавлено через 52 минуты Пробую сделать по другому, через:
Попробовал сделать так:
Добавлено через 14 минут получилось, нужно так (InnerHtml):
0
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
|
979 / 874 / 350
Регистрация: 26.04.2012
Сообщений: 2,647
|
|
| 24.12.2016, 22:20 | |
|
Worldmen, не понимаю, зачем тыкать пальцем в небо, когда в отладчике видны значения всех переменных. Достаточно разбить код так, чтобы операций на строку было поменьше, и поставить точки останова. Дальше будет сразу видно, что именно неправильно и почему.
0
|
|
|
5 / 8 / 4
Регистрация: 31.08.2013
Сообщений: 350
|
|
| 24.12.2016, 22:46 [ТС] | |
|
естественно делал точки останова, но при ошибке "Ссылка на объект не указывает на экземпляр объекта" в той строке ничего не показывал. Или я не правильно смотрел.
0
|
|
|
979 / 874 / 350
Регистрация: 26.04.2012
Сообщений: 2,647
|
|
| 24.12.2016, 23:03 | |
|
Worldmen, ну раз ссылка на объект не указывается на экземпляр объекта-значит что-то, к чему вы обращаетесь, равно null. Что именно и почему-отлично видно в отладчике.
0
|
|
| 24.12.2016, 23:03 | |
|
Помогаю со студенческими работами здесь
13
Парсинг делают одновременно со скачиванием html, или в конце со скачанным html Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
Оттенки серого
Argus19 18.03.2026
Оттенки серого
Нашёл в интернете 3 прекрасных модуля:
Модуль класса открытия диалога открытия/ сохранения файла на Win32 API;
Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
|
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога
Финальные проекты на Си и на C++:
finish-rectangles-sdl3-c. zip
finish-rectangles-sdl3-cpp. zip
|
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие.
Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
|
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ВВЕДЕНИЕ
Выполняя задание на управление насосной группой заполнения резервуара,. . .
|
|
делаю науч статью по влиянию грибов на сукцессию
anaschu 13.03.2026
прикрепляю статью
|
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога
Финальные проекты на Си и на C++:
hello-sdl3-c. zip
hello-sdl3-cpp. zip
Результат:
|
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога
MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
|
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд.
Даже если у вас. . .
|