Форум программистов, компьютерный форум, киберфорум
C# .NET
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.60/5: Рейтинг темы: голосов - 5, средняя оценка - 4.60
4 / 4 / 4
Регистрация: 01.11.2013
Сообщений: 135
.NET 4.x

Трудности при париснге HTML страницы - пустые данные

03.08.2014, 17:14. Показов 1015. Ответов 13
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте. Практикую парсинг страниц, использую HtmlAgilityPack и возникли проблемы, паршу ноду по ХPath'у и она остается пустой, т.е. не находит элемента по такому пути. Сначала грешил на HTML документ, мол, он пуст (я не знаю, ка проверить пуст ли), но когда попробовал спарсить другую информацию с этой же странице, то все прошло удачно.
В чем может быть дело? Может там есть подгрузки чего-то, что я пытаюсь спарсить уже после загрузки страницы?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
03.08.2014, 17:14
Ответы с готовыми решениями:

Программно вывести необходимые данные из HTML страницы.
Здравствуйте друзья! Я программно перешел на страницу сайта (формата страницы HTML) через приложение написанное на С#, на страничке...

Спарсить данные с HTML страницы
Имеется HTML страница, со следующими содержаниеми: <table class="table table-hover"> <thead> ...

Как получить данные с html страницы
Здравствуйте. Подскажите пожалуйста. Появилась необходимость написать программу, которая при нажатии стартовой кнопки(или по таймеру) может...

13
 Аватар для Петррр
6721 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
03.08.2014, 17:24
Значит Вы написали неправильный XPath.
0
4 / 4 / 4
Регистрация: 01.11.2013
Сообщений: 135
03.08.2014, 17:54  [ТС]
Петррр, Chrome мог дать неправильный XPath? Сомневаюсь.
0
 Аватар для Петррр
6721 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
03.08.2014, 18:36
KriBetko, продолжайте сомневаться, от этого Ваша задача не будет прогрессировать.
В Chrome работает JavaScript и после загрузки он может изменить DOM. HtmlAgilityPack не браузер, там нет JavaScript, эта библиотека, которая просто выполняет разбор текста, поэтому вполне возможно, что там нужен совсем другой XPath.
0
4 / 4 / 4
Регистрация: 01.11.2013
Сообщений: 135
03.08.2014, 18:41  [ТС]
Петррр, да, поэтому я получаю HTML через HttpRequest. А как можно определить "настоящий" XPath?
0
 Аватар для Петррр
6721 / 3570 / 900
Регистрация: 28.10.2010
Сообщений: 5,937
03.08.2014, 18:45
HtmlAgilityPack.HtmlDocument.DocumentNod e.OuterHtml
1
4 / 4 / 4
Регистрация: 01.11.2013
Сообщений: 135
03.08.2014, 19:00  [ТС]
Петррр, а как это работает?

Добавлено через 4 минуты
Петррр, стоп, это просто получение HTML дока в текст, спасибо, но мне бы основную проблему решить
0
871 / 721 / 304
Регистрация: 15.04.2013
Сообщений: 2,047
Записей в блоге: 5
03.08.2014, 19:08
KriBetko,
Возможно требуемая вам информация подгружается подгружается AJAX'ом смотрите на запросы.
0
4 / 4 / 4
Регистрация: 01.11.2013
Сообщений: 135
03.08.2014, 19:43  [ТС]
XRoy, выполняется полтора десятка JS и пара jQuery. Что-то из этого?
0
871 / 721 / 304
Регистрация: 15.04.2013
Сообщений: 2,047
Записей в блоге: 5
03.08.2014, 20:29
KriBetko,
Просмотрите полученные запросы, большая доля вероятности что там есть та информация которая вам необходима.
0
4 / 4 / 4
Регистрация: 01.11.2013
Сообщений: 135
03.08.2014, 20:40  [ТС]
XRoy, а как понять, что мне необходимо?
0
871 / 721 / 304
Регистрация: 15.04.2013
Сообщений: 2,047
Записей в блоге: 5
03.08.2014, 21:06
KriBetko,
Смотрите на ответы сервера
0
Заблокирован
03.08.2014, 21:21
KriBetko, может вы уже код покажите, откуда и как вы парсите?
1
4 / 4 / 4
Регистрация: 01.11.2013
Сообщений: 135
04.08.2014, 09:33  [ТС]
Ev_Hyper, прикрепил проект.
А откуда и что:заходите на "darkorbit.bigpoint.com" (не оставляю ссылкой), авторизируетесь данными TesTetko:125125 переходите в "Скайлэб", нажимаете на любой модуль, вкладка Апргейд и вот, я пытаюсь парсить кнопку "построить"
Вложения
Тип файла: zip ParsingTestProject.zip (177.5 Кб, 4 просмотров)
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
04.08.2014, 09:33
Помогаю со студенческими работами здесь

При сохранении HTML из TextBox появляются пустые строки
Сохраняю в файл из TextBox2.Text, смотрю сохраненный файл в блокноте, появляются в файлах *.htm пустые строки, хотя визуально в TextBox2...

МФУ HP photosmart 6510 выдает пустые страницы при ксерокопировании документов
Добрый день ! Возник следующий вопрос - МФУ HP photosmart 6510 начал выдавать пустые страницы при ксерокопировании. При этом МФУ сам...

При переходе в категории, регистрации, статистики и прочего открываются пустые страницы
Доброго времени суток! У меня возникла проблема, при переходе в категории, регистрации, статистики и прочего открываются пустые страницы....

Вытащить данные с html страницы в БД
Необходимо взять данные с HTML страницы и вставить их в свою БД

Получить данные со страницы HTML
Открыл такую тему в ветке по Делфям, но потом понял, что наверное, не совсем там спросил. Продублирую здесь - возможно, кто-то поможет,...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru