|
Си-решеточник
141 / 135 / 60
Регистрация: 07.02.2011
Сообщений: 669
|
|
Парсинг сайта с авторизацией30.08.2014, 11:54. Показов 3420. Ответов 12
Метки нет (Все метки)
Всем доброго времени суток.
Необходимо пропарсить несколько страниц сайт, при этом заранее авторизировавшись. Для парсинга использую HTML Agility Pack, но так и не разобрался как через него перед парсингом предварительно авторизироваться на сайте. Авторизация проходит посредством POST запроса, в котором отсылаются 3 переменных (логин, пароль и флаг авторизации). Есть подобная возможность в HTML Agility Pack? P.S. Парсить вручную как-то совсем не хочется.
0
|
|
| 30.08.2014, 11:54 | |
|
Ответы с готовыми решениями:
12
Парсинг сайта с авторизацией Парсинг с авторизацией Парсинг с авторизацией в Python. |
|
40 / 40 / 13
Регистрация: 09.07.2014
Сообщений: 116
|
|
| 30.08.2014, 13:49 | |
|
А чем плох POST из стандартного HttpWebRequest?
0
|
|
|
Си-решеточник
141 / 135 / 60
Регистрация: 07.02.2011
Сообщений: 669
|
||
| 30.08.2014, 13:58 [ТС] | ||
|
0
|
||
|
40 / 40 / 13
Регистрация: 09.07.2014
Сообщений: 116
|
|
| 30.08.2014, 14:03 | |
|
Я думаю нет ничего невозможного, если оба класса используют один и тот же контейнер. Но стоит ли оно того, что бы парсить несколько страниц с помощью неизвестной библиотеки из-за которой не получается довести дело до конца. Я просто никогда не понимала людей которые так делают. Попросите помочь вам "вручную" пропарсиь эти страницы, это не сложно на самом деле.
0
|
|
|
Си-решеточник
141 / 135 / 60
Регистрация: 07.02.2011
Сообщений: 669
|
||
| 30.08.2014, 14:10 [ТС] | ||
|
Эта библиотека - одна с самых известных для парсинга HTML в принципе, так что насчет "неизвестной библиотеки" вы погорячились Уверен, что здесь хватает людей, которые уже изучили её вдоль и поперек
0
|
||
|
1274 / 975 / 113
Регистрация: 12.01.2010
Сообщений: 1,971
|
|
| 30.08.2014, 14:15 | |
|
как вообще связаны авторизация и htmlagilitypack?
библиотека не умеет качать страницы из инета, нет такого функционала
0
|
|
|
40 / 40 / 13
Регистрация: 09.07.2014
Сообщений: 116
|
|
| 30.08.2014, 14:15 | |
|
Ну я бы не назвала парсинг исходной html с помощью тех же регулярок - велосипедом. Всегда так делаю и пока все получалось.
![]() Получить исходную страницу это дело нескольких строк, а потом уже смотреть на это как на обычный текстовый файл из которого можно достать, что нужно с помощью своих алгоритмов, которые так же будут занимать не очень много места в коде. Может и погорячилась, но на счет "займет больше времени" я тоже не соглашусь.
0
|
|
|
1274 / 975 / 113
Регистрация: 12.01.2010
Сообщений: 1,971
|
|
| 30.08.2014, 14:16 | |
|
скачка страницы - это одно
парсинг скаченной страницы - совершенной другое, никак не связанное со скачкой
0
|
|
|
Си-решеточник
141 / 135 / 60
Регистрация: 07.02.2011
Сообщений: 669
|
||||||||
| 30.08.2014, 14:20 [ТС] | ||||||||
0
|
||||||||
|
40 / 40 / 13
Регистрация: 09.07.2014
Сообщений: 116
|
||
| 30.08.2014, 14:21 | ||
Не думаю, что мой метод будет намного хуже других.
0
|
||
|
Си-решеточник
141 / 135 / 60
Регистрация: 07.02.2011
Сообщений: 669
|
||
| 30.08.2014, 14:24 [ТС] | ||
|
Добавлено через 3 минуты
![]() Но если вдруг кто всё таки знает способ пропарсить авторизированную страницу через HTML Agility Pack - прошу помощи!
1
|
||
|
Заблокирован
|
|
| 30.08.2014, 14:29 | |
|
Rameron, прочел сообщения, но так и не понял в чем проблема:
В использовании HTML Agility Pack? В авторизации на сайте с помощью и считывания кода страницы?
0
|
|
|
Си-решеточник
141 / 135 / 60
Регистрация: 07.02.2011
Сообщений: 669
|
|
| 30.08.2014, 14:46 [ТС] | |
|
Добавлено через 12 минут
И тут меня осенило... m0nax, спасибо! Я не знал, что в HTML Agility Pack можно пихать прямо исходный код страницы и парсить. Проблема решена!
0
|
|
| 30.08.2014, 14:46 | |
|
Помогаю со студенческими работами здесь
13
Парсинг форума с авторизацией Парсинг web-страницы с авторизацией Парсинг данных получаемых от сервиса с авторизацией Скачать страницы сайта с авторизацией Парсинг данных с сайта или страницы сайта Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|