Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/18: Рейтинг темы: голосов - 18, средняя оценка - 4.50
0 / 0 / 0
Регистрация: 24.08.2020
Сообщений: 8

Парсинг ajax.php через requests

24.08.2020, 12:45. Показов 3945. Ответов 2

Студворк — интернет-сервис помощи студентам
Добрый день!
Пытаюсь спарсить страницу сайта ЖК.
При разборе через инструменты разработчика firefox вот этого сайта: https://bestcon.ru/realty/krylatskiy#shaxmatka
я обнаружил такой POST-запрос на AJAX: https://bestcon.ru/ajax/ajax.php, который выдает подгружаемую страницу (во вложении) и имеет вот эти header-ы:
HTML5
1
2
3
4
5
6
7
8
9
Host: bestcon.ru
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate, br
Connection: keep-alive
Cookie: _ym_uid=1598125995569276938; _ym_d=1598125995; _ga=GA1.2.1620956004.1598125996; _gid=GA1.2.1246129657.1598125996; _fbp=fb.1.1598125996677.2020556932; PHPSESSID=8e7pug74ce7i6aimdcd26onmm1; _ym_isad=2; _ym_visorc_27386600=w
Upgrade-Insecure-Requests: 1
Cache-Control: max-age=0
и такой payload:
HTML5
1
ajax_type=get_mode_table&id_object=9
Теперь что касается парсинга:
Когда я провожу это все через requests, конкретно так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
headers = {'Host': 'bestcon.ru'
,'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0'
,'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'
,'Accept-Language': 'en-US,en;q=0.5'
,'Accept-Encoding': 'gzip, deflate, br'
,'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8'
,'Content-Length': '36'
,'Connection': 'keep-alive'
,'Pragma':'no-cache'
,'Cookie': '_ym_uid=1598125995569276938; _ym_d=1598125995; _ga=GA1.2.1620956004.1598125996; _gid=GA1.2.1246129657.1598125996; _ym_isad=2; _fbp=fb.1.1598125996677.2020556932; PHPSESSID=8j0k5snf76pe918qgq4i3s7bn7; _ym_visorc_27386600=w'
,'Upgrade-Insecure-Requests': '1'
,'Cache-Control': 'max-age=0'
,'TE': 'Trailers'}
 
payload = {'ajax_type':'get_mode_table', 'id_object':'9'}
 
MAX_RETRIES = 20
url ='https://bestcon.ru/ajax/ajax.php'
 
session = requests.Session()
adapter = requests.adapters.HTTPAdapter(max_retries=MAX_RETRIES)
session.mount('https://', adapter)
session.mount('http://', adapter)
 
session.get('https://bestcon.ru')
session.post(url = url, headers=headers, params = payload).text
В итоге вылезает ошибка: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response',))(во вложении скрин)
Хотя все header-ы правильно расписал. Как обойти эту ошибку и получить в response нужную страницу?
Миниатюры
Парсинг ajax.php через requests   Парсинг ajax.php через requests  
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
24.08.2020, 12:45
Ответы с готовыми решениями:

Парсинг содержимого страницы, которое формируется через AJAX
Доброго времени. Подскажите как можно реализовать парсинг содержимого, формируемого AJAX? BS4 не делает request на AJAX, а парсит...

Парсинг с использованием requests
Добрый день. Столкнулся со следующей проблемой. При попытке вытащить информацию с сайта отправлял post запрос. В качестве логина...

Парсинг olx.ua Python+requests+bs4
Пытаясь сделать парсер мобильных телефонов на сайте olx.ua столкнулся с проблемой:при отправке ajax запроса мне выдает вместо корректного...

2
Эксперт Python
 Аватар для АмигоСП
295 / 108 / 57
Регистрация: 07.12.2016
Сообщений: 209
24.08.2020, 14:14
Хидеры неверные. И в запросе ошибка. Не params=, а data=
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import requests
 
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0'}
 
payload = {'ajax_type': 'get_mode_table', 'id_object': '9'}
 
url = 'https://bestcon.ru/ajax/ajax.php'
 
session = requests.Session()
session.headers = headers
session.get('https://bestcon.ru')
text = session.post(url=url, data=payload)
print(text.text)
2
0 / 0 / 0
Регистрация: 24.08.2020
Сообщений: 8
24.08.2020, 17:34  [ТС]
Спасибо большое, получилось!
А можете сказать, если не сложно, почему в header-e только User-Agent?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
24.08.2020, 17:34
Помогаю со студенческими работами здесь

Зайти в сессию с requests и продолжить парсинг уже с Selenium
Добрый день, совсем запуталась с решением задачи: необходимо скачать картинки с нескольких страниц в одном разделе сайта (validate). ...

Парсинг страницы python и получение запроса (beautifulSoup, requests)
Здравствуйте. Суть проблемы заключается в том, что для парсинга я получаю страницу, где должна быть таблица с данными, но в print(r.text)...

Перевести PHP код на Python3 Requests
Приветствую всех. Пишу бот для телеграма, а точнее бот для вызова такси через телеграм. Есть такой PHP запрос: <?php $curl =...

Вложение через requests
Здравствуйте. Знаете, можно зайти в панель нетворк в браузере и найти там ссылку на хранилище медиафайла (Трека, видео и т.д.)? Возможно ли...

Как авторизоваться через requests
Привет всем. У меня возникла необходимость получить данные со страниц сайта iptv.live Нужная информация доступна только авторизованным...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
Расскажи мне о Мире, бродяга
kumehtar 12.11.2025
— Расскажи мне о Мире, бродяга, Ты же видел моря и метели. Как сменялись короны и стяги, Как эпохи стрелою летели. - Этот мир — это крылья и горы, Снег и пламя, любовь и тревоги, И бескрайние. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru