0 / 0 / 0
Регистрация: 24.08.2020
Сообщений: 8

Парсинг ajax.php через requests

24.08.2020, 12:45. Показов 4079. Ответов 2

Студворк — интернет-сервис помощи студентам
Добрый день!
Пытаюсь спарсить страницу сайта ЖК.
При разборе через инструменты разработчика firefox вот этого сайта: https://bestcon.ru/realty/krylatskiy#shaxmatka
я обнаружил такой POST-запрос на AJAX: https://bestcon.ru/ajax/ajax.php, который выдает подгружаемую страницу (во вложении) и имеет вот эти header-ы:
HTML5
1
2
3
4
5
6
7
8
9
Host: bestcon.ru
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate, br
Connection: keep-alive
Cookie: _ym_uid=1598125995569276938; _ym_d=1598125995; _ga=GA1.2.1620956004.1598125996; _gid=GA1.2.1246129657.1598125996; _fbp=fb.1.1598125996677.2020556932; PHPSESSID=8e7pug74ce7i6aimdcd26onmm1; _ym_isad=2; _ym_visorc_27386600=w
Upgrade-Insecure-Requests: 1
Cache-Control: max-age=0
и такой payload:
HTML5
1
ajax_type=get_mode_table&id_object=9
Теперь что касается парсинга:
Когда я провожу это все через requests, конкретно так:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
headers = {'Host': 'bestcon.ru'
,'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0'
,'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'
,'Accept-Language': 'en-US,en;q=0.5'
,'Accept-Encoding': 'gzip, deflate, br'
,'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8'
,'Content-Length': '36'
,'Connection': 'keep-alive'
,'Pragma':'no-cache'
,'Cookie': '_ym_uid=1598125995569276938; _ym_d=1598125995; _ga=GA1.2.1620956004.1598125996; _gid=GA1.2.1246129657.1598125996; _ym_isad=2; _fbp=fb.1.1598125996677.2020556932; PHPSESSID=8j0k5snf76pe918qgq4i3s7bn7; _ym_visorc_27386600=w'
,'Upgrade-Insecure-Requests': '1'
,'Cache-Control': 'max-age=0'
,'TE': 'Trailers'}
 
payload = {'ajax_type':'get_mode_table', 'id_object':'9'}
 
MAX_RETRIES = 20
url ='https://bestcon.ru/ajax/ajax.php'
 
session = requests.Session()
adapter = requests.adapters.HTTPAdapter(max_retries=MAX_RETRIES)
session.mount('https://', adapter)
session.mount('http://', adapter)
 
session.get('https://bestcon.ru')
session.post(url = url, headers=headers, params = payload).text
В итоге вылезает ошибка: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response',))(во вложении скрин)
Хотя все header-ы правильно расписал. Как обойти эту ошибку и получить в response нужную страницу?
Миниатюры
Парсинг ajax.php через requests   Парсинг ajax.php через requests  
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
24.08.2020, 12:45
Ответы с готовыми решениями:

Парсинг содержимого страницы, которое формируется через AJAX
Доброго времени. Подскажите как можно реализовать парсинг содержимого, формируемого AJAX? BS4 не делает request на AJAX, а парсит...

Парсинг с использованием requests
Добрый день. Столкнулся со следующей проблемой. При попытке вытащить информацию с сайта отправлял post запрос. В качестве логина...

Парсинг olx.ua Python+requests+bs4
Пытаясь сделать парсер мобильных телефонов на сайте olx.ua столкнулся с проблемой:при отправке ajax запроса мне выдает вместо корректного...

2
Эксперт Python
 Аватар для АмигоСП
295 / 108 / 57
Регистрация: 07.12.2016
Сообщений: 209
24.08.2020, 14:14
Хидеры неверные. И в запросе ошибка. Не params=, а data=
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import requests
 
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0'}
 
payload = {'ajax_type': 'get_mode_table', 'id_object': '9'}
 
url = 'https://bestcon.ru/ajax/ajax.php'
 
session = requests.Session()
session.headers = headers
session.get('https://bestcon.ru')
text = session.post(url=url, data=payload)
print(text.text)
2
0 / 0 / 0
Регистрация: 24.08.2020
Сообщений: 8
24.08.2020, 17:34  [ТС]
Спасибо большое, получилось!
А можете сказать, если не сложно, почему в header-e только User-Agent?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
24.08.2020, 17:34
Помогаю со студенческими работами здесь

Зайти в сессию с requests и продолжить парсинг уже с Selenium
Добрый день, совсем запуталась с решением задачи: необходимо скачать картинки с нескольких страниц в одном разделе сайта (validate). ...

Парсинг страницы python и получение запроса (beautifulSoup, requests)
Здравствуйте. Суть проблемы заключается в том, что для парсинга я получаю страницу, где должна быть таблица с данными, но в print(r.text)...

Перевести PHP код на Python3 Requests
Приветствую всех. Пишу бот для телеграма, а точнее бот для вызова такси через телеграм. Есть такой PHP запрос: <?php $curl =...

Вложение через requests
Здравствуйте. Знаете, можно зайти в панель нетворк в браузере и найти там ссылку на хранилище медиафайла (Трека, видео и т.д.)? Возможно ли...

Как авторизоваться через requests
Привет всем. У меня возникла необходимость получить данные со страниц сайта iptv.live Нужная информация доступна только авторизованным...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

Новые блоги и статьи
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определенном условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
Фиксация колонок в отчете СКД
Maks 14.04.2026
Фиксация колонок в СКД отчета типа Таблица. Задача: зафиксировать три левых колонки в отчете. Процедура ПриКомпоновкеРезультата(ДокументРезультат, ДанныеРасшифровки, СтандартнаяОбработка) / / . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru