Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.88/8: Рейтинг темы: голосов - 8, средняя оценка - 4.88
0 / 0 / 0
Регистрация: 05.01.2017
Сообщений: 13

Requests и bs4 python 3

05.02.2019, 17:54. Показов 1858. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет, начала недавно изучать питон и решил поработать с запросами, такой вопрос возник - использую requests для запроса и bs4 для обработки html страницы. Вообщем делаю запрос и получаю тот блок страницы который мне нужен:
Python
1
r = requests.get(url+'?page='+str(i))
Python
1
soup = BeautifulSoup(r.text, 'html.parser')
Python
1
ids = soup.find('script',{'id':'jsdata'})
Ответ выглядит вот так:
HTML5
1
2
3
<script id="jsdata">
        var data = {"search":{"currentPage":1,"ids":[48187056,48264670,48388854,46867214,48381677,26123178,30902897,30851373,48674901,48640537,16971863,46574579,29431520,47743779,47816176,29525233,48698292,48423335,27989106,30148051,47778545,30269946,47109461],"regionId":null,"isOnMap":false,"userId":null,"parameters":{"section":"prodazha","category":"kvartiry","page":"0"},"nbTotal":"128 509"},"category":{"id":1,"hasPrice":true,"name":"sell.flat","sectionName":"sell","categoryName":"flat","defaultCurrency":1},"svgIconsUrl":"//krisha.kz/static/frontend/svg/svg-symbols.bbaf7fb734.svg","app":"Frontend","baseHostname":"krisha.kz","cookieDomain":".krisha.kz","isRemoteResourcesEnabled":true,"isDebug":false,"route":"advert:search","controller":"a","action":"search","ab":[],"user":{"email":null,"isGuest":true,"isPro":false,"isCompany":false,"id":null,"name":null,"locale":"","xdmAssetUrl":"https://id.kolesa.kz/authToken.js"},"photoHost":"photos-kr.kcdn.kz","views":{"location":"ms/views"}};
    </script>
Теперь из ответа не могу получить чисто вот это:
HTML5
1
[48187056,48264670,48388854,46867214,48381677,26123178,30902897,30851373,48674901,48640537,16971863,46574579,29431520,47743779,47816176,29525233,48698292,48423335,27989106,30148051,47778545,30269946,47109461]
Заранее спасибо!)
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
05.02.2019, 17:54
Ответы с готовыми решениями:

Парсинг olx.ua Python+requests+bs4
Пытаясь сделать парсер мобильных телефонов на сайте olx.ua столкнулся с проблемой:при отправке ajax запроса мне выдает вместо корректного...

Как достать ссылку из поисковой системы Яндекс? (Парсинг, python, bs4)
Возникла проблема при парсинге поисковой системы Яндекса. Необходимо сравнить ссылку, которую вводит пользователь и который есть на...

Python-requests
Здравствуйте, на локалке всё хорошо было, а на сервере столкнулся такой ошибкой: http://********/zANDl3BSlqaLqm.png Не подскажет ли...

2
Эксперт Python
5438 / 3859 / 1215
Регистрация: 28.10.2013
Сообщений: 9,552
Записей в блоге: 1
05.02.2019, 18:32
Возьмите только текст тега script. Затем сделайте split по "var data = "
Вот так:
Python
1
>>> data = text.split('var data = ')[1]
И затем полученный json просто превратите в обычный python словарь
Python
1
2
3
4
>>> import json
>>> json.loads(data)
{'search': {'currentPage': 1, 'ids': [48187056, 48264670, 48388854, 46867214, 48381677, 26123178, 30902897, 30851373, 48674901, 48640537, 16971863, 46574579, 29431520, 47743779, 47816176, 29525233, 48698292, 48423335, 27989106, 30148051, 47778545, 30269946, 47109461], 'regionId': None, 'isOnMap': False, 'userId': None, 'parameters': {'section': 'prodazha', 'category': 'kvartiry', 'page': '0'}, 'nbTotal': '128 509'}, 'category': {'id': 1, 'hasPrice': True, 'name': 'sell.flat', 'sectionName': 'sell', 'categoryName': 'flat', 'defaultCurrency': 1}, 'svgIconsUrl': '//krisha.kz/static/frontend/svg/svg-symbols.bbaf7fb734.svg', 'app': 'Frontend', 'baseHostname': 'krisha.kz', 'cookieDomain': '.krisha.kz', 'isRemoteResourcesEnabled': True, 'isDebug': False, 'route': 'advert:search', 'controller': 'a', 'action': 'search', 'ab': [], 'user': {'email': None, 'isGuest': True, 'isPro': False, 'isCompany': False, 'id': None, 'name': None, 'locale': '', 'xdmAssetUrl': 'https://id.kolesa.kz/authToken.js'}, 'photoHost': 'photos-kr.kcdn.kz', 'views': {'location': 'ms/views'}}
>>>
из которого можно уже взять по ключу что угодно.
0
Просто Лис
Эксперт Python
 Аватар для Рыжий Лис
5973 / 3735 / 1099
Регистрация: 17.05.2012
Сообщений: 10,791
Записей в блоге: 9
06.02.2019, 16:25
Python
1
2
3
4
5
6
7
8
9
10
11
import re
from json import JSONDecoder
 
t = '''
    <script id="jsdata">
        var data = {"search":{"currentPage":1,"ids":[48187056,48264670,48388854,46867214,48381677,26123178,30902897,30851373,48674901,48640537,16971863,46574579,29431520,47743779,47816176,29525233,48698292,48423335,27989106,30148051,47778545,30269946,47109461],"regionId":null,"isOnMap":false,"userId":null,"parameters":{"section":"prodazha","category":"kvartiry","page":"0"},"nbTotal":"128 509"},"category":{"id":1,"hasPrice":true,"name":"sell.flat","sectionName":"sell","categoryName":"flat","defaultCurrency":1},"svgIconsUrl":"//krisha.kz/static/frontend/svg/svg-symbols.bbaf7fb734.svg","app":"Frontend","baseHostname":"krisha.kz","cookieDomain":".krisha.kz","isRemoteResourcesEnabled":true,"isDebug":false,"route":"advert:search","controller":"a","action":"search","ab":[],"user":{"email":null,"isGuest":true,"isPro":false,"isCompany":false,"id":null,"name":null,"locale":"","xdmAssetUrl":"https://id.kolesa.kz/authToken.js"},"photoHost":"photos-kr.kcdn.kz","views":{"location":"ms/views"}};
    </script>
    '''
d = re.findall(r'({.*})', t)[0]
d2 = JSONDecoder().decode(d)
print(d2['search']['ids'])
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
06.02.2019, 16:25
Помогаю со студенческими работами здесь

Python requests
У меня есть код import requests url = '&lt;url&gt;' r = requests.get(url, data={'user': '&lt;user&gt;', 'password': '&lt;password&gt;'}) ...

Javascript + python requests
Салют всем) Возникла проблема, пытаюсь при помощи requests выполнить POST запрос на один из сервисов гугла, и в итоге выдает ошибку, мол...

Python Selenium/Requests
Мне нужно перебрать все эти матчи с помощью Питона. Как мне сделать? Матчи каждый раз разные, я не хочу под каждый матч копировать xpath....

Авторизация в модальных окнах Python, requests
Всем привет, появилась задача получать скриншоты с ip-камеры, но при попытке доступа по url появляется модальное окно Все стандартные...

requests - Несколько запросов на сайт python
Есть кусочек кода: import requests import argparse parser = argparse.ArgumentParser(description='Test get') ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной записи. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
Контроль уникальности заводского номера - вариант №2
Maks 24.03.2026
В отличие от предыдущего варианта добавлено прерывание циклов, также добавлены новые переменные для сохранения контекста ошибки перед прерыванием цикла: Процедура ПередЗаписью(Отказ, РежимЗаписи,. . .
SDL3 для Desktop (MinGW): Вывод текста со шрифтом TTF с помощью библиотеки SDL3_ttf на Си и C++
8Observer8 24.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-text-sdl3-c. zip finish-text-sdl3-cpp. zip
Жизнь в неопределённости
kumehtar 23.03.2026
Жизнь — это постоянное существование в неопределённости. Например, даже если у тебя есть список дел, невозможно дойти до точки, где всё окончательно завершено и больше ничего не осталось. В принципе,. . .
Модель здравоСохранения: работники работают быстрее после её введения.
anaschu 23.03.2026
geJalZw1fLo Корпорация до введения программа здравоохранения имела много невыполненных работниками заданий, после введения программы количество заданий выросло. Но на выплатах по больничным это. . .
Контроль уникальности заводского номера - вариант №1
Maks 23.03.2026
Алгоритм контроля уникальности заводского (или серийного) номера на примере документа выдачи шин для спецтехники с табличной частью в конфигурации КА2. Данные берутся из регистра сведений, по. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru