Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/5: Рейтинг темы: голосов - 5, средняя оценка - 5.00
1 / 1 / 0
Регистрация: 23.08.2020
Сообщений: 3

Проблема с парсингом Бинг

23.08.2020, 19:13. Показов 1060. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток. Недавно начал изучать Пайтон. В качестве практики решил написать простой парсер выдачи Bing. Но столкнулся с проблемой.

Итак, мой код выглядит вот так:

Python
1
2
3
4
5
6
7
8
9
10
11
from requests_html import HTMLSession
keywords = [
'как сделать бумажный самолетик',
'как сделать бумажный кораблик',
'как сделать бумажного журавля'
]
session = HTMLSession()
for key in keywords:
    resp = session.get(f'https://www.bing.com/search?q={key}')
    title = resp.html.xpath('//li[@class="b_algo"][1]//h2//text()')
    print(title)
Открываю сессию. В цикле получаю выдачу для каждого из трех ключей и с помощью xpath забираю ТОП-1 выдачи. После этого печатаю результат в консоль.

При этом получаю вот такой результат:

Python
1
2
3
 []
['6 лучших схем бумажных корабликов - Поделки из бумаги']
['Как сложить бумажного журавлика (с иллюстрациями)']
Результата по запросу “как сделать бумажный самолетик” нет. Остальные запросы - ОК.

Если распечатать в файл весь html код страницы, которую парсер получает по первому запросу в h1 находиться фраза “Не удалось найти ни одного результата для как сделать бумажный самолетик”

При этом если зайти по этому адресу из браузера, все в порядке. Результаты показываются.

Вопрос: почему по одному и тому же адресу - https://www.bing.com/search?q=... +самолетик - браузер получает один html код, а python совершенно другой?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
23.08.2020, 19:13
Ответы с готовыми решениями:

Проблема с парсингом
Делаю парсинг сайта для себя. Вот часть функции: for item in cards: cards_name = item.find("div",...

Проблема с парсингом
Добрый день. Пытаюсь спарсить архив тендеров. https://www.nornickel.ru/suppliers/tenders/central/?archive=Y Вот фрагмент...

Проблема с парсингом
Помогите пожалуйста, первый раз пытаюсь парсить, и при выводе "a" выводится как будто 2 списка, сама переменная "a" является...

2
Заклинатель змей
 Аватар для DobroAlex
705 / 560 / 219
Регистрация: 30.04.2016
Сообщений: 2,605
23.08.2020, 22:31
Stargazer87, потому что браузер выполняет много реквестов, их можно посмотреть в dev tools. Из моего опыта, Bing проще парсить через браузер чтоб не выполнять все эти реквесты руками. Я использую splinter
0
1 / 1 / 0
Регистрация: 23.08.2020
Сообщений: 3
24.08.2020, 16:50  [ТС]
Цитата Сообщение от DobroAlex Посмотреть сообщение
потому что браузер выполняет много реквестов, их можно посмотреть в dev tools. Из моего опыта, Bing проще парсить через браузер чтоб не выполнять все эти реквесты руками.
Только непонятно, почему два других запроса отлично работают.

Цитата Сообщение от DobroAlex Посмотреть сообщение
Я использую splinter
Спасибо за подсказку. Надо будет попробовать
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
24.08.2020, 16:50
Помогаю со студенческими работами здесь

Проблема с парсингом сайта
Всем доброго времени суток, может кто помочь решить проблему с выводом данных, а именно меняя страницу ссылки (steam_link с помощью цикла...

Проблема с парсингом текста из docx файла
я не могу разобраться как парсить абсолютно весь текст с docx файла тот способ где везде описывается не парсит ничего кроме просто...

Проблема с парсингом сайта при работе на хостинге
Всем привет! Столкнулся с такой проблемой: написал парсер сайта который отлично работает у меня на компьютере, но когда я запускаю его на...

Парсинг BeautiulSoup. Проблема с с парсингом ссылок страниц
Суть в следующем. Пытался спарсить ссылки страниц результатов матча. Теги (a) читаются, а когда добавляю class_='rtxz9t-2 a6bwd9-5 kBrRDJ'...

Проблема с парсингом
Скрипт работает, я вижу парсинг в терминале Но не вижу результаты парсинга в папке 123 проекта Почему? from icrawler.builtin...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Программный контроль заполнения реквизита табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать контроль заполнения реквизита "ПричинаСписания". . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: при создании документов установить период списания автоматически. . .
Вывод данных в справочнике через динамический список
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Программное заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru