|
0 / 0 / 0
Регистрация: 13.11.2017
Сообщений: 19
|
||||||||||||||||||||||||||
Beautiful Soup. Как задать несколько условий поиска?26.06.2023, 12:04. Показов 1564. Ответов 1
Всем привет!
Пытаюсь спарсить страницу с вакансией headhunter'а с помощью Beautiful Soup. Мне нужно получить список обязанностей для нужной вакансии. Списки обязанностей заключаются в тегах "<ul>" без классов. Выглядит это так:
Т.к. у ul нет классов, то я решил искать по предыдущему тексту "Обязанности" и после список "<ul>" Написал вот такой код, он находит нужный мне список, который идет после текста "Обязанности":
Проблема заключается в том, что каждый работодатель по разному называет и оформляет свои вакансии: Например, вариант 1 (здесь мой код не работает потому что 2 тега span):
Как мне доработать свой код, чтобы можно было найти все 3 варианта? Чтобы я мог в словарь записывать варианты текста после которых нужно искать список ul/ol, например: ["Обязанности", "задачи", "предстоит делать", "выполнять"]
0
|
||||||||||||||||||||||||||
| 26.06.2023, 12:04 | |
|
Ответы с готовыми решениями:
1
Beautiful Soup Python В чем проблема? (Beautiful Soup)
|
|
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
|
|
| 26.06.2023, 14:54 | |
Сообщение было отмечено invectro как решение
Решение
Втупую
re.compile("Обязанности|задачи|предстоит делать|выполнять")
1
|
|
| 26.06.2023, 14:54 | |
|
Помогаю со студенческими работами здесь
2
Парсинг Beautiful Soup 4 и Selenium.Webdriver Beautiful Soup - существует ли ограничения на длину получаемых данных? Beautiful Soup 4, сравнение html-парсеров при запуске в потоке Извлечь атрибуты a href и img src одновременно, используя Beautiful Soup Парсинг на Python с Beautiful Soup Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
|||
|
модель ЗдравоСохранения 8. Подготовка к разному выполнению заданий
anaschu 08.04.2026
https:/ / github. com/ shumilovas/ med2. git
main ветка * содержимое блока дэлэй из старой модели теперь внутри зайца новой модели
8ATzM_2aurI
|
Блокировка документа от изменений, если он открыт у другого пользователя
Maks 08.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа, разработанного в конфигурации КА2.
Задача: запретить редактирование документа, если он открыт у другого пользователя.
/ / . . .
|
Система безопасности+живучести для сервера-слоя интернета (сети). Двойная привязка.
Hrethgir 08.04.2026
Далее были размышления о системе безопасности. Сообщения с наклонным текстом - мои.
А как нам будет можно проверить, что ссылка наша, а не подделана хулиганами, которая выбросит на другую ветку и. . .
|
Модель ЗдрввоСохранения 7: больше работников, больше ресурсов.
anaschu 08.04.2026
работников и заданий может быть сколько угодно, но настроено всё так, что используется пока что только 20%
kYBz3eJf3jQ
|
|
Дальние перспективы сервера - слоя сети с космологическим дизайном интефейса карты и логики.
Hrethgir 07.04.2026
Дальнейшее ближайшее планирование вывело к размышлениям над дальними перспективами. И вот тут может быть даже будут нужны оценки специалистов, так как в дальних перспективах всё может очень сильно. . .
|
Горе от ума
kumehtar 07.04.2026
Эта мне ментальная установка, что вот прямо сейчас, мол, мне для полного счастья не хватает (нужное вписать), и когда я этого достигну - тогда и полный кайф. Одна из самых сильных ловушек на пути. . . .
|
Использование значений реквизитов справочника в документе, с определенными условиями и правами
Maks 07.04.2026
1. Контроль срока действия договора
Алгоритм из решения ниже реализован на примере нетипового документа "ЗаявкаНаРаботу", разработанного в конфигурации КА2.
Задача: уведомлять пользователя, если. . .
|
Доступность команды формы по условию
Maks 07.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2.
Задача: сделать доступной кнопку (команда формы "ЗавершитьСписание") при. . .
|