0 / 0 / 0
Регистрация: 23.09.2019
Сообщений: 32

Xpath получить в beautifulsoup

17.01.2023, 14:13. Показов 2339. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Можно ли узнать Xpath елемента с помощью beautifulsoup?
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
17.01.2023, 14:13
Ответы с готовыми решениями:

Как получить определенную ячейку из таблицы с библ. beautifulsoup?
Столкнулся с проблемой при парсере сайта и не могу получить данную с табличке отдельно. Перепробовал всякое, но не могу сделать. Возможно...

BeautifulSoup Как получить текстовое содержимое тега 'span'
Задача - получить "Нужный текст" из всех тегов <span class="value">Нужный текст</span> Получить теги вместе с содержимым просто - ...

Парсинг youtube - получить колличество лайков, дизлайков. requests, beautifulsoup
Всем привет! Столкнулся с проблемой при парсинге с ютуб. Пытаюсь получить доступ к div: import requests from bs4 import...

2
148 / 111 / 37
Регистрация: 28.11.2013
Сообщений: 383
17.01.2023, 22:18
Лучший ответ Сообщение было отмечено wollframe как решение

Решение

С помощью xpath вы обращаетесь к элементу. Вы должны знать, например id элемента, тогда можно получить, например текст элемента. Вам нужно научиться правильно задавать xpath.
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from bs4 import BeautifulSoup
from lxml import etree
import requests
  
  
URL = "https://en.wikipedia.org/wiki/Nike,_Inc."
  
HEADERS = ({'User-Agent':
            'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 \
            (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36',\
            'Accept-Language': 'en-US, en;q=0.5'})
  
webpage = requests.get(URL, headers=HEADERS)
soup = BeautifulSoup(webpage.content, "html.parser")
dom = etree.HTML(str(soup))
print(dom.xpath('//*[@id="firstHeading"]')[0].text)
1
213 / 109 / 46
Регистрация: 12.12.2016
Сообщений: 399
18.01.2023, 15:11
Можно через "исследовать элемент" в браузере.
Миниатюры
Xpath получить в beautifulsoup  
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
18.01.2023, 15:11
Помогаю со студенческими работами здесь

Как в xpath получить html теги?
<div><p>текст</p></div> как отсюда вытащить не "текст" а <p>текст</p>? resp.html.xpath("//div//text()") Добавлено через...

Почему xpath в xpather работает как надо, а html.xpath обрезает последний элемент
Тут все ок. http://xpather.com/QdzC7iC7 Добавляю выражение для скрипта, но там обрезается артикул: import requests_html from...

Как в xpath получить ссылку из текста в спане?
Есть ссылка вида: <a href="/contacts"><span>Контакты</span></a> как получить /contacts? Пробовал так и другие варианты, но не...

Как получить значение высоты через xpath?
Нужно получить значение из строчек: <div style="margin-top:0px"> <strong>Height</strong> </div> <p/> <div>-...

Получить xpath
Есть сайт сайт Нужно получить все адреса. из "map-address-list" foreach (HtmlAgilityPack.HtmlNode nodead in...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

Новые блоги и статьи
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2. Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом. В. . .
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru