Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.56/48: Рейтинг темы: голосов - 48, средняя оценка - 4.56
0 / 0 / 0
Регистрация: 02.09.2012
Сообщений: 23

Как в lxml составить запрос xpath?

06.09.2013, 16:38. Показов 9078. Ответов 5

Студворк — интернет-сервис помощи студентам
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
import requests
import lxml.html
import re
 
session = requests.session()
openUrl = session.get('http://www.artlebedev.ru/')
 
            doc1 = lxml.html.document_fromstring(openUrl.text)
            # строчка на xpath которой я скопировал
            # пусть вас не смущает не раскодированный utf-8, до него пока не добрался :)
            # <a class="underline" href="/everything/sign/berdsk/">а—аНаАаК аВ&nbsp;а‘аЕб€аДб&#129;аКаЕ</a>
            text = doc1.xpath('/html/body/div[3]/div/div/div/p/a[@class="underline"]/text()[0]')
            print text
Я так понимаю дело в неправильной вложенности xpath. Вопрос собственно в том как правильно ее указывать и где про это можно прочитать? Кстати, в других ветках форума я видел запрос like

Python
1
doc1.xpath('//*[@class="text"]/text()[0]')
Я правильно понимаю что это используется для упрощения вложенности? З.Ы. Правда у меня этот вариант тоже не сработал

Добавлено через 18 минут
И еще один вопрос, может быть существует метод который принимал бы xPath, и возвращал бы вложенность которая лежит глубже?

Добавлено через 16 минут
Последний вопрос отпал, нашел FirePath
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
06.09.2013, 16:38
Ответы с готовыми решениями:

Xpath and lxml
есть xml такого формата: &lt;X&gt; &lt;A&gt; &lt;AB&gt;aaa&lt;AB&gt; &lt;AC&gt;bbb&lt;/AC&gt; &lt;/A&gt; &lt;A&gt; &lt;AC/&gt; ...

Как правильно составить XPATH-запрос для HtmlAgillityPack?
&lt;div id=&quot;adv_140751&quot; class=&quot;adv_short radius_10&quot;&gt; &lt;ul class=&quot;edit-menu&quot;&gt; &lt;li class=&quot;edit-menu-item-empty&quot;&gt;&lt;/li&gt; ...

Разбираюсь с xpath and lxml
import requests from lxml import html page = requests.get('http://www.work.ua/jobs-kyiv/?advs=1&amp;days=125&amp;page=1') tree =...

5
 Аватар для pashtet-kun
135 / 120 / 37
Регистрация: 30.09.2012
Сообщений: 400
06.09.2013, 18:47
а какой текст конкретно нужен?
0
0 / 0 / 0
Регистрация: 02.09.2012
Сообщений: 23
06.09.2013, 20:01  [ТС]
Цитата Сообщение от pashtet-kun Посмотреть сообщение
а какой текст конкретно нужен?
FirePath очень помог разобраться с синтаксисом XPath запросов.

Правда теперь у меня появились новые непонимания.

Python
1
2
3
4
5
6
7
8
9
10
import requests
import lxml.html
 
session = requests.session()
 
url = session.get('http://yandex.ru/')
doc = lxml.html.document_fromstring(url.text)
 
x = doc.xpath('//a')
print x
Допустим через запрос xpath('//a') я собрал массив из потенциальных ссылок, могу ли я используя xpath обратится к конкретному элементу? Например 'href', чтобы забрать ссылку.
0
Z3JheSBoYXQ=
 Аватар для fanatdebian
342 / 237 / 83
Регистрация: 08.07.2012
Сообщений: 577
06.09.2013, 20:03
Не надо использовать полный путь, можно, но нецелесообразно. По существу тэги имеют уникальные идентификаторы, по которым ты их можешь вычленять. Собственно сами тэги как якори выборки, или более конкретные по имени класса,ID.


http://docs.grablib.org/grab/dom.html#xpath

посмотри на примеры, работа с xpath в этом модуле идентична. Делай по аналогии.
1
0 / 0 / 0
Регистрация: 02.09.2012
Сообщений: 23
06.09.2013, 23:00  [ТС]
Цитата Сообщение от fanatdebian Посмотреть сообщение
Не надо использовать полный путь, можно, но нецелесообразно.
А можно пример (для понимания)?

Т.е. намного проще обращатся к тегам через cssselect и прочие аналогичные решения?

Добавлено через 2 часа 48 минут
UPD: Пример нашелся
0
4866 / 3288 / 468
Регистрация: 10.12.2008
Сообщений: 10,570
06.09.2013, 23:18
xpath в примерах
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
06.09.2013, 23:18
Помогаю со студенческими работами здесь

Как сделать XPATH запрос с несколькими элементами?
Загружаю https://www.youtube.com/results?search_query=music Пытаюсь с помощью XPATH запроса //h3 найти строку &lt;a...

Как составить xpath для поиска нужного билета?
Всем привет Можете подсказать как правильно составить путь тут: https://www.eticketing.co.uk/arsenal/EDP/Event/Index/3101, чтобы...

Почему xpath в xpather работает как надо, а html.xpath обрезает последний элемент
Тут все ок. http://xpather.com/QdzC7iC7 Добавляю выражение для скрипта, но там обрезается артикул: import requests_html from...

Xpath запрос.
в XML есть следующие блоки: (есть там не только они, но это не важно) &lt;doc_pattern tag=&quot;Union&quot;&gt; &lt;item...

xpath запрос
здравствуйте! Пожалуйста помогите составить запросов для парсинга в гугл таблицах этого элемента &lt;span...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Новые блоги и статьи
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes. А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит токи на L и напряжения на C в установ. режимах до и. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru