Форум программистов, компьютерный форум, киберфорум
Python
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/11: Рейтинг темы: голосов - 11, средняя оценка - 5.00
 Аватар для KyKyIIIKuH
31 / 0 / 1
Регистрация: 11.06.2013
Сообщений: 19

Парсинг строки с использованием xPath - Python

08.11.2015, 13:58. Показов 2193. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день!
Вопрос заключается в следующем.
Возможно ли получить вторую строчку Progress: с значением 2 / 12, в данный момент получается получить только 1 строчку Status: с текстом Active.

xpath: /html/body/text()[1]

Результат выполнения:
C:\Python27>python ttest.py
[' Active']

желаемый результат: 2 / 12

HTML5
1
2
3
4
5
6
7
8
9
10
<strong>Status:</strong> Active<br>
<strong>Progress:</strong> 2 / 12<br>
<strong>Type:</strong> BDRip<br>
<strong>Display size:</strong> 1920×1080<br>
<strong>Video codec:</strong> x264 (<span style="color: #ff0000;">Hi10P</span>)<br>
<strong>Audio format:</strong> FLAC Level 8 (2 tracks in mkv container, comments in mka)<br>
<strong>Chapters:</strong> yes<br>
<span id="more-965"></span><strong>BDMV Provider:</strong> DL from U2<br>
<strong>Encoder:</strong> DJATOM<br>
<strong>AniDB:</strong> <a href="#" target="_blank" rel="nofollow">link</a></p>
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#!/usr/bin/python
# -*- coding: utf-8 -*-
 
import sys
reload(sys)
 
sys.getdefaultencoding()
sys.setdefaultencoding('utf8')
sys.getdefaultencoding()
 
from lxml import etree
 
page='<strong>Status:</strong> Active<br><strong>Progress:</strong> 2 / 12<br><strong>Type:</strong> BDRip<br><strong>Display size:</strong> 1920×1080<br><strong>Video codec:</strong> x264 (<span style="color: #ff0000;">Hi10P</span>)<br><strong>Audio format:</strong> FLAC Level 8 (2 tracks in mkv container, comments in mka)<br><strong>Chapters:</strong> yes<br><span id="more-965"></span><strong>BDMV Provider:</strong> DL from U2<br><strong>Encoder:</strong> DJATOM<br><strong>AniDB:</strong> <a href="#" target="_blank" rel="nofollow">link</a></p>'
 
tree=etree.HTML(page)
print tree.xpath("/html/body/text()[1]")
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
08.11.2015, 13:58
Ответы с готовыми решениями:

Парсинг страницы с использованием xPath
Добрый день! Вопрос в следующем. Я копирую контент с нужного мне сайта, далее при помощи библиотеки lxml, пытаюсь найти нужный мне элемент,...

Парсинг логов с использованием регулярных выражений на Python и их упаковка в структуру данных словарь словарей
Требуется: Создать из последовательности логов словарь, где ключ - таймстемп, а value - другой словарь, в котором ключи - все группы,...

Парсинг xpath
Здравствуйте, переношу логики работы с селениума на прямой парсинг страницы через гет запрос. Столкнулся с проблемой, что не...

1
Эксперт NIX
 Аватар для Marinero
2796 / 2039 / 682
Регистрация: 02.03.2015
Сообщений: 6,509
08.11.2015, 14:07
Python
16
print(tree.xpath("/html/body/text()")[1])
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
08.11.2015, 14:07
Помогаю со студенческими работами здесь

Парсинг в HTML Xpath
Привет. Может у кого есть не сложный модуль для парсинга HTML с помощью Xpath? Если есть, поделитесь пожалуйста. Спасибо.

Grab, парсинг, xpath
Всем привет, пытаюсь спарсить отсюда: Список: https://www.nalog.ru/rn77/taxation/kbk/ip/ndfl/ ...

Парсинг выдачи гугла, xpath
Добрый день. Изучаю С# + htmlagilitypack, пишу небольшой книжкопарсер. Интереса ради решил парсить выдачу гугла по запросу вида...

Парсинг файла xml с Xpath
Необходимо вывести в консоли из файла xml fullName, INN, KPP из узла customerInfo. &lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;...

Вычислить выражение, содержащееся в строке, с использованием бинарного дерева поиска (парсинг строки)
В символьной строке записано правильное арифметическое выражение, которое может содержать числа и знаки операций +-*\. Вычислить это...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
Программный контроль заполнения реквизита табличной части документа
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: реализовать контроль заполнения реквизита "ПричинаСписания". . .
wmic не является внутренней или внешней командой
Maks 02.04.2026
Решение: DISM / Online / Add-Capability / CapabilityName:WMIC~~~~ Отсюда: https:/ / winitpro. ru/ index. php/ 2025/ 02/ 14/ komanda-wmic-ne-naydena/
Программная установка даты и запрет ее изменения
Maks 02.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "СписаниеМатериалов", разработанного в конфигурации КА2. Задача: при создании документов установить период списания автоматически. . .
Вывод данных в справочнике через динамический список
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Программное заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru