Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/6: Рейтинг темы: голосов - 6, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 07.12.2015
Сообщений: 54

Регулярное выражение

18.08.2016, 12:53. Показов 1115. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте.

Нужно из всего html кода выделить одну строку. <span class="post__time_published">сегодня в 10:47</span>
Нужна только дата и время. Больше ничего.

Пробовал так,ничего не получается(удаляет всё):
Python
1
2
3
4
response = urllib2.urlopen(address) 
html=response.read() 
pattern=re.compile(r'.*?[^<span class="post__time_published">.*?</span>]',re.DOTALL) 
html=re.sub(pattern,' ',html)
Версия Python: 2.7.11

Подскажите пожалуйста как сделать.

Спасибо!
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
18.08.2016, 12:53
Ответы с готовыми решениями:

Как распознать часть ссылки, используя регулярное выражение?
всем привет! Мне необходимо получить значение переменной code посланной посредством get запроса. URL при этом выглядит так: ...

Регулярное выражение
Добрый день! Не могу понять в чем ошибка import re test_str = regex = r'Улица\W\d+(-)|(\w*й)\Wросек' matches =...

Регулярное выражение
Помогите, пожалуйста, никак не соображу :( Нужно вытащить из текста детали с номерами, причем количество слов между &quot;деталь&quot; и...

4
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
18.08.2016, 13:10
лучше всего использовать lxml или в крайнем случае beautifulsoup
1
0 / 0 / 0
Регистрация: 07.12.2015
Сообщений: 54
18.08.2016, 14:07  [ТС]
Знаю,есть много лучших способов. Но задание такое. Использовать только регулярки
0
Эксперт по компьютерным сетям
 Аватар для Jabbson
5907 / 3359 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
18.08.2016, 14:30
Лучший ответ Сообщение было отмечено lego123 как решение

Решение

Python
1
2
3
4
5
>>> import re
>>> string = '<span>...</span><span class="post__time_published">DATE OR TIME TO EXTRACT</span><span>...</span>'
>>> pattern = re.compile(r'<span class="post__time_published">(.*?)</span>')
>>> pattern.search(string).group(1)
'DATE OR TIME TO EXTRACT'
Добавлено через 7 минут
для нескольких вхождений

Python
1
2
3
4
5
6
>>> string = '<span>...</span><span class="post__time_published">DATE OR TIME TO EXTRACT</span><span>...</span> \
...          <span>...</span><span class="post__time_published">SOME OTHER DATE OR TIME TO EXTRACT</span><span>...</span>'
>>> pattern = re.compile(r'<span class="post__time_published">(.*?)</span>')
>>> pattern.findall(string)
['DATE OR TIME TO EXTRACT', 'SOME OTHER DATE OR TIME TO EXTRACT']
>>>
1
0 / 0 / 0
Регистрация: 07.12.2015
Сообщений: 54
18.08.2016, 14:55  [ТС]
Спасибо вам большое! Вы мне очень помогли!!!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
18.08.2016, 14:55
Помогаю со студенческими работами здесь

Регулярное выражение
Создать регулярное выражение для заполнения поля по шаблону, например электронный адрес: логин@почта(сервер) домен: ppp@mail.ru. Если при...

Регулярное выражение
Добрый день, помогите пожалуйста написать регулярное выражение для данных примеров ∗({8}+) 3+(3+5)∗(2+7) {3+345}∗+43

Регулярное выражение
Пытаюсь распарсить нестандартную строку, не пойму, что в регулярном выражении не так, почему не выводит последнее число. import re ...

Простое регулярное выражение
как искать в тексте цифры черезе регулярное выражение?

Доработать регулярное выражение
Делаю что-то типа логико-арифметического калькулятора, который должен вычислять и арифметические, и логические выражения. Выражения...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
Как я обхитрил таблицу Word
Alexander-7 21.03.2026
Когда мигает курсор у внешнего края таблицы, и нам надо перейти на новую строку, а при нажатии Enter создается новый ряд таблицы с ячейками, то мы вместо нервных нажатий Энтеров мы пишем любые буквы. . .
Krabik - рыболовный бот для WoW 3.3.5a
AmbA 21.03.2026
без регистрации и смс. Это не торговля, приложение не содержит рекламы. Выполняет свою непосредственную задачу - автоматизацию рыбалки в WoW - и ничего более. Однако если админы будут против -. . .
Программный отбор значений справочника
Maks 21.03.2026
Установка программного отбора значений справочника "Сотрудники" из модуля формы документа. В качестве фильтра для отбора служит предопределенное значение перечислений. Процедура. . .
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
[Owen Logic] Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора
ФедосеевПавел 14.03.2026
Поддержание уровня воды в резервуаре количеством включённых насосов: моделирование и выбор регулятора ВВЕДЕНИЕ Выполняя задание на управление насосной группой заполнения резервуара,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru