|
21 / 21 / 19
Регистрация: 18.03.2014
Сообщений: 148
|
|||||||||||
Регулярные выражения. Парсинг html12.11.2015, 00:25. Показов 8899. Ответов 4
Метки нет (Все метки)
Доброго времени суток, уважаемые форумчане!
Есть задача вытащить ссылки из html-файла. Первая мысль: "Регулярные выражения, настало ваше время". До этого момента с ними не сталкивался. Решил разобраться. Вот пробую по гугловским статьям. В итоге по задаче: - есть html-код (в моем случае такой): Кликните здесь для просмотра всего текста
- написал такое регулярное выражение:
Заранее благодарю
0
|
|||||||||||
| 12.11.2015, 00:25 | |
|
Ответы с готовыми решениями:
4
Регулярные выражения |
|
2742 / 2341 / 620
Регистрация: 19.03.2012
Сообщений: 8,830
|
|||||||
| 12.11.2015, 01:47 | |||||||
Сообщение было отмечено bogdan_017 как решение
Решение
bogdan_017, Как сказал один умный человек:
Вообще вытащить вот так можно, но тут на пример не учтен вариант, что ссылка может заключаться не только в двойные кавычки, но ещё и в одинарные
2
|
|||||||
| 12.11.2015, 05:03 | |
|
0
|
|
| 12.11.2015, 13:41 [ТС] | |||||||
|
Не по теме: 0x10, а человек с юморком попался :)
0
|
|||||||
|
║XLR8║
|
|
| 12.11.2015, 14:07 | |
|
bogdan_017, Если документ содержит шаблоны underscore.js то тебе еще надо обернуть в регулярку в проверку нету ли script тега, а если еще что-то будет... Словом лучше для парсинга html не использовать regex. Их используют только где производительность очень очень надо (мол проход за линию и т.д. в отличии от разного рода DOM парсеров).
Проще всего использовать BeautifulSoup: https://github.com/koutoftimer... oxy.py#L72
0
|
|
| 12.11.2015, 14:07 | |
|
Помогаю со студенческими работами здесь
5
Регулярные выражения
Регулярные выражения регулярные выражения
Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов.
. . .
|