Форум программистов, компьютерный форум, киберфорум
Java SE (J2SE)
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.54/13: Рейтинг темы: голосов - 13, средняя оценка - 4.54
0 / 0 / 0
Регистрация: 29.07.2016
Сообщений: 3

Регулярные выражения. Найти URLs в тексте

08.08.2016, 03:22. Показов 2686. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Всем привет.

Задача такова:
Есть текст, необходимо пропарсить его с помощью регулярных выражений и найти все ссылки (т.е. УРЛы). Написал такой паттерн:

Java
1
Matcher m = Pattern.compile("\\s*https*://[.a-zA-Z0-9]+/*([.a-zA-Z0-9-_/?=&]*/*)").matcher(str);
Ок, работает (во всяком случае в моем тексте с моими УРЛами). Но допустим, что мне надо, что бы УРЛы обрезались, если у них более 2-х вложенностей (сам домен не учитываем).

Например:
В тексте есть УРЛ: домен/вложеннсть1/вложенность2/вложенность3/
Необходимо, что бы мы получили обрезанный УРЛ: домен/вложеннсть1/вложенность2/

Пробовал сделать так:

Java
1
Matcher m = Pattern.compile("\\s*https*://[.a-zA-Z0-9]+/*([.a-zA-Z0-9-_/?=&]*/*){0,2}").matcher(str);
т.е. думал, что квантификатор {0,2} обрежет УРЛ, если в нем более 2-х вложенностей. Но на выходе изменений я не обнаружил.

Вопросы:
1. Могу ли я как-то резать УРЛы (в данном случае) с помощью регулярных выражений, или же это надо напрямую "резать стринг" ?
2. Квантификатор {0,2} в данном случае не сработал. Значит я ошибка в логике выражения. Что в данном случае, тогда он означает?

Буду благодарен за помощь.
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
08.08.2016, 03:22
Ответы с готовыми решениями:

Регулярные выражения: найти количество операторов присваивания в тексте программы
Я не могу понять как работают регулярные выражения и как с их помощью можно найти количество операторов например в коде:public class angle...

Регулярные выражения - поиск абзацев в тексте
Привет всем! Помогите разбить рандомный текст на абзацы. Вот пример моего решения, но там проблема: должно вывести 3 фрагмента текста но...

Заменить, используя регулярные выражения, значения в тексте
Доброго времени суток! как с помощью регулярных выражений заменить все записи вида list.add("somevalue1"); ...

2
Эксперт Java
3639 / 2971 / 918
Регистрация: 05.07.2013
Сообщений: 14,220
08.08.2016, 10:00
https:\/\/[^\/]*([\/][a-z]){0,2}
1
502 / 348 / 134
Регистрация: 14.06.2016
Сообщений: 669
08.08.2016, 16:36
Java
1
2
3
4
Matcher mtch = Pattern.compile("https?://[^/]+/(([^/]+/){2}|.*?(?=\\s|$))").matcher("https://technet.microsoft.com/ru-ru/library/cc627458(v=sql.120).aspx");
        while(mtch.find()) System.out.println(mtch.group());
        mtch.reset("https://technet.microsoft.com/cc627458(v=sql.120).aspx");
        while(mtch.find()) System.out.println(mtch.group());
На выходе:
Bash
1
2
"https://technet.microsoft.com/ru-ru/library/"
"https://technet.microsoft.com/cc627458(v=sql.120).aspx"
Нет наверху примера твоих URL (
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
08.08.2016, 16:36
Помогаю со студенческими работами здесь

Регулярные выражения. Найти доменное имя в тексте
Здравствуйте! Хочу найти доменное имя в тексте. Вот моя неудачная попытка, подскажите ошибки, кто сможет. ...

Регулярные выражения: найти в тексте e-mail адреса
К сожалению пока нормально в регулярных выражениях не разобрался использую уже готовые Нужно найти в файле e-mail-ы Использую...

Регулярные выражения. Как найти все различные слова в тексте?
как найти все различные слова в тексте?

Поиск даты в тексте, регулярные выражения
Ребят, никак не могу разобраться с регулярками, хочу в строке найти числа вида 12 12 12 (дата), и если нету между ними точек то поставить...

Регулярные выражения - поиск в русском тексте
Доброй ночи Пытаюсь произвести поиск, с помощью регулярного выражения, в русском тексте use locale; use POSIX qw(locale_h); my...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
SDL3 для Android: Загрузка PNG с альфа-каналом с помощью SDL_LoadPNG (без SDL3_image)
8Observer8 28.01.2026
Содержание блога SDL3 имеет собственные средства для загрузки и отображения PNG-файлов с альфа-каналом и базовой работы с ними. В этой инструкции используется функция SDL_LoadPNG(), которая. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru