Форум программистов, компьютерный форум, киберфорум
Java для начинающих
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
6 / 4 / 2
Регистрация: 04.02.2013
Сообщений: 1,366
1

Регулярные выражения. ограничение выводимой ссылки до первого слэша

25.01.2021, 21:41. Просмотров 518. Ответов 5
Метки нет (Все метки)

Как нужно сформировать регулярное выражение (19строка), чтобы возможно было отобразить ссылки только до первого слэша при открытии страницы html.

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
package ru.bstu.LR4.lusenkov.LR4;
import java.io.FileWriter;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.Objects;
import java.util.Scanner;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.stream.Stream;
public class LR4 {
        public void getLinkifiedMyText(){
                System.out.println("Введите путь к html файлу:");
                Scanner path = new Scanner(System.in);
                String stringPath = path.nextLine();
                try (FileWriter writer = new FileWriter(stringPath + "_2.html");
                     Stream<String> lines = Files.lines(Paths.get(stringPath))) {
                        lines.forEach(x -> {
                                Pattern httpLinkPattern = Pattern.compile("(http[s]?://)(www\\.)?([\\S&&[^.@]]+)([^@]+)");
                                Matcher matcher = httpLinkPattern.matcher(x);
                                if (Objects.nonNull(x)) {
                                        Matcher httpLinksMatcher = httpLinkPattern.matcher(x);
                                        x = httpLinksMatcher.replaceAll("<a href=\"$0\" target=\"_blank\">$0</a>");
                                        try {
                                                writer.write(matcher.replaceAll("\n \n<a href=\"$0\" target=\"_blank\">$1$2$3$4</a>"));
                                        } catch (IOException e) {
                                                e.printStackTrace();
                                        }
                                        System.out.println(x);
                                }
                        });
                } catch (IOException e) {
                        e.printStackTrace();
                }
        }
}
//C:\Users\annas\Desktop\1.html
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
25.01.2021, 21:41
Ответы с готовыми решениями:

Регулярные выражения. Ограничение длины текста
Что мне надо дописать, чтобы сохранялся текст в переменной &quot;zagolovok&quot; после обработки регулярки?...

Регулярные выражения, классы символов и обратные ссылки
Вопрос к знатокам: где-то закреплено что вот такое выражение делать должно? std::regex...

Регулярные выражения: найти в тексте все ссылки
Дан текст. В этом тексте нужно найти все ссылки и вывести в формате: название сайта - имя файла. В...

Регулярные выражения. Повторение именованой обратной ссылки
Здравствуйте, помогите пожалуйста составить регулярное выражение для строки. Пример строки &quot;//;...

5
84 / 81 / 30
Регистрация: 06.11.2015
Сообщений: 1,087
Записей в блоге: 2
27.01.2021, 16:29 2
xamelione25, данное регулярное выражение
Код
^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?
Например ищем
внутри https://www.vogella.com/tutori... ticle.html

Результат:

group(1) group(2) group(3) group(4)
https: https //www.vogella.com www.vogella.com
0
6 / 4 / 2
Регистрация: 04.02.2013
Сообщений: 1,366
27.01.2021, 16:37  [ТС] 3
Luca Brasi,
я вот так сделал уже,
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
public class LR4 {
        public void getLinkifiedMyText(){
                System.out.println("Введите путь к html файлу:");
                Scanner path = new Scanner(System.in);
                String stringPath = path.nextLine();
                try (FileWriter writer = new FileWriter(stringPath + "_2.html");
                     Stream<String> lines = Files.lines(Paths.get(stringPath))) {
                        lines.forEach(x -> {
                                Pattern httpLinkPattern = Pattern.compile("(http[s]?://)(www\\.)?([\\S&&[^.@]]+)\\.(ru|com|net|de|cn|uk|org|info|nl|tk)([^@]+)");
                                Matcher matcher = httpLinkPattern.matcher(x);
                                if (Objects.nonNull(x)) {
                                        Matcher httpLinksMatcher = httpLinkPattern.matcher(x);
                                        x = httpLinksMatcher.replaceAll("<a href=\"$0\" target=\"_blank\">$0</a>");
                                        try {
                                                writer.write(matcher.replaceAll("\n \n<a href=\"$0\" target=\"_blank\">$1$2$3$4</a>"));
                                        } catch (IOException e) {
                                                e.printStackTrace();
                                        }
                                        System.out.println(x);
                                }
                        });
                } catch (IOException e) {
                        e.printStackTrace();
                }
        }
}
но мне не понятно как мне сделать/исправить следующее: если у меня в html сайт находится с новой строки то мне нужно чтобы он во вновь создаваемом документе также располагался также с новой строки, а то получается, что у меня все сайты имеющиеся в документе - располагаются в одной строке.
0
84 / 81 / 30
Регистрация: 06.11.2015
Сообщений: 1,087
Записей в блоге: 2
27.01.2021, 16:46 4
Не совсем ясно что получается в итоге, но может стоит тот узел, где все в одной строке взять, да и по тому же "htttp:" разделить?
0
6 / 4 / 2
Регистрация: 04.02.2013
Сообщений: 1,366
27.01.2021, 16:50  [ТС] 5
Luca Brasi,
Цитата Сообщение от Luca Brasi Посмотреть сообщение
Не совсем ясно что получается в итоге
вот:
0
Миниатюры
Регулярные выражения. ограничение выводимой ссылки до первого слэша   Регулярные выражения. ограничение выводимой ссылки до первого слэша   Регулярные выражения. ограничение выводимой ссылки до первого слэша  

84 / 81 / 30
Регистрация: 06.11.2015
Сообщений: 1,087
Записей в блоге: 2
27.01.2021, 17:22 6
ну да, не очень.
Ну что тут скажешь, надо делить, либо на этапе парсинга, либо на этапе записи/вывода.
Например если есть весь этот поток байт, где урлы в одну строку, то надо просто итерировать по ним, и при виде "http://" - добавлять разделитель "\n"
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
27.01.2021, 17:22

Заказываю контрольные, курсовые, дипломные и любые другие студенческие работы здесь.

Используя регулярные выражения извлечь из текста html-файла все ссылки
Извлеките из текста html-файла все ссылки (всё, что содержится в шаблоне &lt;a href=’…’&gt;)* * Для...

ЧПУ. Замена строк, регулярные выражения. Как правильно использовать переменную в регулярные выражения ?
Здравствуйте! Решил реализовать ЧПУ на своем сайте. Первый этап это замена всех реальных ссылок на...

Регулярные выражения. Как сделать что бы выделение было до первого совпадения?
Может кто подсказать с регулярным выражением. В коде встречается два раза &quot;DESTINATIONS ONLY!**&quot; по...

Регулярные выражения: удалить весь лишний текст до первого тега <NODE ...>
Всем привет! Никак не получается выделить в группу с помощью регулярных выражений весь текст,...

Регулярные выражения. Выбрать все символы кроме цифр и первого плюса
Подскажите пожалуйста как правильно написать регулярку. Есть примерно такая строка...

Регулярные выражения - инвертировать регистр первого символа каждого слова длиннее 3 букв
Привет, ребят! Помогите решить задачу с регулярными выражениями, уж очень тяжко мне они даются.Буду...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
6
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2021, vBulletin Solutions, Inc.