Форум программистов, компьютерный форум, киберфорум
Наши страницы
Java
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.67/12: Рейтинг темы: голосов - 12, средняя оценка - 4.67
Jetu
касаткО
51 / 51 / 4
Регистрация: 01.10.2011
Сообщений: 227
Завершенные тесты: 1
1

Регулярные выражения в Java

22.03.2013, 18:10. Просмотров 2200. Ответов 7
Метки нет (Все метки)

Здравствуйте. Возникла проблема с регулярным выражением, проверял его на данном ресурсе, все работает, а в моей программе нет.
Класс ParserHTML:
Кликните здесь для просмотра всего текста
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
package parser.html;
 
import java.util.ArrayList;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.io.*;
 
public class ParserHTML {
 
    private String dir;
    private ArrayList<String> listURL;
    private String patternURL = "<[http][:][\\S]*\\/>";
 
    public ParserHTML(String path) {
        listURL = new ArrayList<String>();
        this.dir = path;
    }
 
    private void parseURL() throws FileNotFoundException {
        BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(this.dir)));
 
        String text;
 
        try {
 
            while ((text = reader.readLine()) != null) {
 
                Pattern p = Pattern.compile(patternURL);
                Matcher m = p.matcher(text);
 
                if (m.matches()) {
                    this.listURL.add(m.group());
                }
            }
 
            reader.close();
        }
        catch (Exception error) {
            error.printStackTrace();
        }
    }
 
    public ArrayList<String> getURL() {
 
        try {
            this.parseURL();
        } catch (FileNotFoundException error) {
            error.printStackTrace();
        }
 
        return listURL;
    }
 
}


Main:
Кликните здесь для просмотра всего текста
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import  java.io.*;
import java.util.ArrayList;
 
import parser.html.ParserHTML;
 
public class Main {
 
    public static void main(String[] args) {
 
        ParserHTML pars = new ParserHTML("test.html");
        ArrayList<String> URL = pars.getURL();
 
        for (String s: URL)
            System.out.println(s);
    }
}


Пример html файла:
Кликните здесь для просмотра всего текста
HTML5
1
<DT><A HREF="http://site.ru/" ………>text</A>


Где я мог напортачить ?
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
22.03.2013, 18:10
Ответы с готовыми решениями:

Регулярные выражения в java
День добрый. Подскажите пожалуйста, как можно получить строку, которая была...

Регулярные выражения в Java
Приветствую всех! Использую JDK 1.3.1 SE и к сожалению не нашел там классов...

Регулярные выражения в Java - проблемы с кириллицей
Доброго времени суток всем! Народ, скажите мне, что у меня кривые руки. Это...

Регулярные выражения
здравствуйте. По сабжу довольно мало информации. Прошу совета. Во первых...

Регулярные выражения
Есть некоторый файлик, в котором одна строчка &quot;1 2&quot;. Мне необходимо выдернуть...

7
AckiyBolt
649 / 398 / 35
Регистрация: 19.02.2013
Сообщений: 1,072
Записей в блоге: 2
22.03.2013, 18:21 2
хреновая у вас регулярка... почитайте это, увидите почему именно
да. и в вашем случае нужно не сравнивать, а проверять наличие:
Java
1
2
3
4
String str = "trololo";
String regex = "o";
 
str.contains(regex);
0
Jetu
касаткО
51 / 51 / 4
Регистрация: 01.10.2011
Сообщений: 227
Завершенные тесты: 1
22.03.2013, 18:24  [ТС] 3
Цитата Сообщение от AckiyBolt Посмотреть сообщение
хреновая у вас регулярка... почитайте это, увидите почему именно
ну я почитаю, спасибо, но я как бы проверял её…
P.S. в коде ошибка, на самом деле регулярное выражение такое (извиняюсь за мой недочет) :
HTML5
1
<http:\\S*\\/>
0
AckiyBolt
649 / 398 / 35
Регистрация: 19.02.2013
Сообщений: 1,072
Записей в блоге: 2
22.03.2013, 18:34 4
Цитата Сообщение от Jetu Посмотреть сообщение
ну я почитаю, спасибо, но я как бы проверял её…
ну... она как бы работать правильно не должна

"<[http][:][\\S]*\\/>" - это означает что строка должна быть следующего формата:
0) <
1) одна из букв htp
2) :
3) любой не пробельный символ в количестве 0-дофига
4) />

Добавлено через 3 минуты
Цитата Сообщение от Jetu Посмотреть сообщение
P.S. в коде ошибка, на самом деле регулярное выражение такое (извиняюсь за мой недочет) :
HTML5
1
<http:\\S*\\/>
вы потеряли "//" после "http:"
и "\\" в конце лишнее
0
Jetu
касаткО
51 / 51 / 4
Регистрация: 01.10.2011
Сообщений: 227
Завершенные тесты: 1
22.03.2013, 18:36  [ТС] 5
Цитата Сообщение от AckiyBolt Посмотреть сообщение
ну... она как бы работать правильно не должна
ну я здесь проверял
0
mutagen
2565 / 2238 / 257
Регистрация: 14.09.2011
Сообщений: 5,185
Записей в блоге: 18
22.03.2013, 19:49 6
Цитата Сообщение от Jetu Посмотреть сообщение
ну я здесь проверял
а ничё что там рекспы из php или perl с одной \d вместо \\d как в яве?
1
AckiyBolt
649 / 398 / 35
Регистрация: 19.02.2013
Сообщений: 1,072
Записей в блоге: 2
22.03.2013, 20:02 7
Цитата Сообщение от Jetu Посмотреть сообщение
ну я здесь проверял
я вам дал ссылку на неплохой маленький гайд по регуляркам в яве. прочитайте и вы поймете почему ваш первый вариант принципиально не может работать в джаве. если вам покажется что тот гайд врет - офф туториал по регулярным выражениям врать не может:
http://docs.oracle.com/javase/tutorial/essential/regex/

для справки, как заметил mutagen, в разных языках есть своя специфика
1
Jetu
касаткО
51 / 51 / 4
Регистрация: 01.10.2011
Сообщений: 227
Завершенные тесты: 1
22.03.2013, 20:49  [ТС] 8
Ребят спасибо вам, статью читаю…
0
22.03.2013, 20:49
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
22.03.2013, 20:49

регулярные выражения
Выделить в тексте на основе регулярных выражений все упоминания о вирусе H1N1.

Регулярные выражения
как составить регулярные выражения, чтобы выводил имена зон (*.ru, *.com и тд.)...

Регулярные выражения для замены
Здравствтуйте. Не получается составить регулярку для замены букв в тексте...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru