Форум программистов, компьютерный форум, киберфорум
Java: Сети
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.80/5: Рейтинг темы: голосов - 5, средняя оценка - 4.80
0 / 0 / 0
Регистрация: 16.03.2015
Сообщений: 1

Регулярное выражение, достать данные между html тегами

16.03.2015, 19:34. Показов 1140. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток.Подскажите как можно регулярной функцией достать несколько данных между тегами.Т.е. мне надо достать данные из таблицы
webserver.rar
html код выглядит так
XML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
 <tr style='mso-yfti-irow:1'>
  <td width=64 valign=top style='width:47.95pt;border:solid black 1.0pt;
  mso-border-themecolor:text1;border-top:none;mso-border-top-alt:solid black .5pt;
  mso-border-top-themecolor:text1;mso-border-alt:solid black .5pt;mso-border-themecolor:
  text1;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal style='margin-bottom:0cm;margin-bottom:.0001pt;line-height:
  normal'><span style='font-size:16.0pt;mso-bidi-font-size:11.0pt'>18<o:p></o:p></span></p>
  </td>
  <td width=151 valign=top style='width:4.0cm;border-top:none;border-left:none;
  border-bottom:solid black 1.0pt;mso-border-bottom-themecolor:text1;
  border-right:solid black 1.0pt;mso-border-right-themecolor:text1;mso-border-top-alt:
  solid black .5pt;mso-border-top-themecolor:text1;mso-border-left-alt:solid black .5pt;
  mso-border-left-themecolor:text1;mso-border-alt:solid black .5pt;mso-border-themecolor:
  text1;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal style='margin-bottom:0cm;margin-bottom:.0001pt;line-height:
  normal'><span style='font-size:16.0pt;mso-bidi-font-size:11.0pt'>Петренко<o:p></o:p></span></p>
  </td>
  <td width=103 valign=top style='width:77.55pt;border-top:none;border-left:
  none;border-bottom:solid black 1.0pt;mso-border-bottom-themecolor:text1;
  border-right:solid black 1.0pt;mso-border-right-themecolor:text1;mso-border-top-alt:
  solid black .5pt;mso-border-top-themecolor:text1;mso-border-left-alt:solid black .5pt;
  mso-border-left-themecolor:text1;mso-border-alt:solid black .5pt;mso-border-themecolor:
  text1;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal style='margin-bottom:0cm;margin-bottom:.0001pt;line-height:
  normal'><span style='font-size:16.0pt;mso-bidi-font-size:11.0pt'>09.45<o:p></o:p></span></p>
  </td>
  <td width=151 valign=top style='width:113.55pt;border-top:none;border-left:
  none;border-bottom:solid black 1.0pt;mso-border-bottom-themecolor:text1;
  border-right:solid black 1.0pt;mso-border-right-themecolor:text1;mso-border-top-alt:
  solid black .5pt;mso-border-top-themecolor:text1;mso-border-left-alt:solid black .5pt;
  mso-border-left-themecolor:text1;mso-border-alt:solid black .5pt;mso-border-themecolor:
  text1;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal style='margin-bottom:0cm;margin-bottom:.0001pt;line-height:
  normal'><span lang=EN-US style='font-size:16.0pt;mso-bidi-font-size:11.0pt;
  mso-ansi-language:EN-US'>most<o:p></o:p></span></p>
  </td>
 </tr>
Как я понял парсятся данные регулярным выражением по строке.А мне нужно между тегами .И ещё каких образом мне достать все данные и запихнуть например в массив.Вот для парсинга 1 значения
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
public String GetInfoWehr(String urlsite) // фукция загрузки инфы с сервера
{
    String matchtemper = "";
    try
    {
            // загрузка страницы
        URL url2 = new URL(urlsite);
        URLConnection conn = url2.openConnection();
        InputStreamReader rd = new InputStreamReader(conn.getInputStream());
        StringBuilder allpage = new StringBuilder();
        int n = 0;
        char[] buffer = new char[40000];
        while (n >= 0)
        {
            n = rd.read(buffer, 0, buffer.length);
            if (n > 0)
            {
                allpage.append(buffer, 0, n);                    
            }
        }
        // работаем с регулярками
        final Pattern pattern = Pattern.compile
    
        (//////////////////////////////////////////////////////////////////////////////////);//(РЕГУЛЯРКА)
        Matcher matcher = pattern.matcher(allpage.toString());
        if (matcher.find())
        {    
            matchtemper = matcher.group(1);            
        }        
        return matchtemper;
    }
    catch (Exception e)
    {
        
    }
    return matchtemper;  
}
Буду очень признателен любой помощи и совету
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
16.03.2015, 19:34
Ответы с готовыми решениями:

Достать контент (текст между тегами) из др. сайта
Здравствуйте! Есть небольшая проблема - не получается толково достать текст из др. сайта. Все что есть напишу ниже. На сайте тест.ру...

Регулярное выражение. Достать значение из строки
Как достать значение из строки Xxxx_sssxxw = qw2iddd; asddd Делал так string str = &quot;Xxxx_sssxxw = qw2iddd; asddd&quot;; ...

Регулярное выражение, чтобы достать текст
Есть ответ от сервера: ...

2
 Аватар для snajper_ro
116 / 101 / 52
Регистрация: 14.09.2011
Сообщений: 696
Записей в блоге: 1
16.03.2015, 21:34
click me
0
Эксперт Java
 Аватар для turbanoff
4094 / 3828 / 745
Регистрация: 18.05.2010
Сообщений: 9,331
Записей в блоге: 12
17.03.2015, 15:59
Не мучайте себя регулярками. Возьмите какой-нибудь html парсер. Например - JSoup
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
17.03.2015, 15:59
Помогаю со студенческими работами здесь

Парсинг между двумя тегами Html
Доброго времени суток. Уверен, на форуме было не мало подобных тем, но определенно этого запроса не нашел. Очень надеюсь на вашу помощь....

Получить текст между тегами HTML
Как получить весь текст между тегами (&lt;div class=&quot;msg&quot;&gt; Текст.... &lt;br&gt; ....магия &lt;/div&gt;)

Парсинг html: получить значение между тегами <a></a>
Я вот хочу написать парсер, наткнулся на код и он получал атрибуты href, я хотел получить значение между &lt;a&gt;&lt;/a&gt; Написал вот...

Связать memo с текстом между тегами(html)
Хочу написать программу каторая бы облегчила жизнь HTML'щиков.Суть: Допустим есть Html-страница(index.html) с таким содержанием: ...

Регулярное выражение для html
Здравствуйте. Начал изучать регулярные выражения... Хотелось бы увидеть пример...Не абы какой :) Дана строка: &lt;div...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru