Форум программистов, компьютерный форум, киберфорум
Программирование Android
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.75/4: Рейтинг темы: голосов - 4, средняя оценка - 4.75
Android
245 / 242 / 52
Регистрация: 19.01.2013
Сообщений: 1,896
Записей в блоге: 3

Спарсить HTML из строки в arraylist<mylist>

29.07.2014, 17:25. Показов 752. Ответов 7
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
как можно спарсить след..

Дату, текст1, текст2 и т.д.

HTML5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
<tr >  
  <td onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="date">29-07 21:00</td>  
  <a rel="" title=" Текст1">  Текст2</a></td> 
  <td  onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="when">Текст3</td> 
  <td  onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="when">Текст4</td> 
  <td align="center" style="width:50px;">    <div class="orating" id="orating-2225111">    <a href="#" class="orating_m" title="Не нравится" onclick="orating(2225111,0);return false;"></a>    <a href="#" class="orating_p" title="Нравится" onclick="orating(2225111,1);return false;"></a>    <a href="#" class="orating_res" onclick="ostats(2225111,1,true);return false;">Текст5</a>    </div><a onclick="showdialog(); return false;"></a>  </td>
  </tr>
 
<tr >  
  <td onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="date">29-07 21:00</td>  
  <a rel="" title=" Текст1">  Текст2</a></td> 
  <td  onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="when">Текст3</td> 
  <td  onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="when">Текст4</td> 
  <td align="center" style="width:50px;">    <div class="orating" id="orating-2225111">    <a href="#" class="orating_m" title="Не нравится" onclick="orating(2225111,0);return false;"></a>    <a href="#" class="orating_p" title="Нравится" onclick="orating(2225111,1);return false;"></a>    <a href="#" class="orating_res" onclick="ostats(2225111,1,true);return false;">Текст5</a>    </div><a onclick="showdialog(); return false;"></a>  </td>
  </tr>
 
<tr >  
  <td onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="date">29-07 21:00</td>  
  <a rel="" title=" Текст1">  Текст2</a></td> 
  <td  onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="when">Текст3</td> 
  <td  onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="when">Текст4</td> 
  <td align="center" style="width:50px;">    <div class="orating" id="orating-2225111">    <a href="#" class="orating_m" title="Не нравится" onclick="orating(2225111,0);return false;"></a>    <a href="#" class="orating_p" title="Нравится" onclick="orating(2225111,1);return false;"></a>    <a href="#" class="orating_res" onclick="ostats(2225111,1,true);return false;">Текст5</a>    </div><a onclick="showdialog(); return false;"></a>  </td>
  </tr>
 
<tr >  
  <td onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="date">29-07 21:00</td>  
  <a rel="" title=" Текст1">  Текст2</a></td> 
  <td  onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="when">Текст3</td> 
  <td  onclick="ShowOrHidetr('2225111'); return false;" nowrap="nowrap" class="when">Текст4</td> 
  <td align="center" style="width:50px;">    <div class="orating" id="orating-2225111">    <a href="#" class="orating_m" title="Не нравится" onclick="orating(2225111,0);return false;"></a>    <a href="#" class="orating_p" title="Нравится" onclick="orating(2225111,1);return false;"></a>    <a href="#" class="orating_res" onclick="ostats(2225111,1,true);return false;">Текст5</a>    </div><a onclick="showdialog(); return false;"></a>  </td>
  </tr>
из String переменной.. в ArrayList<MyList>
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.07.2014, 17:25
Ответы с готовыми решениями:

Спарсить html
Как можно спарсить html документ, уже довольно долго мучаюсь с регулярками string match = Regex.Match(outdata,...

Спарсить емейл с html
есть сайт на котором эсть пользователи. Как можно загрузив страницу пользователя извлечь дание &lt;li&gt;&lt;i...

Спарсить сайт html
Здравствуйте, решил спарсить сайт, скачал готовую библиотеку htmlcxx, как мне использовать библиотеку? Создать свой проект или писать код в...

7
Командир зеленых роботов
 Аватар для angryrobot
349 / 286 / 54
Регистрация: 08.10.2013
Сообщений: 576
29.07.2014, 22:07
Цитата Сообщение от kaspersky Посмотреть сообщение
как можно спарсить след..
народ вроде активно юзает всякие html парсеры вроде jsoup.
0
914 / 562 / 88
Регистрация: 13.02.2014
Сообщений: 2,083
30.07.2014, 08:36
Jsoup тут не поможет, по крайней мере дату не возьмет, текст по <a> только.
Парсить из переменной Regex в легкую сможет.
0
Android
245 / 242 / 52
Регистрация: 19.01.2013
Сообщений: 1,896
Записей в блоге: 3
30.07.2014, 09:27  [ТС]
Rube, я даже не на "вы" с этими регулярками
0
914 / 562 / 88
Регистрация: 13.02.2014
Сообщений: 2,083
30.07.2014, 10:54
для даты "\d\d-\d\d\s\d\d:\d\d"
для Текст2 "title.*>(.*)</a"
для Текст3/Текст4 "class="when">(.*)</td>"
для Текст5 "true.+false;">(.*)</a>\s+</div"
Подставить сам сможешь надеюсь? Имей ввиду в Eclipse надо ставить двойные слэши, не знаю почему.
1
Android
245 / 242 / 52
Регистрация: 19.01.2013
Сообщений: 1,896
Записей в блоге: 3
30.07.2014, 12:33  [ТС]
Rube, спасибо, да это уж смогу

если у тебя есть чуть времени, обьясни плис на пальцах что да как в коде можно и ссылку на норм русскоязычный ресурс где с регуляркой знакомят
0
914 / 562 / 88
Регистрация: 13.02.2014
Сообщений: 2,083
30.07.2014, 13:38
Код, кавычки в пеерменной убраны, т.к. тестировал тут
Java
1
2
3
4
5
6
7
8
9
10
11
import java.util.regex.Matcher;
import java.util.regex.Pattern;
...
String txt = "<return false; nowrap=nowrap class=date" +
    "29-07 21:00</td><a rel= title= Текст1>  Текст2</a></td>"; 
Pattern p = Pattern.compile(".*date(\\d\\d-\\d\\d\\s\\d\\d:\\d\\d)<.*title=.*>\\s+(.*?)<.*");
Matcher m = p.matcher(txt);
if (m.matches()) {
    System.out.println(m.group(1));
    System.out.println(m.group(2));
}
По Regex поищи regex online. А в рунете много тоже ресурсов, где описаны правила, там особо ничего сложного, я сам только учусь.
1
6 / 2 / 2
Регистрация: 10.03.2014
Сообщений: 17
30.07.2014, 19:54
Двойной слеш потому, что сам по себе слеш - способ отображать символы, которые зарезервированы как специальные, например кавычки \" просто так кавычку в стрингу не загонишь, Сам слеш тоже специальный, и как не странно, для отображения слеша используют его самого \\
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
30.07.2014, 19:54
Помогаю со студенческими работами здесь

Не могу спарсить html
вот код с сайта &lt;div id=&quot;bonus-bar&quot;&gt; &lt;div class=&quot;row&quot;&gt; &lt;div id=&quot;bonus&quot; class=&quot;medium-12 columns&quot;&gt; ...

Спарсить код HTML
Всем привет. Подскажите, как спарсить html код? Спасибо за ответы.

Как спарсить код HTML?
Как спарсить код HTML? Например, чтоб с сайта ЧитайГород названия и авторы книг перемещались в listbox

Спарсить данные с HTML страницы
Имеется HTML страница, со следующими содержаниеми: &lt;table class=&quot;table table-hover&quot;&gt; &lt;thead&gt; ...

Как спарсить HTML страницу?
Вот скриншот Нужно получить &quot;Производитель&quot; и &quot;Toyota&quot;, хелп


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
8
Ответ Создать тему
Новые блоги и статьи
1С: Программный отбор элементов справочника по группе
Maks 22.03.2026
Установка программного отбора элементов справочника "Номенклатура" из модуля формы документа. В качестве фильтра для отбора справочника служит группа номенклатуры. Отбор по наименованию группы. . .
Как я обхитрил таблицу Word
Alexander-7 21.03.2026
Когда мигает курсор у внешнего края таблицы, и нам надо перейти на новую строку, а при нажатии Enter создается новый ряд таблицы с ячейками, то мы вместо нервных нажатий Энтеров мы пишем любые буквы. . .
Krabik - рыболовный бот для WoW 3.3.5a
AmbA 21.03.2026
без регистрации и смс. Это не торговля, приложение не содержит рекламы. Выполняет свою непосредственную задачу - автоматизацию рыбалки в WoW - и ничего более. Однако если админы будут против -. . .
1С: Программный отбор элементов справочника по значению перечисления
Maks 21.03.2026
Установка программного отбора элементов справочника "Сотрудники" из модуля формы документа. В качестве фильтра для отбора служит значение перечислений. / / Событие "НачалоВыбора" реквизита на форме. . .
Переходник USB-CAN-GPIO
Eddy_Em 20.03.2026
Достаточно давно на работе возникла необходимость в переходнике CAN-USB с гальваноразвязкой, оный и был разработан. Однако, все меня терзала совесть, что аж 48-ногий МК используется так тупо: просто. . .
Оттенки серого
Argus19 18.03.2026
Оттенки серого Нашёл в интернете 3 прекрасных модуля: Модуль класса открытия диалога открытия/ сохранения файла на Win32 API; Модуль класса быстрого перекодирования цветного изображения в оттенки. . .
SDL3 для Desktop (MinGW): Рисуем цветные прямоугольники с помощью рисовальщика SDL3 на Си и C++
8Observer8 17.03.2026
Содержание блога Финальные проекты на Си и на C++: finish-rectangles-sdl3-c. zip finish-rectangles-sdl3-cpp. zip
Символические и жёсткие ссылки в Linux.
algri14 15.03.2026
Существует два типа ссылок — символические и жёсткие. Ссылка в Linux — это запись в каталоге, которая может указывать либо на inode «файла-ИСТОЧНИКА», тогда это будет «жёсткая ссылка» (hard link),. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru