0 / 0 / 0
Регистрация: 29.11.2012
Сообщений: 44

jsoup

08.04.2013, 22:34. Показов 1717. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здрасьте.
Вопрос по поводу этой замечательной библиотеке
Есть html следующего содержания:
HTML5
1
2
3
4
5
6
7
8
9
<span class="aaa">Всем привет!<br />
<br />
бла бла бла, бла бла бла <b class="b">Большой текст</b>.<br />
опять бла бла бла, бла бла бла <a href="http://cyberforum.ru/tuda/suda/" class="b">Для новичков </a>. Вы еще тут? Приступим!<br />
И так, бла бла бла, бла бла бла <a href="http://cyberforum.ru/netuda" class="b3">скучаем</a>.<br />
Теперь прыгаем на этот сайт <a class="b" rel="nofollow" href="http://kto_zdes.org/?action=advanced_form">http://kto_zdes.netu_nikogo.org/?action=advanced_form</a> , я здесь один:<br />
<img width="420" src="http://zarplaty.net/444555/image.png" class="b"/><br />
ну и так далее
</span>
для извлечения текста делаю следующее : Element.select("span[class=aaa]").text(). В итоге получаю весь текст сообщения.
Вот в чем вопрос: как можно получать текст порциями между тегами? Получить отдельно части текста между <br /> и началом <b...
HTML5
1
2
<br />
бла бла бла, бла бла бла <b
затем, например, между <br /> и <a...
HTML5
1
2
<br />
опять бла бла бла, бла бла бла <a
ну и так далее получать текст между тегами?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
08.04.2013, 22:34
Ответы с готовыми решениями:

Jsoup
Помогите пожалуйста. При нажатии на строку с заголовком приложение вылетает. Подскажите в чем дело и как потом это исправить. public...

Jsoup и https
Здравствуйте есть вопрос. Есть сайт на https на котором нужно залогиниться чтобы получить инфу. вопрос в том как с этим работать с...

Jsoup парс
Здравствуйте такой вопрос есть сайт который в наличие есть скрипт ... &lt;td class=&quot;time&quot;&gt; ...

2
1162 / 986 / 1
Регистрация: 28.06.2012
Сообщений: 3,462
08.04.2013, 22:50
смотрите документацию.

там есть например такое:

For example, with the input HTML: <p>One <span>Two</span> Three <br> Four</p> with the p element selected:

p.text() = "One Two Three Four"
p.ownText() = "One Three Four"
p.children() = Elements[<span>, <br>]
p.childNodes() = List<Node>["One ", <span>, " Three ", <br>, " Four"]
p.textNodes() = List<TextNode>["One ", " Three ", " Four"]
2
0 / 0 / 0
Регистрация: 29.11.2012
Сообщений: 44
08.04.2013, 23:18  [ТС]
Спасибо, то, что надо. +
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
08.04.2013, 23:18
Помогаю со студенческими работами здесь

AsyncTask и Jsoup
Не работает вот такой код: package com.example.projecta; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import...

JSOUP парсинг
Код парсит в textView1 с сайта class=&quot;30&quot; Как переписать/дописать код, чтоб он парсил еще и в textView2 класс=&quot;31&quot; Классы...

Парсинг на jsoup
Добрый всем день! Заминка такая, уже весь гугл перелопатил, синих ссылок в браузере не осталось. Есть пример парсинга сайта: import...

WebView + JSOUP
Добрый день. Приложение падает с ошибкой. Подскажи, пожалуйста, в чем причина? 10-06 21:30:52.489 26025-26048/?...

Парсинг JSOUP
Всем доброго времени суток, собственно такой вопрос. Хочу спарсить сайт с помощью библиотеки JSOUP. Сдклать что то типа парсера новостной...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

Новые блоги и статьи
Отчёт о затраченных материалах за определенный период с макетом печатной формы
Maks 21.04.2026
Отчёт из решения ниже размещён в конфигурации КА2. Задача: разработка отчёта по затраченным материалам за определённый период, с возможностью вывода печатной формы отчёта с шапкой и подвалом. В. . .
Отчёт о спецтехнике находящейся в ремонте
Maks 20.04.2026
Отчёт из решения ниже размещен в конфигурации КА2. Задача: отобразить спецтехнику, которая на данный момент находится в ремонте. Есть нетиповой документ "Заявка на ремонт спецтехники" который. . .
Памятка для бота и "визитка" для читателей "Semantic Universe Layer (Слой семантической вселенной)"
Hrethgir 19.04.2026
Сгенерировано для краткого описания по случаю сборки и компиляции скелета серверного приложения. И пусть после этого скажут, что статьи сгенерированные AI - туфта и не интересно. И это не реклама -. . .
Запрет удаления строк ТЧ документа при определённом условии
Maks 19.04.2026
Алгоритм из решения ниже реализован на примере нетипового документа "Аккумуляторы", разработанного в конфигурации КА2. У данного документа есть ТЧ, в которой в зависимости от прав доступа. . .
Модель заражения группы наркоманов
alhaos 17.04.2026
Условия задачи сформулированы тут Суть: - Группа наркоманов из 10 человек. - Только один инфицирован ВИЧ. - Колются одной иглой. - Колются раз в день. - Колются последовательно через. . .
Мысли в слух. Про "навсегда".
kumehtar 16.04.2026
Подумалось тут, что наверное очень глупо использовать во всяких своих установках понятие "навсегда". Это очень сильное понятие, и я только начинаю понимать край его смысла, не смотря на то что давно. . .
My Business CRM
MaGz GoLd 16.04.2026
Всем привет, недавно возникла потребность создать CRM, для личных нужд. Собственно программа предоставляет из себя базу данных клиентов, в которой можно фиксировать звонки, стадии сделки, а также. . .
Знаешь почему 90% людей редко бывают счастливыми?
kumehtar 14.04.2026
Потому что они ждут. Ждут выходных, ждут отпуска, ждут удачного момента. . . а удачный момент так и не приходит.
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru