Форум программистов, компьютерный форум, киберфорум
Наши страницы
Программирование Android
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
SMTNKR
0 / 0 / 0
Регистрация: 09.12.2010
Сообщений: 30
1

Парсинг XML с помощью Jsoup

05.09.2015, 13:50. Просмотров 533. Ответов 2
Метки нет (Все метки)

Всем добрый день.

Пишу андроид приложение. Использую библиотеку jsoup. Возникла проблема с парсингом xml.
Есть такой кусок на разбор:

XML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
<item cbc:type="story" cbc:deptid="2.657" cbc:syndicate="true">
<title>
<![CDATA[
2 men drown near Cornwall, Ont., in human smuggling attempt, police allege
]]>
</title>
<link>
[url]http://www.cbc.ca/news/canada/ottawa/2-men-drown-near-cornwall-ont-in-human-smuggling-attempt-police-allege-1.3216699?cmp=rss[/url]
</link>
<guid isPermaLink="false">1.3216699</guid>
<pubDate>Fri, 4 Sep 2015 20:33:22 EDT</pubDate>
<author>CBC News</author>
<category>News/Canada/Ottawa</category>
<description>
<![CDATA[
<img title='Investigators with the Canada Border Services Agency carry out search warrants on the island of Montreal,
 in connection with a suspected contraband tobacco ring.' height='259' alt='Canada Border Sevices Agency' width='460' src='http://i.cbc.ca/1.2626726.1398859119!/fileImage/httpImage/image.jpg_gen/derivatives/16x9_460/canada-border-sevices-agency.jpg'/> 
<p>Two men from India have drowned and a third has been rescued in the St. Lawrence River near Cornwall, Ont., in what police allege was a human smuggling attempt.</p>
]]>
</description>
</item>

Author, pubDate, link достал без проблем:
Java
1
2
3
4
5
 
Elements news = document.getElementsByTag("item");
Elements titles = news.select("title");
Elements dates = news.select("pubDate");
Elements authors = news.select("author");
Осталось достать Title и src.
XML
1
2
3
4
5
<title>
<![CDATA[
2 men drown near Cornwall, Ont., in human smuggling attempt, police allege
]]>
</title>
XML
1
src='http://i.cbc.ca/1.2626726.1398859119!/fileImage/httpImage/image.jpg_gen/derivatives/16x9_460/canada-border-sevices-agency.jpg
Title достать удается, но вместе с "![CDATA[]]".
src же вообще не могу достать.

Буду рад любого рода подсказкам. Спасибо большое!

Добавлено через 34 минуты
Ответ найден:
Java
1
2
3
4
5
Elements description = news.select("description");
for (Element descr:description){
            String html = descr.text();          
            String src = Jsoup.parse(html).select("img").first().attr("src");
        }
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
Similar
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
05.09.2015, 13:50
Ответы с готовыми решениями:

Парсинг JSOUP
Всем доброго времени суток, собственно такой вопрос. Хочу спарсить сайт с...

Парсинг Jsoup
Парсю сайт с помощью Jsoup Есть страница с новостями с URL в виде: Новости за...

JSOUP парсинг
Код парсит в textView1 с сайта class=&quot;30&quot; Как переписать/дописать код, чтоб он...

Парсинг на jsoup
Добрый всем день! Заминка такая, уже весь гугл перелопатил, синих ссылок в...

Jsoup парсинг сайта
Помогите пожалуйста. Пытаюсь получить названия книг с сайта livelib. Но он...

2
yura91
1 / 25 / 2
Регистрация: 23.10.2013
Сообщений: 2,326
06.09.2015, 23:34 2
используй XMLPullParser
0
Pablito
07.09.2015, 08:46     Парсинг XML с помощью Jsoup
  #3

Не по теме:

фигасе растет чувак, советы уже раздает

0
MoreAnswers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
07.09.2015, 08:46
Привет! Вот еще темы с ответами:

jsoup, парсинг html
А почему не работает такой простой код? Парсинг из инета пока не трогаем......

Jsoup парсинг адерса ссылки
Как с помощью библиотеки jsoup парсить адрес ссылки &lt;a class=&quot;news-one clearfix...

Ошибка приложения (парсинг jsoup)
Вот есть такой код (делал по этому примеру ) package com.example.parse; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2018, vBulletin Solutions, Inc.
Рейтинг@Mail.ru