Форум программистов, компьютерный форум, киберфорум
Программирование Android
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.92/25: Рейтинг темы: голосов - 25, средняя оценка - 4.92
13 / 13 / 9
Регистрация: 23.10.2014
Сообщений: 184

Jsoup парсинг сайта

26.06.2016, 10:47. Показов 4823. Ответов 8
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Помогите пожалуйста.
Пытаюсь получить названия книг с сайта livelib.
Но он ничего не парсит. Все сайты парсит нормально а на этом не получается .

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
public class NewsFragment extends Fragment {
    public Elements  title;
    public ArrayList<String> titleList = new ArrayList<String>();
    private ArrayAdapter<String> adapter;
    private ListView lv;
    private TextView tv;
    View view;
    public NewsFragment() {
        // Required empty public constructor
    }
 
    @Override
    public View onCreateView(LayoutInflater inflater, ViewGroup container,
                             Bundle savedInstanceState) {
        view = inflater.inflate(R.layout.fragment_news, container, false);
        lv=(ListView)view.findViewById(R.id.listViewNews);
 
        adapter= new ArrayAdapter<String>(getActivity(),android.R.layout.simple_list_item_1,titleList);
        lv.setAdapter(adapter);
        new MyTask().execute();
        return view;
    }
    public class MyTask extends AsyncTask<Void, Void, Void> {
        @Override
        protected Void doInBackground(Void... voids) {
 
            try {
                Document document = Jsoup.connect("https://www.livelib.ru/selection/20233").get();
                Elements description = document.select(".tag-book-title");
 
                for(Element titleFromSite:description){
                    if(titleFromSite.text().equals(""))
                        continue;
                    titleList.add(titleFromSite.text());
                }
            }catch (IOException ex){
                ex.printStackTrace();
            }
            return null;
        }
        @Override
        protected void onPostExecute(Void aVoid) {
 
            adapter.notifyDataSetChanged();
        }
    }
0
Лучшие ответы (1)
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
26.06.2016, 10:47
Ответы с готовыми решениями:

Jsoup Парсинг сайта в таблицу (GridView)!
Здравствуйте! Подскажите новичку почему этот код на ListView работает, а на GridView приложение вылетает (пишет &quot;Приложение...

Парсинг Jsoup
Парсю сайт с помощью Jsoup Есть страница с новостями с URL в виде: Новости за последний месяц ../news.php?menuid=39&quot; Выбранный...

JSOUP парсинг
Код парсит в textView1 с сайта class=&quot;30&quot; Как переписать/дописать код, чтоб он парсил еще и в textView2 класс=&quot;31&quot; Классы...

8
2884 / 2296 / 769
Регистрация: 12.05.2014
Сообщений: 7,978
26.06.2016, 12:42
по адресу который в коде, открывается

что там должно парсить?
1
13 / 13 / 9
Регистрация: 23.10.2014
Сообщений: 184
26.06.2016, 12:58  [ТС]
Там же если ниже пролистать идет список книг
0
2884 / 2296 / 769
Регистрация: 12.05.2014
Сообщений: 7,978
26.06.2016, 14:30
Лучший ответ Сообщение было отмечено rockstarone как решение

Решение

Java
1
2
3
4
5
6
7
8
        Document doc = Jsoup.connect("https://www.livelib.ru/selection/20233").execute().parse();
        Elements elements = doc.getElementsByClass("selebook-row"); // книги, 3 штуки в массиве
        for (Element e: elements) {
            String title = e.getElementsByClass("book-title").text();
            String author = e.getElementsByClass("author-name").text();
            String posterUrl = e.getElementsByClass("book-picture").select("img").attr("src");
            String description = e.getElementsByClass("book-description").text();
        }
попробовал, у меня выводит три книги
1
13 / 13 / 9
Регистрация: 23.10.2014
Сообщений: 184
26.06.2016, 21:51  [ТС]
Паблито, Да, действительно так работает. Но 3 книги. Это из-за того что он считает что мы с мобильной версии сайта. А как сказать ему что мы с пк?

Добавлено через 1 час 1 минуту
Паблито, пробую через useragent . получается что листвью вроде заполнен. могу пролистать вниз, вверх но значений нет

Добавлено через 5 часов 33 минуты
Паблито, все . разобрался. спасибо большое. а как мне теперь картинку в imageview засунуть, подскажи пожалуйста?
0
2884 / 2296 / 769
Регистрация: 12.05.2014
Сообщений: 7,978
27.06.2016, 11:00
Цитата Сообщение от rockstarone Посмотреть сообщение
а как мне теперь картинку в imageview засунуть,
ImageView
1
13 / 13 / 9
Регистрация: 23.10.2014
Сообщений: 184
27.06.2016, 11:04  [ТС]
Паблито, а как сам адрес получить? подскажите пожалуйста.
Java
1
    String posterUrl = e.getElementsByClass("book-picture").select("img").attr("src");
Там же нет такого класса book-picture.
0
2884 / 2296 / 769
Регистрация: 12.05.2014
Сообщений: 7,978
27.06.2016, 11:54
да, я забыл про useragent
Java
1
2
3
4
                        String title = e.getElementsByClass("tag-book-title").text();
                        String author = e.getElementsByClass("tag-book-author").text();
                        String posterUrl = e.getElementsByClass("block").select("img").attr("src");
                        String description = e.getElementsByClass("selebook").text();
вот так вроде работает, 25 книг находит
1
13 / 13 / 9
Регистрация: 23.10.2014
Сообщений: 184
27.06.2016, 14:36  [ТС]
Паблито, спасибо большое!
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
27.06.2016, 14:36
Помогаю со студенческими работами здесь

Парсинг на jsoup
Добрый всем день! Заминка такая, уже весь гугл перелопатил, синих ссылок в браузере не осталось. Есть пример парсинга сайта: import...

Парсинг JSOUP
Всем доброго времени суток, собственно такой вопрос. Хочу спарсить сайт с помощью библиотеки JSOUP. Сдклать что то типа парсера новостной...

jsoup, парсинг html
А почему не работает такой простой код? Парсинг из инета пока не трогаем... Код: package com.example.projecta; import...

Ошибка приложения (парсинг jsoup)
Вот есть такой код (делал по этому примеру ) package com.example.parse; import java.io.IOException; import...

Jsoup парсинг адерса ссылки
Как с помощью библиотеки jsoup парсить адрес ссылки &lt;a class=&quot;news-one clearfix brdr-btm&quot; href=&quot;/news/3719/&quot;&gt; ...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
9
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ математические сервисы
iceja 20.01.2026
Обновила свой сайт http:/ / iceja. net/ , приделала Fast Fourier Transform экстраполяцию сигналов. Однако предсказывает далеко не каждый сигнал (см ограничения http:/ / iceja. net/ fourier/ docs ). Также. . .
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит переходные токи и напряжения на элементах схемы. . . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
Почему дизайн решает?
Neotwalker 09.01.2026
В современном мире, где конкуренция за внимание потребителя достигла пика, дизайн становится мощным инструментом для успеха бренда. Это не просто красивый внешний вид продукта или сайта — это. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru