Форум программистов, компьютерный форум, киберфорум
Java SE (J2SE)
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.75/8: Рейтинг темы: голосов - 8, средняя оценка - 4.75
0 / 0 / 0
Регистрация: 11.04.2015
Сообщений: 19
1

Парсинг html, Jsoup

09.06.2018, 23:29. Показов 1474. Ответов 1
Метки нет (Все метки)

У меня есть страница логов в формате Профиль/Клан/Действие. Мне нужно вытащить оттуда все ники профилей. Хотел вытащить сначала все теги <a> (профиль - это ссылка), а затем оттуда ники профилей, но кланы так же содержатся в тегах <a>.
Пример:
HTML5
1
2
<a href="/profilemain/436197" class="user-link vip" onmouseover="showtip(1, 436197, event)" onmouseout="hidetip()">HardFrager</a>
<a href="/claninfo/991" onmouseover="showtip(10, 991, event)" onmouseout="hidetip()">Storm</a>
Первое - профиль, второе - клан.

Вопрос: как игнорировать тег <a>, содержащий инфу о кланах?

P.s. мой код:
Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
 
import java.io.IOException;
 
import java.util.HashMap;
 
public class URLReader {
    public static void main(String[] args) throws IOException {
        HashMap<String, String> cookies = new HashMap<>();
        cookies.put("Protected2","куки раз");
        cookies.put("PHPSESSID","куки два");
 
        Document doc2 = Jsoup.connect("ссылка, как понимаете, под авторизацией").cookies(cookies).get();
        Elements elements = doc2.select("table").last().select("a");//Страница содержит 3 таблицы, мне нужна последняя.
        System.out.println(elements);//Выводит и профили, и кланы
    }
}
Добавлено через 23 минуты
Сделал с условием, но можно ли без него?

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
 
import java.io.IOException;
 
import java.util.HashMap;
 
public class URLReader {
    public static void main(String[] args) throws IOException {
        HashMap<String, String> cookies = new HashMap<>();
        cookies.put("Protected2","Куки раз");
        cookies.put("PHPSESSID","Куки два");
 
        Document doc2 = Jsoup.connect("Ссылка").cookies(cookies).get();
        Elements elements = doc2.select("table").last().select("a");
        for (Element element : elements) {
            if (element.hasAttr("class"))
            System.out.println(element.text());
        }
    }
}
__________________
Помощь в написании контрольных, курсовых и дипломных работ здесь
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
09.06.2018, 23:29
Ответы с готовыми решениями:

Парсинг Jsoup
Всем привет. Подскажите как получить первую с цену с помощью Jsoup.

Парсинг сайта jsoup
Доброго времени суток. Есть сайт с проксями. Нужно спарсить прокси в таком виде: proxy:port...

Парсинг сайта Jsoup
Всем привет. Изучаю Java, поставил перед собой задачу спарсить сайт. Немного разобрался с...

Парсинг html
Добрый вечер, помогите разобраться с проблемкой. Мне нужно вывести URL ссылку картинки с помощью...

1
Эксперт Java
3330 / 2768 / 850
Регистрация: 05.07.2013
Сообщений: 13,270
10.06.2018, 11:00 2
По классу userlink выбирай
0
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
10.06.2018, 11:00

Jsoup. Парсинг при авторизации
Парсю сайт. На странице есть элемент (цена), значение которого меняется в зависимости от того гость...

Jsoup парсинг взаимодействие между классами - подскажите разобраться
Есть класс который парсит xml файл public class Myversion { public static void...

Parse HTML c использованием JSoup. Оценка оптимальности
Постановка задачи: необходимо по заданной дате получить с сайта http://cbr.ru/ данные по курсу...

Jsoup качает всю страницу целиком? или только html (без картинок, css и т.д.)?
&quot;тащю&quot; кусок div по id. Как измерить трафик? Jsoup выкачивает только исходный код, без...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2022, CyberForum.ru