Форум программистов, компьютерный форум, киберфорум
Java EE (J2EE)
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.50/4: Рейтинг темы: голосов - 4, средняя оценка - 4.50
0 / 0 / 0
Регистрация: 14.04.2013
Сообщений: 180

Парсинг сайта

27.04.2018, 16:12. Показов 943. Ответов 3
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток.
Не получается спрасить текст с сайта.

Открываем ссылку: https://lifehacker.ru/marinady-dlya-shashlyka/

Делаю вот так:

Java
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 new Thread(new Runnable() {
            public void run() {
                try{
                    Document doc = Jsoup.connect(link).get();
                    Elements slots = doc.select(".single__content");
                    for(Element slot:slots){
                        try {
                            Element text = slot.selectFirst(".post-content js-mediator-article ");
                        }catch (Exception e){
                            e.printStackTrace();
                        }
                    }
                }catch (Exception e){
                    e.printStackTrace();
                }
            }
        }).start();
В элементе slotsm я вижу div class= "post-content js-mediator-article", но когда пытаюсь получить его содержимое бьет ошибка.
Помогите исправить ошибку, заранее благодарен.
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
27.04.2018, 16:12
Ответы с готовыми решениями:

Парсинг сайта
Есть код на одном вебсайте: <script> "img": </script> Мой код, что бы достать ссылки на...

Парсинг сайта
Помощь в написане простого парсера на ява. На других языках тоже рассмотрю.

Парсинг сайта
Всем доброго времени суток. В общем решил попробовать попарсить сайт и вот что пока получилось: import org.jsoup.Jsoup; import...

3
Эксперт Java
3639 / 2971 / 918
Регистрация: 05.07.2013
Сообщений: 14,220
27.04.2018, 16:38
а прочитать, что в ошибке написано не пробовал?
0
0 / 0 / 0
Регистрация: 14.04.2013
Сообщений: 180
27.04.2018, 18:47  [ТС]
В ошибке пишет : org.jsoup.select.Selector$SelectorParseE xception: Could not parse query '': unexpected token at ''

Прошу писать по теме, а не создавать пустой треп.
0
Эксперт Java
3639 / 2971 / 918
Регистрация: 05.07.2013
Сообщений: 14,220
27.04.2018, 18:55

Не по теме:

Цитата Сообщение от Леонид Каруна Посмотреть сообщение
Прошу писать по теме, а не создавать пустой треп.
так ты сам в теме не ориентируешься толком, и разобраться, что и как создавать мы в состоянии и без тебе



а в ошибке довольно четко сказано, что ты пишешь кривые селекторы, на вот почитай https://css-tricks.com/multipl... selectors/
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
27.04.2018, 18:55
Помогаю со студенческими работами здесь

Парсинг сайта
Доброго времени суток. Несколько месяцев назад писал код для парсинга сайта и на тот момент все работало. Но когда вчера попытался...

Парсинг сайта
Добрый день, стоит задача парсить сайт game.co.uk. Необходимо консольное апп, которое принимает на вход id продукта и на выходе отдает...

Парсинг сайта
Столкнулся с проблемой парсинга. Но до того что бы спарсить необходима авторизация. Подскажите годную библиотеку которая способна и на...

Парсинг веб-сайта
В общем, имею на данном этапе приложение, которое загружает страницы с помощью Selenium и парсит их содержимое с помощью JSoup. К...

Парсинг сайта Jsoup
Всем привет. Изучаю Java, поставил перед собой задачу спарсить сайт. Немного разобрался с jsoup. Впринцыпе все получилось, но потом...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11680&d=1772460536 Одним из. . .
Реалии
Hrethgir 01.03.2026
Нет, я не закончил до сих пор симулятор. Эта задача сложнее. Не получилось уйти в плавсостав, но оно и к лучшему, возможно. Точнее получалось - но сварщиком в палубную команду, а это значит, в моём. . .
Ритм жизни
kumehtar 27.02.2026
Иногда приходится жить в ритме, где дел становится всё больше, а вовлечения в происходящее — всё меньше. Плотный график не даёт вниманию закрепиться ни на одном событии. Утро начинается с быстрых,. . .
SDL3 для Web (WebAssembly): Сборка библиотек: SDL3, Box2D, FreeType, SDL3_ttf, SDL3_mixer и SDL3_image из исходников с помощью CMake и Emscripten
8Observer8 27.02.2026
Недавно вышла версия 3. 4. 2 библиотеки SDL3. На странице официальной релиза доступны исходники, готовые DLL (для x86, x64, arm64), а также библиотеки для разработки под Android, MinGW и Visual Studio. . . .
SDL3 для Web (WebAssembly): Реализация движения на Box2D v3 - трение и коллизии с повёрнутыми стенами
8Observer8 20.02.2026
Содержание блога Box2D позволяет легко создать главного героя, который не проходит сквозь стены и перемещается с заданным трением о препятствия, которые можно располагать под углом, как верхнее. . .
Конвертировать закладки radiotray-ng в m3u-плейлист
damix 19.02.2026
Это можно сделать скриптом для PowerShell. Использование . \СonvertRadiotrayToM3U. ps1 <path_to_bookmarks. json> Рядом с файлом bookmarks. json появится файл bookmarks. m3u с результатом. # Check if. . .
Семь CDC на одном интерфейсе: 5 U[S]ARTов, 1 CAN и 1 SSI
Eddy_Em 18.02.2026
Постепенно допиливаю свою "многоинтерфейсную плату". Выглядит вот так: https:/ / www. cyberforum. ru/ blog_attachment. php?attachmentid=11617&stc=1&d=1771445347 Основана на STM32F303RBT6. На борту пять. . .
Камера Toupcam IUA500KMA
Eddy_Em 12.02.2026
Т. к. у всяких "хикроботов" слишком уж мелкий пиксель, для подсмотра в ESPriF они вообще плохо годятся: уже 14 величину можно рассмотреть еле-еле лишь на экспозициях под 3 секунды (а то и больше),. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru