|
0 / 0 / 0
Регистрация: 03.04.2017
Сообщений: 21
|
|||||||||||
Парсинг названия товара04.02.2019, 23:20. Показов 10646. Ответов 7
Доброго всем вечера!
Продолжаю изучать Python, решил попробовать парсинг сайта. В качестве пробы решил вытянуть название любимых макарон с Ozon. Ссылка: https://www.ozon.ru/context/detail/id/34859476/ Набросал следующих код: Кликните здесь для просмотра всего текста
В get_data() дохожу до div класса "container", следующий div класса "detail" найти не удается. Но он есть в структуре страницы. Кликните здесь для просмотра всего текста
Подскажите, в чем проблема?
0
|
|||||||||||
| 04.02.2019, 23:20 | |
|
Ответы с готовыми решениями:
7
Парсинг названия популярных фильмов с сайта kinopoisk Парсинг названия товара
|
|
|
||
| 04.02.2019, 23:41 | ||
|
Зачем такая длинная вереница селекторов? Стоит одному из них "провалиться" и вы получаете None и падение скрипта.
Селектор должен быть один и перед использованием результата нужно проверить, что он не None или не пустой список. XPATH для элемента можно даже скопировать из отладчика браузера, а потом подправить, если он чересчур абсолютный.
1
|
||
|
0 / 0 / 0
Регистрация: 03.04.2017
Сообщений: 21
|
||
| 04.02.2019, 23:49 [ТС] | ||
|
Если не выстраивать лист селекторов как можно достучаться до нужного элемента?
0
|
||
|
|
|||||||
| 05.02.2019, 00:02 | |||||||
|
Вы страницу, которую requests получает пробовали просмотреть?
Она пустая. Там нет ничего, кроме этого.
Добавлено через 1 минуту
1
|
|||||||
|
0 / 0 / 0
Регистрация: 03.04.2017
Сообщений: 21
|
|||||||
| 05.02.2019, 00:13 [ТС] | |||||||
|
Мне удалось вычленить название сократив функцию до:
А как примерно написать путь xpath в одном селекторе? Мне не удается найти синтаксис(
0
|
|||||||
|
|
||||||||
| 05.02.2019, 00:26 | ||||||||
Добавлено через 8 минут //*[@id="__layout"]/div/div[1]/div[2]/div/div[2]/div[2]/div[1]/div/h1 Разумеется в таком виде его лучше не использовать, а написать более компактный и менее абсолютный. Синтаксис XPATH очень гибкий и за один запрос можно получить все, включая даже фильтрацию по тексту и сам текст.
1
|
||||||||
|
|
|
| 05.02.2019, 04:02 | |
|
0
|
|
|
0 / 0 / 0
Регистрация: 03.04.2017
Сообщений: 21
|
||
| 05.02.2019, 13:49 [ТС] | ||
|
Сегодня подключился через мобильный интернет - выпадает ошибка. Как я понимаю Ozon блочит парсинг?
0
|
||
| 05.02.2019, 13:49 | |
|
Помогаю со студенческими работами здесь
8
дописать слово в названия товара Сотбит. Селектор названия товара указан неверно Как создать модификатор для названия товара CMS ставит title из названия товара, а не из пользовательского описания Запрос на получение названия самого часто продаваемого товара Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |
|
Новые блоги и статьи
|
||||
|
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Programma_Boinc 01.01.2026
Учёным и волонтёрам проекта «Einstein@home» удалось обнаружить четыре гамма-лучевых пульсара в джете Млечного Пути
Сочетание глобально распределённой вычислительной мощности и инновационных. . .
|
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Налог на собак: https:/ / **********/ gallery/ V06K53e
Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf
Пост отсюда. . .
|
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop?
Ниже её машинный перевод.
После долгих разбирательств я наконец-то вернула себе. . .
|
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод
Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод.
Thinkpad X220 Tablet —. . .
|
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта
Симптом:
После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
|
|
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
|
Новый ноутбук
volvo 07.12.2025
Всем привет.
По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне:
Ryzen 5 7533HS
64 Gb DDR5
1Tb NVMe
16" Full HD Display
Win11 Pro
|
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
|
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
|
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов
На странице:
https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/
нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
|