Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
1 / 1 / 0
Регистрация: 29.12.2023
Сообщений: 15

Проблема при парсинге

29.12.2023, 10:23. Показов 534. Ответов 4
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Все привет, подскажите пожалуйста мне нужно спарсить все названия кукольных домов на определенном сайте, это получилось,но спарсились 3 лишних объекта, каким способом можно убрать лишние?
Python
1
2
3
4
5
6
7
8
9
from urllib.request import urlopen
from bs4 import BeautifulSoup
html=urlopen("https://www.sunnytoy.ru/shop/25/")
bs=BeautifulSoup(html,'html.parser')
 
name_doma=bs.find_all('span',{'itemprop':'name'})
 
for name in name_doma:
    print(name.get_text())
0
Лучшие ответы (1)
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
29.12.2023, 10:23
Ответы с готовыми решениями:

Проблема с кодировкой при парсинге
Уважаемые программисты. Изучаю python. Есть Html: <!DOCTYPE html> <head><title>Заголовок веб-сайта</title></head> ...

Ссылки при парсинге
Всем привет, при парсинге ссылок если в ссылке присутствуют не латинские символы то ссылка выводится в виде ссылки только до того места с...

Ошибка при парсинге
В общем по учебе надо пропарсить tutu.ru чтобы подобрать ближайшую электричку. При парсинге столкнулся с дилеммой, из-за которой горит не...

4
Эксперт PythonЭксперт Java
19530 / 11067 / 2931
Регистрация: 21.10.2017
Сообщений: 23,294
29.12.2023, 10:34
Лучший ответ Сообщение было отмечено Versachi как решение

Решение

name_doma=bs.find_all('span',{'itemprop' :'name'})[:-3]
1
1 / 1 / 0
Регистрация: 29.12.2023
Сообщений: 15
29.12.2023, 10:54  [ТС]
Вот так получилось спс
name_doma=bs.find_all('span',{'itemprop' :'name'})[3:]
0
 Аватар для CopBuroJLoBa
150 / 132 / 53
Регистрация: 03.01.2017
Сообщений: 472
29.12.2023, 11:03
Извините, а какие домики лишние?

Python
1
2
3
4
5
6
7
8
9
10
11
import requests
from bs4 import BeautifulSoup
 
url = 'https://www.sunnytoy.ru/shop/25/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html5lib')
temp = soup.find_all('div', class_='product')
 
for i in range(0, len(temp)):
    name = temp[i].find('div', class_='name').span.getText()
    print("{:^2}".format(i), name)

Code
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
0  Кукольный домик KidKraft Кайли Kaylee (Кайла Kayla 2)
1  Кукольный домик KidKraft Загородная усадьба
2  Большой кукольный дом KidKraft Сияние Sparkle Mansion Dollhouse
3  Кукольный домик с мебелью KidKraft Амелия
4  Кукольный домик с мебелью KidKraft Кайла Kayla
5  Кукольный домик KidKraft Ассембли с мебелью
6  Кукольный домик с мебелью KidKraft Магнолия
7  Кукольный домик с мебелью KidKraft Саванна
8  Кукольный домик с мебелью для Барби KidKraft Особняк мечты
9  Кукольный домик KidKraft Особняк Роскошь
10 Кукольный домик KidKraft Шик
11 Кукольный домик с мебелью KidKraft Открытый коттедж
12 Кукольный домик с мебелью KidKraft Аннабель (в подарочной упаковке)
13 Кукольный домик KidKraft Далия с мебелью
14 Кукольный домик Lanaland Николь
15 Кукольный домик KidKraft Замок Розовый сад
16 Кукольный домик KidKraft Хэлли с мебелью
17 Кукольный домик с мебелью KidKraft Бруклинский Лофт
18 Кукольный домик KidKraft Камила с мебелью
19 Кукольный домик KidKraft Особняк Лола с мебелью
20 Кукольный домик KidKraft Радужные Мечты с мебелью
21 Кукольный домик KidKraft Особняк Селесты с мебелью
22 Кукольный домик KidKraft Патио с бассейном и мебелью
23 Кукольный домик KidKraft Роуен с мебелью
24 Кукольный домик KidKraft Бьянка с мебелью
25 Кукольный домик KidKraft Шарлотта
26 Кукольный домик с мебелью Lanaland Молли
27 Кукольный домик с мебелью KidKraft Ava
28 Кукольный домик KidKraft Лолли с мебелью
29 Кукольный домик KidKraft Вивиана с мебелью
30 Кукольный домик KidKraft Эмили с мебелью
31 Кукольный дом KidKraft Бэлла
32 Кукольный домик Lanaland Барбара
33 Кукольный домик с мебелью Lanaland Лючия
34 Кукольный шкаф KidKraft для одежды
1
Любознательный
 Аватар для YuS_2
7404 / 2254 / 360
Регистрация: 10.03.2016
Сообщений: 5,213
29.12.2023, 18:00
Цитата Сообщение от iSmokeJC Посмотреть сообщение
[:-3]

Так не пойдет... лишние элементы могут ведь затесаться и в середине, и как здесь, в самом начале...

Цитата Сообщение от Versachi Посмотреть сообщение
Вот так получилось
Так - всё равно, костыльно слишком...
Правильнее будет, как у CopBuroJLoBa,
Сначала выборка из дом-структуры, только элементов товара (чтобы исключить лишние), а затем уже в выборке находим элементы, которые требуются. Способы для выборки есть разные...
Например, можно так:
Python
1
2
3
4
5
6
7
8
9
import requests
from bs4 import BeautifulSoup
 
url = 'https://www.sunnytoy.ru/shop/25/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html5lib')
dname = soup.select('div[id^="productId"].product div.name a span')
for item in dname:
    print(item.string)
1
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
29.12.2023, 18:00
Помогаю со студенческими работами здесь

При парсинге не находится тэг
Всем привет. Изучаю парсинг с помощью BeautifulSoup. Написал такой код: import requests from bs4 import BeautifulSoup ...

Ошибка при парсинге Json
Ошибка возникаєт в парсенге, понять что он от меня хочет не могу. Сначала я делал всё как впримере где била другая сылка. Пример: ...

Проблема при парсинге
Всем привет! Помогите, пожалуйста, новичку решить проблему. Пишу парсер магазина. Скрипт постранично вытаскивает ссылки лотов и далее...

Проблема с кириллицей при парсинге
Microsoft Windows (c) Корпорация Майкрософт (Microsoft Corporation). Все права защищены. C:\Users\admin>chcp Текущая кодовая...

Проблема с кодировкой при парсинге
Обучаюсь парсингу и начал писать свой собственный код. Хронология действий: - Скопировал главную страницу в html файл на свой...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
5
Ответ Создать тему
Новые блоги и статьи
http://iceja.net/ сервер решения полиномов
iceja 18.01.2026
Выкатила http:/ / iceja. net/ сервер решения полиномов (находит действительные корни полиномов методом Штурма). На сайте документация по API, но скажу прямо VPS слабенький и 200 000 полиномов. . .
Первый деплой
lagorue 16.01.2026
Не спеша развернул своё 1ое приложение в kubernetes. А дальше мне интересно создать 1фронтэнд приложения и 2 бэкэнд приложения развернуть 2 деплоя в кубере получится 2 сервиса и что-бы они. . .
Расчёт переходных процессов в цепи постоянного тока
igorrr37 16.01.2026
/ * Дана цепь постоянного тока с R, L, C, k(ключ), U, E, J. Программа составляет систему уравнений по 1 и 2 законам Кирхгофа, решает её и находит: токи, напряжения и их 1 и 2 производные при t = 0;. . .
Восстановить юзерскрипты Greasemonkey из бэкапа браузера
damix 15.01.2026
Если восстановить из бэкапа профиль Firefox после переустановки винды, то список юзерскриптов в Greasemonkey будет пустым. Но восстановить их можно так. Для этого понадобится консольная утилита. . .
Изучаю kubernetes
lagorue 13.01.2026
А пригодятся-ли мне знания kubernetes в России?
Сукцессия микоризы: основная теория в виде двух уравнений.
anaschu 11.01.2026
https:/ / rutube. ru/ video/ 7a537f578d808e67a3c6fd818a44a5c4/
WordPad для Windows 11
Jel 10.01.2026
WordPad для Windows 11 — это приложение, которое восстанавливает классический текстовый редактор WordPad в операционной системе Windows 11. После того как Microsoft исключила WordPad из. . .
Classic Notepad for Windows 11
Jel 10.01.2026
Old Classic Notepad for Windows 11 Приложение для Windows 11, позволяющее пользователям вернуть классическую версию текстового редактора «Блокнот» из Windows 10. Программа предоставляет более. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru