0 / 0 / 0
Регистрация: 19.12.2014
Сообщений: 42

Код для парсинга

11.11.2024, 11:13. Показов 375. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Добрый день! Не знаю, куда именно поместить тему, но думаю всё-таки здесь будет корректнее.
Я новичок в Python программировании.
Хочу сделать небольшой парсер цен с артикулами и наименованиями для работы с сайта.
Почему-то вообще ничего не отображается в итоговом xlsx файле. Укажите, пожалуйста, на ошибку и помогите исправить для корректной работы
Мне кажется, что ошибка кроется именно в CSS-селекторе для ссылок, т.к. я не очень понимаю момент с тем, как Python понимает, что ему надо провалиться в конкретный товар забрать информацию и перейти к следующему

Буду очень благодарен за помощь

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
import requests
from bs4 import BeautifulSoup
import pandas as pd
 
# Базовый URL
base_url = "https://aquadom.info/catalog/statsionarnye/"
 
# Количество страниц для парсинга
pages_to_parse = 3
 
# Список для хранения данных
items = []
 
# Перебираем страницы каталога
for page in range(1, pages_to_parse + 1):
# Формируем URL для текущей страницы каталога
url = f"{base_url}?PAGEN_2={page}&SIZEN_2=12"
 
# Отправляем запрос
response = requests.get(url)
 
# Проверяем, что запрос успешен
if response.status_code == 200:
# Парсим страницу каталога
soup = BeautifulSoup(response.text, 'html.parser')
 
# Собираем ссылки на страницы товаров
product_links = soup.select(".product_item_title")  # Это предполагаемый CSS-селектор для ссылок на товары
for link in product_links:
product_url = link.get('href')
if product_url:
full_url = base_url + product_url if product_url.startswith('/') else product_url
 
# Заходим на страницу товара
product_response = requests.get(product_url)
if product_response.status_code == 200:
product_soup = BeautifulSoup(product_response.text, 'html.parser')
 
# Собираем данные о товаре
article = product_soup.select_one(".card_article").text.strip() if product_soup.select_one(".card_article") else None
name = product_soup.select_one(".product_card_title").text.strip() if product_soup.select_one(".product_card_title") else None
price = product_soup.select_one(".product-item-detail-price-current").text.strip() if product_soup.select_one(".product-item-detail-price-current") else None
 
# Добавляем информацию о товаре в список
items.append({
"Артикул": article,
"Наименование": name,
"Цена": price,
"Описание": description
})
 
else:
print(f"Ошибка при загрузке страницы {page}, код ответа: {response.status_code}")
 
# Записываем данные в Excel
df = pd.DataFrame(items)
df.to_excel("C:/users/moomin/desktop/aquadom_products_detailed.xlsx", index=False)
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
11.11.2024, 11:13
Ответы с готовыми решениями:

Исправить код для парсинга страницы
В общем сори если тема уже есть, просто, появился у меня вопрос. Подскажите почему не работает. Тупо не определяет имя news, пробовал...

Исправить код для парсинга сайта
Здравствуйте! Извините, если я не в той ветке пишу. Не могу разобраться с библиотекой Beautiful Soup. Хочу спарсить сайт...

Поправьте код для парсинга
HTML class="FacebookBM"> <a href="/r.asp?http://www.facebook.com/sharer.php ...

1
115 / 100 / 15
Регистрация: 24.07.2019
Сообщений: 314
11.11.2024, 15:44
попробуйте выполнить код в режиме отладки, по шагам-строкам, отслеживая значения переменных
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
11.11.2024, 15:44
Помогаю со студенческими работами здесь

Исправить код для парсинга
Здравствуйте! Программа должна парсить Яндекс сниппеты для заданных ключевых слов. Программа выдает сообщение что все спарсилось, но это...

Код для парсинга Olx
есть код для парсинга олх @bot.message_handler(commands=) def ask(message): input_ = bot.send_message(message.chat.id,...

Код для парсинга сайта в эксель
Доброго времени суток! Можете помочь, пожалуйста, с кодом. Хочу сделать парсер для вывода таблицы в эксель из сайта...

Дописать код для парсинга документов с сайта
День добрый и всех с праздником! Есть готовый код (сложный) на 1500 строк на PowerShell (одна из последних версий) на win10. Создатель...

Поправьте код для парсинга HTML-страницы
<tr class="itr"> <td class="itdh" align="center">4</td> <td class="itd_lb" width="33%" nowrap align="left"> <a...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Опции темы

Новые блоги и статьи
Вывод данных через динамический список в справочнике
Maks 01.04.2026
Реализация из решения ниже выполнена на примере нетипового справочника "Спецтехника" разработанного в конфигурации КА2. Задача: вывести данные из ТЧ нетипового документа. . .
Функция заполнения текстового поля в реквизите формы документа
Maks 01.04.2026
Алгоритм из решения ниже реализован на нетиповом документе "ВыдачаОборудованияНаСпецтехнику" разработанного в конфигурации КА2, в дополнении к предыдущему решению. На форме документа создается. . .
К слову об оптимизации
kumehtar 01.04.2026
Вспоминаю начало 2000-х, университет, когда я писал на Delphi. Тогда среди программистов на форумах активно обсуждали аккуратную работу с памятью: нужно было следить за переменными, вовремя. . .
Идея фильтра интернета (сервер = слой+фильтр).
Hrethgir 31.03.2026
Суть идеи заключается в том, чтобы запустить свой сервер, о чём я если честно мечтал давно и давно приобрёл книгу как это сделать. Но не было причин его запускать. Очумелые учёные напечатали на. . .
Модель здравосоХранения 6. ESG-повестка и устойчивое развитие; углублённый анализ кадрового бренда
anaschu 31.03.2026
В прикрепленном документе раздумья о том, как можно поменять модель в будущем
10 пpимет, которые всегда сбываются
Maks 31.03.2026
1. Чтобы, наконец, пришла маршрутка, надо закурить. Если сигарета последняя, маршрутка придет еще до второй затяжки даже вопреки расписанию. 2. Нaдоели зима и снег? Не надо переезжать. Достаточно. . .
Перемещение выделенных строк ТЧ из одного документа в другой
Maks 31.03.2026
Реализация из решения ниже выполнена на примере нетипового документа "ВыдачаОборудованияНаСпецтехнику" с единственной табличной частью "ОборудованиеИКомплектующие" разработанного в конфигурации КА2. . . .
Functional First Web Framework Suave
DevAlt 30.03.2026
Sauve. IO Апнулись до NET10. Из зависимостей один пакет, работает одинаково хорошо как в режиме проекта так и в интерактивном режиме. из сложностей - чисто функциональный подход. Решил. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru