Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/5: Рейтинг темы: голосов - 5, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 26.04.2019
Сообщений: 21

Парсер на Python

11.04.2022, 11:02. Показов 976. Ответов 2

Студворк — интернет-сервис помощи студентам
Пишу парсер для страницы https://www.regard.ru/catalog/tovar244993.htm/
Получилось спарсить данные с основной карточки, но никак не могу взять данные с таблицы характеристик
Как это сделать?



Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
import requests
from fake_useragent import UserAgent
from bs4 import BeautifulSoup
import lxml.html
 
UserAgent().chrome
 
URL = 'https://www.regard.ru/catalog/tovar244993.htm/'
 
def get_html(url, params=None):
    response = requests.get(URL, headers={'User-Agent': UserAgent().chrome}, params=params)
    return response
 
 
def get_content(html):
 
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all('div', class_='container')
 
    object = []
 
    for item in items:
        if item != 'None':
            object.append({
 
                'id': item.find('div', class_= 'goods_id').get_text(strip=True),
                'name': item.find('h1', id='goods_head').get_text(strip=True),
                'availability':  item.find('div', class_='goodCard_inStock_button').get_text(strip=True),
                'price': (item.find('span', class_='price lot', itemprop = 'offers').get_text(' ', strip=True, )).replace('возможна доставка сегодня', '', 1) ,
                
            })
    
    print(object)
 
def parse():
    html = get_html(URL)
    if html.status_code == 200:
        get_content(html.text)
    else:
        print('Error')
 
 
parse()
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
11.04.2022, 11:02
Ответы с готовыми решениями:

Парсер на Python
Добрый день, подскажите, пожалуйста. Пытаюсь сделать парсер. IDE Pycharm. Mac 2014г Big Sur. Установлен Pyhton 3.10.4. Не могу...

Парсер hh.ru на Python
Доброго времени суток. У меня при изучении Python возникла проблема, сижу ломаю голову. Парсер должен вытягивать 100 вакансий со страницы,...

Парсер Python
Здравствуйте. Всех с наступающим Новым годом Есть код парсера на Python. Ответ от сервера 403. Как узнать в чём причина такого ответа....

2
113 / 98 / 15
Регистрация: 24.07.2019
Сообщений: 302
11.04.2022, 16:09
можно пойти другим путём )
Python
1
2
3
4
5
6
7
8
9
import requests
import re
pattern1 = re.compile( ...  )
pattern2 = re.compile(  ... ) 
...
def get_content_other(my_string):
    t_number = re.findall(pattern1, my_string)
    t_winners = re.findall(pattern2, my_string)
...
0
Эксперт по компьютерным сетям
 Аватар для Jabbson
5906 / 3358 / 1036
Регистрация: 03.11.2009
Сообщений: 10,008
11.04.2022, 17:20
Python
1
items = soup.find_all('div', class_='container')
он же там один, зачем цикл?

если без изменений Вашего кода, то

Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
def get_content(html):
 
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all('div', class_='container')
 
    object = []
 
    for item in items:
        if item != 'None':
            object.append({
 
                'id': item.find('div', class_= 'goods_id').get_text(strip=True),
                'name': item.find('h1', id='goods_head').get_text(strip=True),
                'availability':  item.find('div', class_='goodCard_inStock_button').get_text(strip=True),
                'price': (item.find('span', class_='price lot', itemprop = 'offers').get_text(' ', strip=True, )).replace('возможна доставка сегодня', '', 1) ,
                'details': {}
            })
 
            trs = item.select('div#tabs-1 tr')
            for tr in trs:
                data = [x.text.strip() for x in tr.select('td')]
                if len(data) == 2:
                    object[0]['details'][data[0]] = data[1]
 
    print(object)
Code
1
2
3
4
5
6
7
8
9
10
11
12
13
14
[{'id': '244993', 'name': 'Видеокарта NVIDIA GeForce GTX1050 Ti Palit StormX 4Gb (NE5105T018G1) OEM', 
'availability': 'в наличии', 'price': '28 570 руб.', 'details': {'Производитель': 'Palit', 
'Код производителя': 'NE5105T018G1-1070F/1076F', 'Интерфейс': 'PCI Express 3.0', 
'Производитель видеопроцессора': 'nVidia', 'Серия': 'GeForce GTX 1050 Ti', 
'Кодовое название графического процессора': 'GP107', 'Техпроцесс': '14 нм', 
'Частота графического процессора': '1290 МГц', 'Частота графического процессора (Boost)': '1392 МГц', 
'Число универсальных процессоров': '768', 'Поддержка SLI/CrossFire': 'нет', 'Поддержка DirectX': 'DirectX 12', 
'Поддержка OpenGL': 'OpenGL 4.5', 'Объем памяти': '4 Гб', 'Тип памяти': 'GDDR5', 'Шина памяти (разрядность)': '128 бит', 
'Частота видеопамяти': '7000 МГц', 'Количество занимаемых слотов': '2', 'Система охлаждения': 'активная', 
'Разъемы': 'DVI, HDMI, DisplayPort', 'Количество поддерживаемых мониторов': '3', 
'Максимальное разрешение': '4096x2160', 'Необходимость дополнительного питания': 'нет', 
'Рекомендуемая мощность блока питания': '300 Вт', 'TDP': '75 Вт', 'Тип поставки': 'OEM', 
'Размеры (ШхВхГ)': '166 x 112 x 38 мм', 'Вес': '0.6 кг', 'Гарантия': '36 мес.', 
'Сайт производителя': 'www.palit.com'}}]
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
11.04.2022, 17:20
Помогаю со студенческими работами здесь

Парсер на python
Мне нужен парсер, который бы доставал css стили с сайта, но чет все что нахожу - это парсинг html. Может это как то по другому называется...

Парсер на Python
Здравствуйте. Решил написать простенький парсер на Питоне, но столкнулся с проблемой: не могу вытащить цену с сайта ДНС. Названия и ссылки...

Парсер api.hh.ru на python
Парсю json и обработанные данные записываю в excel, но получаю ошибку "'NoneType' object is not subscriptable" когда пытаюсь...

Парсер Python Selenium
Товарищи, еще один вопрос... Помогите решить import time from bs4 import BeautifulSoup from selenium import webdriver ...

Парсер Python BeautifulSoup
Всем доброго времени суток. Помогите пожалуйста решить вопрос. Я новичок в Пайтоне При парсинге сайтов с доменом "ru" выдает...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
Фото: Daniel Greenwood
kumehtar 13.11.2025
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru