Форум программистов, компьютерный форум, киберфорум
Python: Решение задач
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 03.09.2022
Сообщений: 1

Парсинг сайта Дикси

03.09.2022, 14:37. Показов 685. Ответов 0

Студворк — интернет-сервис помощи студентам
Если возможно подскажите, как решить данную проблему. Я создаю парсер "Дикси" на Python3 и, когда записываю наименование товаров и их вес в csv файл, слова разделяются на буквы. Что делать? Спасибо! Прикрепляю код.

Слова в excel разделяются вот так:
С,ы,р, ,Б,е,л,е,б,е,е,в,с,к,и,й, ,4,5,%



Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
import requests
from bs4 import BeautifulSoup
import lxml
import urllib3
import csv
urllib3.disable_warnings()
from fake_useragent import UserAgent
def data(city_code='21'):
    ua = UserAgent()
    headers = {
        'Accept' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36',
        'User-Agent' : ua.random
    }
    cookies = {
        'BITRIX_SM_PROJECT_REGION_ID': f'{city_code}'
    }
    # response = requests.get(url='https://dixy.ru/catalog/', headers=headers, cookies=cookies, verify=False)
    # with open('index.html', 'w', encoding='utf-8-sig') as file:
    #     file.write(response.text)
    with open('index.html', encoding='utf-8-sig') as file:
        src = file.read()
    soup = BeautifulSoup(src, 'lxml')
    all_catefories = soup.find_all(class_="dixyCatalogItem")
    for item in all_catefories:
        title_and_weight = item.find('img').get('alt').split(',')
        title_and_weight[1] = title_and_weight[1].replace('\xa0', '').strip()
        title = title_and_weight[0]
        weight = title_and_weight[1]
        with open('q.csv', 'w', encoding='utf-8-sig') as file:
            writer= csv.writer(file)
            writer.writerow(title)
            break
 
def main():
    data(city_code='21')
 
if __name__ == '__main__':
    main()
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
03.09.2022, 14:37
Ответы с готовыми решениями:

Создание карты сайта и парсинг определенного раздела сайта
Здравствуйте! Мне необходимо пропарсить раздел сайта, предварительно создав карту сайта и извлечь некоторую информацию. Т.е. мне надо...

Парсинг данных с сайта или страницы сайта
Здравствуйте, добрые люди! Есть задача спарсить данные с страницы соц сети. Или просто со страницы с помощью js. На пхп не предлагать....

Парсинг сайта
Здравствуйте. Подскажите пожалуйста. Есть необходимость получать данные со страниц сайта, нажимать там на кнопки, вводить данные. Только...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
03.09.2022, 14:37
Помогаю со студенческими работами здесь

Парсинг сайта
Доброго здравия. Есть некий сайт, на котором производится парсинг. На этом сайте есть ссылка такого типа <a href="#driver"...

Парсинг сайта
Доброго времени суток. Не получается спрасить текст с сайта. Открываем ссылку: https://lifehacker.ru/marinady-dlya-shashlyka/ ...

Парсинг сайта
Добрый день, возник вопрос, нужно спарсить с сайта цены и название товаров, при парсинге берётся только первый div, даже через перебор не...

Парсинг сайта
Здраствуйте, можете подсказать как разбить фрагмент сайта <div class=vrezka><a href="/films/s/spykids4/">Дети шпионов 4: Время во...

Парсинг сайта
Всем привет! Есть необходимость получить координаты остановки отсюда http://wikiroutes.info/stops/8365 Не понимаю как можно вытащить...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
SDL3 для Web (WebAssembly): Основы отладки веб-приложений на SDL3 по USB и Wi-Fi, запущенных в браузере мобильных устройств
8Observer8 07.02.2026
Содержание блога Браузер Chrome имеет средства для отладки мобильных веб-приложений по USB. В этой пошаговой инструкции ограничимся работой с консолью. Вывод в консоль - это часть процесса. . .
SDL3 для Web (WebAssembly): Обработчик клика мыши в браузере ПК и касания экрана в браузере на мобильном устройстве
8Observer8 02.02.2026
Содержание блога Для начала пошагово создадим рабочий пример для подготовки к экспериментам в браузере ПК и в браузере мобильного устройства. Потом напишем обработчик клика мыши и обработчик. . .
Философия технологии
iceja 01.02.2026
На мой взгляд у человека в технических проектах остается роль генерального директора. Все остальное нейронки делают уже лучше человека. Они не могут нести предпринимательские риски, не могут. . .
SDL3 для Web (WebAssembly): Вывод текста со шрифтом TTF с помощью SDL3_ttf
8Observer8 01.02.2026
Содержание блога В этой пошаговой инструкции создадим с нуля веб-приложение, которое выводит текст в окне браузера. Запустим на Android на локальном сервере. Загрузим Release на бесплатный. . .
SDL3 для Web (WebAssembly): Сборка C/C++ проекта из консоли
8Observer8 30.01.2026
Содержание блога Если вы откроете примеры для начинающих на официальном репозитории SDL3 в папке: examples, то вы увидите, что все примеры используют следующие четыре обязательные функции, а. . .
SDL3 для Web (WebAssembly): Установка Emscripten SDK (emsdk) и CMake для сборки C и C++ приложений в Wasm
8Observer8 30.01.2026
Содержание блога Для того чтобы скачать Emscripten SDK (emsdk) необходимо сначало скачать и уставить Git: Install for Windows. Следуйте стандартной процедуре установки Git через установщик. . . .
SDL3 для Android: Подключение Box2D v3, физика и отрисовка коллайдеров
8Observer8 29.01.2026
Содержание блога Box2D - это библиотека для 2D физики для анимаций и игр. С её помощью можно определять были ли коллизии между конкретными объектами. Версия v3 была полностью переписана на Си, в. . .
Инструменты COM: Сохранение данный из VARIANT в файл и загрузка из файла в VARIANT
bedvit 28.01.2026
Сохранение базовых типов COM и массивов (одномерных или двухмерных) любой вложенности (деревья) в файл, с возможностью выбора алгоритмов сжатия и шифрования. Часть библиотеки BedvitCOM Использованы. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru