Форум программистов, компьютерный форум, киберфорум
Python для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 30.05.2024
Сообщений: 1

Код для парсинга сайта в эксель

30.05.2024, 05:47. Показов 329. Ответов 0
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Доброго времени суток!

Можете помочь, пожалуйста, с кодом. Хочу сделать парсер для вывода таблицы в эксель из сайта https://online.smartlombard.ru/(Логин и пароль не могу дать). К сожалению, в вопросе Python я совсем нулевой. Так, изучив все возможные сайты для данного вопроса, попробовал написать код, но столкнулся с трудностями. Также есть ли возможность настроить парсинг по датам и по категориям?

Сайт сохраненный в html: https://disk.yandex.ru/d/A92F1BcdJ5V0KQ

Собственно сам код
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
import requests
from bs4 import BeautifulSoup
 
import pandas as pd
 
 
headers = {
    'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.174 '
                  'YaBrowser/22.1.3.942 Yowser/2.5 Safari/537.36',
    'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,'
              'application/signed-exchange;v=b3;q=0.9 '
}
 
 
df = {}
 
datas = {
 'email':'login',
 'password':'password'
}
login = input('Enter email: ')
passwd = input('Password: ')
datas['email']  = login
datas['password'] = password
url = 'https://online.smartlombard.ru/login/'
s = requests.Session()
loging = s.post(url, data = datas)
 
 
def get_pd_table():
url = f'https://online.smartlombard.ru/#{%22mainpage_table%22:{%22filters%22:{%22account_id%22:%22all%22,%22type_operation%22:%22101%22,%22entity_filter%22:%22all%22,%22banking_details_id%22:%22all%22,%22date_start%22:%2229.05.2024%22,%22date_end%22:%2229.05.2024%22}}}?s={num}&table=0&sub=table'
req = requests.get(url=url, headers=headers)
soup = BeautifulSoup(req.text, 'lxml')
title_table = soup.find('h2', class_='generator-table-container').text.split("-")[2].strip().replace("/", "_")
print(f'Получаю данные из таблицы: "{title_table}"...')
        tables = pd.read_html(url)
        tables[1].drop('Unnamed: 0', axis=1, inplace=True)
        df[title_table] = tables[1]
 
        
def pd_save():
    writer = pd.ExcelWriter('./таблица.xlsx', engine='xlsxwriter')
    for df_name in df.keys():
        print(f'Записываем данные в лист: {df_name}')
        df[df_name].to_excel(writer, sheet_name=df_name, index=False)
    writer.save()
 
def main():
    get_pd_table()
    print(' ')
    pd_save()
    print('\n[+] Данные записаны!')
 
if __name__ == '__main__':
    main()
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
30.05.2024, 05:47
Ответы с готовыми решениями:

Исправить код для парсинга сайта
Здравствуйте! Извините, если я не в той ветке пишу. Не могу разобраться с библиотекой Beautiful Soup. Хочу спарсить сайт...

Дописать код для парсинга документов с сайта
День добрый и всех с праздником! Есть готовый код (сложный) на 1500 строк на PowerShell (одна из последних версий) на win10. Создатель...

Регулярка для парсинга прокси с сайта
Учусь писать регулярки, первое знакомство, решил спарсить с сайта прокси. Удивился результату 151.200.170.146:80 01:11:14 16:00 ...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
30.05.2024, 05:47
Помогаю со студенческими работами здесь

Регулярное выражение для парсинга сайта
доброй ночи, помогите пожалуйста написать регулярное выражение для парсинга сайта (например интернет магазин) по ключевому слову и если...

Программа для парсинга резюме с работного сайта
Нужна программа для парсинга резюме с сайта JOB.ru. Буду рад помощи! Описание тех. задания во вложении. И скажите- это вообще реально)))?

Инструмент для парсинга сайта (nodejs + reactjs)
Нужен совет. Начал недавно изучать js + reactjs. Делаю первый сайт в целях обучения. Использую: nodejs, react(material ui, DevExtreme...

Подскажите программу для полного парсинга сайта
подскажите желательно бесплатную программу, которая захватывала бы все страницы сайта и разбивала их по папкам и, конечно, с картинками

Создать скрипт для парсинга данных с сайта Discogs.com
Доброго времени суток, друзья! Помогите, пожалуйста, с реализацией скрипта. Имеется коллекция музыки в размере ~25000 альбомов. Список всех...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
Автозаполнение реквизита при выборе элемента справочника
Maks 27.03.2026
Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2. При выборе "Спецтехники" (Тип Справочник. Спецтехника), заполняется. . .
Сумматор с применением элементов трёх состояний.
Hrethgir 26.03.2026
Тут. https:/ / fips. ru/ EGD/ ab3c85c8-836d-4866-871b-c2f0c5d77fbc Первый документ красиво выглядит, но без схемы. Это конечно не даёт никаких плюсов автору, но тем не менее. . . всё может быть. . .
Автозаполнение реквизитов при создании документа
Maks 26.03.2026
Программный код из решения ниже размещается в модуле объекта документа, в процедуре "ПриСозданииНаСервере". Алгоритм проверки заполнения реализован для исключения перезаписи значения реквизита,. . .
Команды формы и диалоговое окно
Maks 26.03.2026
1. Команда формы "ЗаполнитьЗапчасти". Программный код из решения ниже на примере нетипового документа "ЗаявкаНаРемонтСпецтехники" разработанного в конфигурации КА2. В качестве источника данных. . .
Кому нужен AOT?
DevAlt 26.03.2026
Решил сделать простой ланчер Написал заготовку: dotnet new console --aot -o UrlHandler var items = args. Split(":"); var tag = items; var id = items; var executable = args;. . .
Отправка уведомления на почту при изменении наименования справочника
Maks 24.03.2026
Программная отправка письма электронной почты на примере изменения наименования типового справочника "Склады" в конфигурации БП3. Перед реализацией необходимо выполнить настройку системной учетной. . .
модель ЗдравоСохранения 5. Меньше увольнений- больше дохода!
anaschu 24.03.2026
Теперь система здравосохранения уменьшает количество увольнений. 9TO2GP2bpX4 a42b81fb172ffc12ca589c7898261ccb/ https:/ / rutube. ru/ video/ a42b81fb172ffc12ca589c7898261ccb/ Слева синяя линия -. . .
Midnight Chicago Blues
kumehtar 24.03.2026
Такой Midnight Chicago Blues, знаешь?. . Когда вечерние улицы становятся ночными, а ты не можешь уснуть. Ты идёшь в любимый старый бар, и бармен наливает тебе виски. Ты смотришь на пролетающие. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru