Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
0 / 0 / 0
Регистрация: 06.10.2024
Сообщений: 1

Великие, нижайше прошу разобраться в задаче парсинга динамического сайта и дать совет

06.10.2024, 10:35. Показов 849. Ответов 0

Студворк — интернет-сервис помощи студентам
Есть парсер сайта, сам парсинг состоит из трех задач. Парсинг одной страницы, парсинг другой страницы и отправка в двух ботов. Сам парсинг настроен и работает исправно. А вот подружить словарики не получается, помогите это сделать. @daffboh
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
import requests
import json
import time
import os
from datetime import datetime, timedelta, timezone
from telebot import TeleBot
import logging
import urllib.parse
import telebot.apihelper
 
# Define the URLs
LINE_URL = "https://1xbet.com/LineFeed/Get1x2_VZip?count=100&lng=en&mode=1"
LIVE_URL = "https://1xbet.com/LiveFeed/Get1x2_VZip?count=100&lng=en&mode=1"
 
# Set up proxies
PROXIES = {
    "http": "http://huws1i7s:zVCnuDv8@166.1.148.125:64198", #doesn't work now
    "https": "http://huws1i7s:zVCnuDv8@166.1.148.125:64198" #doesn't work now
 
}
telebot.apihelper.proxy = None
 
# Set up logging
logging.basicConfig(filename='1xbet/src/bot.log', level=logging.DEBUG, format='%(asctime)s %(message)s')
 
# Define paths for output files
LINE_ACCEPTED_PATH = "1xbet/src/line_accepted.json"
LIVE_ACCEPTED_PATH = "1xbet/src/live_accepted.json"
 
# Bot token and chat IDs
BOT_1_TOKEN = '7799923puDkYyeo81L6QtZ8Iug'
BOT_2_TOKEN = '77744720Tz2X_stamy7fgmXX7s'   
CHAT_ID = "360873117"
 
bot_1 = TeleBot(BOT_1_TOKEN)
bot_2 = TeleBot(BOT_2_TOKEN)
 
# Helper function to write JSON data to a file
def write_json_file(path, data):
    with open(path, 'w') as f:
        json.dump(data, f, indent=4)
 
# Helper function to read JSON data from a file
# Helper function to read JSON data from a file
def read_json_file(path):
    if os.path.exists(path):
        with open(path, 'r') as f:
            return json.load(f)
    return []
 
def normalize_name(name):
    return name.strip().lower().replace(' ', '-')
 
def construct_line_event_link(event):
    try:
        base_url = "https://1xbet.com/en/line"
        sport_name = normalize_name(event.get("SN", ""))
        tournament_id = event.get("LI")
        tournament_name = normalize_name(event.get("L", ""))
        event_id = event.get("I")
        team_1 = normalize_name(event.get("O1", ""))
        team_2 = normalize_name(event.get("O2", ""))
 
        # Create slugs for sport, tournament, and teams
        sport_slug = urllib.parse.quote_plus(sport_name.replace(' ', '-'))
        tournament_slug = urllib.parse.quote_plus(f"{tournament_id}-{tournament_name.replace(' ', '-')}")
        teams_slug = urllib.parse.quote_plus(f"{event_id}-{team_1.replace(' ', '-')}-{team_2.replace(' ', '-')}")
 
        # Construct the event URL
        event_url = f"{base_url}/{sport_slug}/{tournament_slug}/{teams_slug}"
        return event_url
    except Exception as e:
        logging.warning(f"Could not construct line event link for event {event.get('I')}: {e}")
        return "https://1xbet.com/en/line"
 
# Function for parsing line data
def parse_line():
    try:
        # Load existing accepted events
        existing_accepted = read_json_file(LINE_ACCEPTED_PATH)
        live_accepted = read_json_file(LIVE_ACCEPTED_PATH)
        response = requests.get(LINE_URL, proxies=PROXIES)
        response.raise_for_status()
        data = response.json().get('Value', [])
        accepted = []
 
        # Move matches that have started to live_accepted
        for event in existing_accepted:
            start_time = datetime.fromtimestamp(event.get('start_time', 0), tz=timezone.utc)
            if start_time <= datetime.now(timezone.utc):
                live_accepted.append(event)
            else:
                accepted.append(event)
 
        # Add new matches
        for event in data:
            sport = event['SN']
            tournament = event['L']
            team1 = event['O1']
            team2 = event['O2']
            coefficients = event['E']
            start_time = datetime.fromtimestamp(event['S'], tz=timezone.utc)
 
            # Filtering triggers
            triggers = [coef for coef in coefficients if coef['T'] in [1, 3, 4, 6] and 1.001 <= coef['C'] <= 1.2]
 
            if triggers:
                accepted_event = {
                    "sport": sport,
                    "tournament": tournament,
                    "team1": team1,
                    "team2": team2,
                    "coefficients": [{"T": coef['T'], "C": coef['C']} for coef in coefficients if coef['T'] in [1, 3, 4, 6]],
                    "triggers": triggers,
                    "link": construct_line_event_link(event),
                    "start_time": event['S']
                }
                accepted.append(accepted_event)
 
        # Write updated list to file
        write_json_file(LINE_ACCEPTED_PATH, accepted)
        write_json_file(LIVE_ACCEPTED_PATH, live_accepted)
        logging.info("Parsed line data successfully")
    except Exception as e:
        logging.error(f"Failed to parse line data: {str(e)}")
        bot_1.send_message(chat_id=CHAT_ID, text=f"Error in line parsing: {str(e)}")
 
# Function for parsing live data
def parse_live():
    try:
        response = requests.get(LIVE_URL, proxies=PROXIES)
        response.raise_for_status()
        data = response.json().get('Value', [])
        live_accepted = read_json_file(LIVE_ACCEPTED_PATH)
        updated_live_accepted = []
 
        for event in data:
            sport = event['SN']
            tournament = event['L']
            team1 = event['O1']
            team2 = event['O2']
            coefficients = event['E']
 
            # Check if event exists in live_accepted
            for live_event in live_accepted:
                if live_event['tournament'] == tournament and live_event['team1'] == team1 and live_event['team2'] == team2:
                    accepted_event = {
                        "sport": sport,
                        "tournament": tournament,
                        "team1": team1,
                        "team2": team2,
                        "coefficients": [{"T": coef['T'], "C": coef['C']} for coef in coefficients if coef['T'] in [1, 3, 4, 6]],
                        "triggers": live_event['triggers'],
                        "link": live_event['link'],
                        "start_time": live_event['start_time']
                    }
                    updated_live_accepted.append(accepted_event)
 
        write_json_file(LIVE_ACCEPTED_PATH, updated_live_accepted)
        logging.info("Parsed live data successfully")
    except Exception as e:
        logging.error(f"Failed to parse live data: {str(e)}")
        bot_1.send_message(chat_id=CHAT_ID, text=f"Error in live parsing: {str(e)}")
 
 
# Function for monitoring triggers and sending notifications
def monitor_triggers():
    try:
        live_accepted = read_json_file(LIVE_ACCEPTED_PATH)
        notified_triggers = set()
        for event in live_accepted:
            for trigger in event['triggers']:
                coefficient = next((coef for coef in event['coefficients'] if coef['T'] == trigger['T']), None)
                if coefficient:
                    trigger_key = (event['team1'], event['team2'], trigger['T'], '1.42')
                    if coefficient['C'] > 1.42 and trigger_key not in notified_triggers:
                        def send_message_with_retries(bot, chat_id, message, retries=3, delay=5):
                            for attempt in range(retries):
                                try:
                                    bot.send_message(chat_id=chat_id, text=message)
                                    return
                                except requests.exceptions.ProxyError as e:
                                    if attempt < retries - 1:
                                        logging.warning(f"Proxy error encountered. Retrying in {delay} seconds... (Attempt {attempt + 1}/{retries})")
                                        time.sleep(delay)
                                    else:
                                        logging.error(f"Failed to send message after {retries} attempts: {e}")
                                        bot_1.send_message(chat_id=CHAT_ID, text=
                                                        f"Trigger crossed 1.42:\n"
                                                        f"{event['tournament']}. {event['sport']}.
"
                                                        f"{event['team1']} - {event['team2']}\n"
                                                        f"Trigger: {trigger['T']}, Coefficient: {coefficient['C']}\n"
                                                        f"Link: {event['link']}"
                                                        )
                                        notified_triggers.add(trigger_key)
                                    trigger_key = (event['team1'], event['team2'], trigger['T'], '2')
                                    if coefficient['C'] > 2 and trigger_key not in notified_triggers:
                                        bot_2.send_message(chat_id=CHAT_ID, text=
                                                        f"Trigger crossed 2:"
                                                        f"{event['tournament']}. {event['sport']}."
                                                        f"{event['team1']} - {event['team2']}"
                                                        f"Trigger: {trigger['T']}, Coefficient: {coefficient['C']}"
                                                        f"Link: {event['link']}"
                                                        )
                                        notified_triggers.add(trigger_key)
 
        logging.info("Monitoring completed")
    except Exception as e:
        logging.error(f"Failed to monitor triggers: {str(e)}")
        bot_1.send_message(chat_id=CHAT_ID, text=f"Error in monitoring: {str(e)}")
 
if __name__ == "__main__":
    while True:
        parse_line()
        time.sleep(5)
        parse_live()
        time.sleep(5)
        monitor_triggers()
0
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
06.10.2024, 10:35
Ответы с готовыми решениями:

Прошу дать совет по созданию БД
Требуется сделать БД балансов клиентов. Сейчас ее заполняем в Excel. Зеленым внесение, красным списание. По датам. Подскажите,...

Прошу оценить сборку и дать совет
Друзья! Оцените, пожалуйста, сборку. Буду рад рекомендациям как её улучшить. 1. Intel Core i5-4460 2. Asus B85M-G 3. Kingston...

Как начинающий программист прошу дать совет!
Меня зовут Ден, в данный момент я обучаюсь языку пайтон в Яндекс Лицее. Здесь очень хороший подход к начинающим программистам. Но у меня...

0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
06.10.2024, 10:35
Помогаю со студенческими работами здесь

Прошу дать мне совет (несколько валют в программе)
Есть задание, написать программу типа &quot;склад&quot;. Я ее уже написал. нужно дать пользователю выбрать основную валюту программы (например -...

Прошу совет по написанию математической модели к задаче
что применить?Какую ЗЛП?если, сущность задачи сотоит в формировании оптимального графика обслуживания клиентов, с учётом адреса проживания...

Синхронизация Online игры с GoogleDoc Прошу дать совет в реализации
Доброго времени суток.У меня есть идея,но нету решения.Скажу сразу что в программирование Я полный 0))Поэтому &quot;сильные&quot; термины...

Нижайше прошу оценить комп
- Процессор: Intel Core i5-3550 - Материнская плата: Asrock H77M - Оперативная память: DDR3-1333 4Gb x 2 - Видеокарта: Palit GeForce...

Прошу дать совет, как реанимировать ноутбук! Первый раз с таким лично сталкиваюсь!
Добрый день!!! Во время игры в NBA 2K14 зависла картинка, через пару минут сам по себе ноут отвис, в течение следующих минут десяти...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
1
Ответ Создать тему
Новые блоги и статьи
SDL3 для Desktop (MinGW): Создаём пустое окно с нуля для 2D-графики на SDL3, Си и C++
8Observer8 10.03.2026
Содержание блога Финальные проекты на Си и на C++: hello-sdl3-c. zip hello-sdl3-cpp. zip Результат:
Установка CMake и MinGW 13.1 для сборки С и C++ приложений из консоли и из Qt Creator в EXE
8Observer8 10.03.2026
Содержание блога MinGW - это коллекция инструментов для сборки приложений в EXE. CMake - это система сборки приложений. Здесь описаны базовые шаги для старта программирования с помощью CMake и. . .
Как дизайн сайта влияет на конверсию: 7 решений, которые реально повышают заявки
Neotwalker 08.03.2026
Многие до сих пор воспринимают дизайн сайта как “красивую оболочку”. На практике всё иначе: дизайн напрямую влияет на то, оставит человек заявку или уйдёт через несколько секунд. Даже если у вас. . .
Модульная разработка через nuget packages
DevAlt 07.03.2026
Сложившийся в . Net-среде способ разработки чаще всего предполагает монорепозиторий в котором находятся все исходники. При создании нового решения, мы просто добавляем нужные проекты и имеем. . .
Модульный подход на примере F#
DevAlt 06.03.2026
В блоге дяди Боба наткнулся на такое определение: В этой книге («Подход, основанный на вариантах использования») Ивар утверждает, что архитектура программного обеспечения — это структуры,. . .
Управление камерой с помощью скрипта OrbitControls.js на Three.js: Вращение, зум и панорамирование
8Observer8 05.03.2026
Содержание блога Финальная демка в браузере работает на Desktop и мобильных браузерах. Итоговый код: orbit-controls-threejs-js. zip. Сканируйте QR-код на мобильном. Вращайте камеру одним пальцем,. . .
SDL3 для Web (WebAssembly): Синхронизация спрайтов SDL3 и тел Box2D
8Observer8 04.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-sync-physics-sprites-sdl3-c. zip На первой гифке отладочные линии отключены, а на второй включены:. . .
SDL3 для Web (WebAssembly): Идентификация объектов на Box2D v3 - использование userData и событий коллизий
8Observer8 02.03.2026
Содержание блога Финальная демка в браузере. Итоговый код: finish-collision-events-sdl3-c. zip Сканируйте QR-код на мобильном и вы увидите, что появится джойстик для управления главным героем. . . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru