Форум программистов, компьютерный форум, киберфорум
Python: Web
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 07.01.2023
Сообщений: 11

Не могу понять как спарсить email адреса

07.01.2023, 20:00. Показов 629. Ответов 3

Студворк — интернет-сервис помощи студентам
Написал парсер по гайдам, всю информацию которая мне нужна он выводит корректно но проблема с email адресами.
Я не могу зацепиться за тег, была мысль(открыть ссылку которая прилогаеться к email адресу) Но как бы я не пытался нечего не получаеться. Пожалуйста помогите что я делаю не так.
вот ссылка на сайт:http://www.spisszkol.eu/szkola... -creative/
вот мой код:
Python
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
import requests
from bs4 import BeautifulSoup
from time import sleep
 
 
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"
                         " AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"}
 
 
def get_url():
    for count in range(0, 41, 20):
 
        url = f"http://www.spisszkol.eu/typ/?wojewodztwo=malopolskie&powiat=****ow&start={count}"
 
        responce = requests.get(url, headers=headers)
 
        soup = BeautifulSoup(responce.text, "lxml")
 
        data = soup.find_all("div", class_="doc_entry")
 
 
        for i in data:
            card_url = i.find("a").get("href")
            yield card_url
 
 
for list_card in get_url():
    responce = requests.get(list_card, headers=headers)
    sleep(2)
    soup = BeautifulSoup(responce.text, "lxml")
    data = soup.find("div", class_="page_body")
    email = data.find_all("div", class_="c2")
 
    # name = data.find("p", class_="map_title red").text
    # adres = data.find("p", itemprop="address").text
    # telefon = data.find("span", itemprop="telephone").text
    # print(name +"\n", adres +"\n", telefon +"\n")
 
    for email_adres in email:
        email_reques = email_adres.find(class_="my_modal_open")
        email_serch = email_reques.find("title")
        print(email_serch)
0
Лучшие ответы (1)
IT_Exp
Эксперт
34794 / 4073 / 2104
Регистрация: 17.06.2006
Сообщений: 32,602
Блог
07.01.2023, 20:00
Ответы с готовыми решениями:

Парсинг Сайта(не могу понять как правильно спарсить сгенерированную php таблицу )
Добрый вечер Форумчане! Есть много сгенерированных html таблиц Вот один из них Код: <TR CLASS=R1> <TD...

Как проверить существование Email адреса на своём сайте?
При регистрации на сайте пользователи указывают свой Email. Но сейчас можно ввести и не существующий. Как сделать проверку во время...

Как создать данную задачу? Не могу понять задание. Как понять все операции контролировать через порт С?
Считать данные с порта D. Установить сначала во втором разряде числа «1», а потом в четвертом - «1» (с помощью команды BSF). Все операции...

3
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
07.01.2023, 20:35
Лучший ответ Сообщение было отмечено Bogdan_Kurbanov как решение

Решение

Bogdan_Kurbanov, как пример
Python
1
2
3
4
5
6
7
8
9
import requests
from lxml import html
 
url = 'http://www.spisszkol.eu/szkola/322648-centrum-edukacji-creative/'
 
response = requests.get(url)
parsed = html.fromstring(response.text)
emails = [e.attrib['title'] for e in parsed.xpath('//a[contains(@href, "email") and @title]')]
print(emails)
результат
Code
1
['****ow@szkolacreative.pl', 'k.tychmanska@szkolacreative.pl']
1
0 / 0 / 0
Регистрация: 07.01.2023
Сообщений: 11
08.01.2023, 11:17  [ТС]
Большое спасибо. Но на сайте около 1000 школ, я немного не понимаю как мне этот код загнать в цикл

Добавлено через 41 минуту
А нет понял, спасибо вам большое, вы очень помогли. Нужно было просто посидеть и подумать немного
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
08.01.2023, 13:10
Цитата Сообщение от Bogdan_Kurbanov Посмотреть сообщение
просто посидеть и подумать немного
это вообще секрет успеха
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
BasicMan
Эксперт
29316 / 5623 / 2384
Регистрация: 17.02.2009
Сообщений: 30,364
Блог
08.01.2023, 13:10
Помогаю со студенческими работами здесь

Как понять поставленную задачу. Не могу понять этот полиморфизм?
A software academy teaches two types of courses: local courses that are held in some of the academy’s local labs and offsite courses held...

Стек на основе массива структур - эт как понять читаю литературу и не могу понять!
Стек статически (на основе массива структур). Пример структура "Товар" которая включает в себя: № по каталогу(ключ), Название, цена, срок...

Проверка email адреса
Задание: Написать программу, которая будет проверять email адрес на валидность. Под правильным email адресом подразумевается строка...

Отправка email на адреса из БД
НАРОД проблема, как отпровлять письма я знаю, а вот как сделать так чтобы емайлы брались из базы, и брались например по 200 шт за раз?...

Валидация адреса email
Подскажите как сделать Проверку соответствия EMail в TextBox Чтобы был правельный формат MessageBox.Show("Неверный формат...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
4
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru